7.2.1 简单线性相关问题引入

7.2.1 简单线性相关问题引入

例7.1 表7.1所示为7个省区的人均GDP(单位为元)和建筑合同的价值(单位为亿元),试计算两个变量之间的相关系数,并在0.05的显著性水平下对显著性进行检验(数据见文件“CH7 例7.1-例7.4建筑合同”)。

表7.1 数据表

通常,在相关分析中,我们先考虑数据类型,以便把相关问题归结为线性相关、等级相关或偏相关。

线性相关模块的SPSS操作示例如下。

①在录入数据后(见CH7例7.1-例7.4建筑合同.sav),单击【图形】→【旧对话框】→【散点/点状】,系统弹出散点图类型的选择对话框,我们选择“简单分布”,单击【定义】按钮。

②系统弹出简单散点图坐标定义对话框,将变量“人均GDP”放入选择框“X 轴”中,“建筑合同的价值”放入选择框“Y 轴”中,如图7.2所示。

图7.2 散点图坐标定义对话框

③单击【确定】按钮,生成两变量的散点图,如图7.3所示。从图7.3可以清楚看出,变量“人均GDP”和“建筑合同的价值”之间存在近似的正相关关系。

图7.3 两变量样本的散点图

④单击【分析】→【相关】→【双变量】,进入“双变量相关性”对话框。

⑤在“双变量相关性”对话框(如图7.4所示)中,在左框选择要做相关分析的变量,本例选中左框的变量“人均GDP”和“建筑合同的价值”放入右边的“变量”框中。

⑥在“相关系数”区块中,选择一种相关系数。在该区块中,列出了3种相关系数供选择:a.Pearson相关系数(系统的默认值),本例选择此项,因为做相关分析的两列数据均为刻度级的数据;b.Kandall’s tau-b相关系数,它是一种依据配对样本之差的正负号的个数,计算出来的相关系数,本书略;c.Spearman等级相关系数。

图7.4 双变量相关性分析模块对话框

⑦在双变量相关性分析模块对话框的第二组选项区块,需要选择单尾检验还是双尾检验,系统默认值是双尾检验。本例可以接受系统的默认值,也可以选择单尾检验,因为从图7.3中,可以确定两个变量是正相关关系。

⑧单击【确定】按钮,系统输出结果,如表7.2所示。

表7.2 相关系数及显著性检验

结果说明:从表7.2中可见人均GDP 和建筑合同的价值之间的Pearson相关系数为0.694,显著性概率p=0.084>0.05,说明两个随机变量的相关系数是没有显著异于0的。

在图7.4中,还有一个【选项】按钮,它要求你选择输出额外的统计值(如均值、标准差等)及选择缺失值的处理方式。对于缺失值的处理方式,一般接受系统的默认值。