7.6.1 问题引入

7.6.1 问题引入

假设一个数据集中有2个变量(因素)A1、A2,其若A1是二值名义级变量,A2是刻度级变量,那么如何分析A1和A2之间的相关关系?或者A1和A2都是二值名义级变量,又如何分析A1和A2之间的相关关系?

例7.7 打开数据文件“CH7 例7.7卡路里”,文件中是不同汉堡所含卡路里和汉堡是否有奶酪(二值名义级数据)两个变量的数据,如表7.8所示,请对两个变量做显著性检验。

表7.8 例7.7数据表

注:表中的0代表无奶酪,1代表有奶酪。

为了有一个直观的感觉,我们先做一个横坐标为“有无奶酪”,纵坐标为“卡路里”的散点图。

①在数据视图窗口的菜单中,单击【图形】→【旧对话框】→【散点图】→【简单分布】。

②把变量“有无奶酪”拖入横坐标的方框中,把变量“卡路里”拖入纵坐标的方框中。

③单击【确定】按钮,就得到图7.13了。从图7.13不难看出,无奶酪的汉堡的卡路里数值多在较低的位置,而有奶酪的汉堡的卡路里数值相对高一些。看来,两个变量有“正”相关的关系。接下来,按照如下步骤,求点双列相关系数(其实就是求普通Pearson 相关系数)。

图7.13 两变量样本的散点图

④单击【分析】→【相关】→【双变量】,进入“双变量相关性”分析模块。

⑤在双变量相关性分析模块对话框中,选中左框的变量“有无奶酪”和“卡路里”放入右边的“变量”框中。

⑥在该对话框的“相关系数”区块中,接受系统的默认值(Pearson)。

⑦在该对话框的“显著性检验”区块中,接受系统的默认值(双尾检验)。

⑧在该对话框中,勾选复选框“标记显著性相关”。

⑨单击【确定】按钮,系统输出结果,如表7.9所示。

表7.9 点双列相关系数

在表7.9中,Pearson相关系数(表中为Pearson相关性)是0.506,就是我们所求的点双列相关系数,后面会给出其定义。显著性概率p=0.384>0.05,说明两个变量不存在显著性的关系。