7.1.2 相关系数的检验

7.1.2 相关系数的检验

相关系数的检验目的是检验总体两变量间的线性相关性是否显著,对于一个二元总体,提出假设

H 0:两变量无关(ρ=0);H 1:两变量相关(ρ≠0)

如果样本容量n≤30,那么该检验属于小样本相关系数为0的检验,即统计量为自由度为n-2的t分布,对应的t统计量为

例7.3 小样本相关系数为0的检验

某学校希望知道物理成绩与数学成绩是否存在相关性,因此从全校学生中随机抽取8个班级,统计后的数学与物理平均成绩如表7-4所示,试在0.05的显著性水平下判断数学成绩与物理成绩间是否存在相关性。

表7-4 各班数学与物理平均成绩(单位:分)

【相关系数为0的小样本检验步骤】

首先提出假设

H 0:两变量无关(ρ=0);H 1:两变量相关(ρ≠0)

因为各有8个数据,所以例7.3属于小样本相关系数为0的检验,统计量为自由度为n-2的t分布,对应的t统计量为

(1)首先录入数据,并录入n=8,α=0.05,如图7-7所示。

(2)计算样本相关系数,在单元格B14中输入“=CORREL(B2:B9,C2:C9)”,如图7-8所示。

(3)计算统计量t,在单元格B15中输入“=B14*SQRT(B11-2)/(1-B14 2)”,如图7-9所示。

图7-7 录入数据

图7-8 计算样本相关系数

图7-9 计算统计量的值

(4)计算临界值tα/2,在单元格B16中输入“=T.INV.2T(B12,B11-2)”,如图7-10所示。

图7-10 计算临界值

【结论】

因为统计量t的值4.992大于t的临界值2.447,所以t值落在了拒绝域,因此接受备择假设,数学成绩与物理成绩相关。

在结论单元格中输入“=IF(ABS(B15)<B16,"数学成绩与物理成绩无关","数学成绩与物理成绩相关")”。

上面讨论的是小样本的情况,如果样本容量n>30,那么该检验属于大样本相关系数为0的检验,应采用标准正态分布进行检验,对应的z统计量为

例7.4 大样本相关系数为0的检验

某公司跟踪其商品在城市和农村的销售情况,统计的数据如下。

城市:114,116,104,100,97,118,83,115,94,108,128,93,97,107,108,107,98,83,105,93,111,107,88,98,76,115,118,112,116,121,97,126,98,122,97,120

农村:131,102,87,129,143,117,107,96,116,140,120,122,113,117,137,123,131,119,113,132,128,117,110,110,129,125,96,95,126,123,102,110,117,135,89,99

试在0.05的显著性水平下判断两地区的销量是否显著相关。

【相关系数为0的大样本检验步骤】

首先提出假设

H 0:两变量无关(ρ=0);H 1:两变量相关(ρ≠0)

因为各有36个数据,所以例7.4属于大样本相关系数为0的检验,统计量为

(1)首先录入例7.4数据,并录入n=36,α=0.05,如图7-11所示。

(2)计算样本相关系数,在单元格B42中输入“=CORREL(A2:A37,B2:B37)”,如图7-12所示。

(3)计算统计量z,在单元格B43中输入“=B42*SQRT(B39-1)”,如图7-13所示。

(4)计算临界值zα/2,在单元格B44中输入=NORM.S.INV(B40/2),如图7-14所示。

图7-11 按列录入数据

图7-12 计算样本相关系数

图7-13 计算统计量z的值

图7-14 计算z的临界值

【结论】

在结论单元格中输入“=IF(ABS(B43)<ABS(B46),"城市与农村的销售量无关","城市与农村的销售量相关")”。因为统计量z的绝对值0.393 3小于z的临界值的绝对值1.960,所以z值没有落在拒绝域,即无法拒绝原假设,因此城市与农村的销售量无关。