7.1 相关分析

7.1 相关分析

相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。相关关系是一种非确定性的关系,例如,以x和y分别记一个人的身高和体重,或分别记每公顷施肥量和每公顷小麦产量,则显然这些x与y存在某种关系,但是这种关系又没有确切到可由其中的一个去精确地决定另一个的程度,这就是相关关系。相关分析一般分为线性相关分析、偏相关分析和距离相关分析。线性相关主要研究两变量间的线性相关关系,是最为简单的相关关系,也最能体现相关的思想。本书讨论的是Excel线性相关分析。

线性相关分析就是研究两个变量间线性关系的程度。著名统计学家卡尔·皮尔逊设计了统计指标——相关系数(Correlation Coefficient)。相关系数是用以反映变量之间相关关系密切程度的统计指标。一般总体相关系数记为ρ,样本相关系数记为r:

其中r表示相关系数,x和y表示相关变量,n表示变量样本容量。

表7-1所示为相关系数r的取值范围与相关关系。

表7-1 相关系数r的取值范围与相关关系