相关系数的定义和性质

二、相关系数的定义和性质

由协方差的定义可知,Cov(X,Y)反映了X和Y相互间的关联程度,但它还受X与Y自身取值的影响.例如,当X与Y同时增大k倍时,kX与kY之间的相互联系和X与Y之间的相互联系应该是一样的,然而反映这种联系的协方差却增大了k2倍,即有

定义5 设(X,Y)是一个二维随机变量,且D(X)>0,D(Y)>0,则称

为X与Y的相关系数(或标准协方差).

相关系数的性质:

性质1 设ρXY为随机变量X和Y的相关系数,则|ρXY|≤1.

由于方差非负,故2±2ρXY≥0,从而有|ρXY|≤1.

性质2 |ρXY|=1的充要条件是存在常数a≠0,b使

证 充分性:若Y=aX+b,则

即Y与X具有线性关系时|ρXY|=1.

必要性:当ρXY=1时,令Z=Y*-X*,则

由方差的性质4可知,存在常数C=E(Z)=0,则

这个性质告诉我们:

(1)相关系数ρXY的大小是X与Y之间线性关系的一种度量.

(2)如果ρXY=0,我们称X,Y不相关;不相关表示X,Y之间不存在线性关系,但不排除有其他函数关系.

(3)当|ρXY|=1时,则称X与Y完全线性相关.

(4)如果|ρXY|<1,我们称X与Y存在“一定程度”的线性关系.|ρXY|越接近于1,则线性相关程度越强;|ρXY|越接近于0,则线性相关程度越弱.

性质3 如果随机变量X与Y相互独立,则X与Y不相关;反之则不然.

证 当X与Y相互独立时,由协方差的性质5及(4.15)可得ρXY=0,即X与Y不相关;反之则不然,见下面的反例.

例19 设X ~U(-1,1),令Y=X2,讨论X与Y的相关性及其相互独立性.

即X与Y不相关,但Y=X2,所以X与Y不独立.

求Cov(X,Y)和ρXY,并说明在二维正态分布的情况下,不相关与独立是等价的.

于是

当ρXY=0时,即ρ=0,这时X与Y不相关,则

所以X与Y独立;而由相关系数的性质3,如果随机变量X与Y相互独立,则X与Y不相关,即ρXY=ρ=0;所以,在二维正态分布的情况下,不相关与独立是等价的.

例21 设二维随机变量X与Y的联合概率密度函数为

求X,Y的相关系数ρXY.