11.2.1  CCA的数学描述

11.2.1 CCA的数学描述

设有两随机变量组X=[X1,X2,…,Xp]和Y=[Y1,Y2,…,Yq],不妨设pq

对于X、Y,设第一组变量的均值和协方差矩阵为E(X)=μ1,cov(X)=Σ11

第二组变量的均值和协方差矩阵为E(Y)=μ2,cov(Y)=Σ22。第一组与第二组变量的协方差矩阵为cov(X,Y)=Σ12=Σ21。于是,对于矩阵978-7-111-59317-1-Chapter11-1.jpg有均值向量

978-7-111-59317-1-Chapter11-2.jpg

则协方差矩阵为

978-7-111-59317-1-Chapter11-3.jpg

要研究两组变量X1,X2,…,Xp和Y1,Y2,…,Yq之间的相关关系,首先分别作两组变量的线性组合,即

U=a1X1+a2X2+…+apXp=a′X

V=b1Y1+b2Y2+…+bqYq=b′Y(11-2)

式中,a=(a1,a2,…,ap,b=(b1,b2,…,bq为任意非零常系数向量,则可得

var(U)=a′cov(X)a=a′Σ11a

var(V)=b′cov(Y)b=b′Σ22b

cov(U,V)=a′cov(X,Y)b=a′Σ12b式中,U与V称为典型相关变量,它们之间的相关系数ρ称为典型相关系数,可以由下式求出ρ

978-7-111-59317-1-Chapter11-4.jpg

式中,Σ11为变量X的协方差矩阵;Σ22为变量Y的协方差矩阵;Σ12为变量X与Y的互协方差矩阵。