第十章典型相关分析 §10.1 引言 §10.2 总体典型相关 §10.3 样本典型相关 §10.4 典型相关系数的显著性检验.

Slides:

Advertisements

Similar presentations

一、一阶线性微分方程及其解法二、一阶线性微分方程的简单应用三、小结及作业 §6.2 一阶线性微分方程.

Advertisements

第五节函数的微分一、微分的定义二、微分的几何意义三、基本初等函数的微分公式与微分运算法则四、微分形式不变性五、微分在近似计算中的应用六、小结.

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.

第八章第四节机动目录上页下页返回结束一个方程所确定的隐函数及其导数隐函数的微分法.

一、会求多元复合函数一阶偏导数多元复合函数的求导公式学习要求：二、了解全微分形式的不变性.

5.4 微分一、微分概念二、微分的运算法则与公式三、微分在近似计算上的应用. 引例一块正方形金属片受热后其边长 x 由 x 0 变到 x 0  x  考查此薄片的面积 A 的改变情况  因为 A  x 2  所以金属片面积的改变量为  A  (x 0 

第二章导数与微分. 二、微分的几何意义三、微分在近似计算中的应用一、微分的定义 2.3 微分.

全微分教学目的：全微分的有关概念和意义教学重点：全微分的计算和应用教学难点：全微分应用于近似计算.

练一练：在数轴上画出表示下列各数的点，并指出这些点相互间的关系： -6 ， 6 ， -3 ， 3 ， -1.5, 1.5.

信号与系统第三章傅里叶变换东北大学 2017/2/27.

§3.4 空间直线的方程.

3.4 空间直线的方程.

碰撞两物体互相接触时间极短而互作用力较大

第五章二次型. 第五章二次型知识点1---二次型及其矩阵表示二次型的基本概念 1. 线性变换与合同矩阵 2.

第三章函数逼近 — 最佳平方逼近.

完全随机设计多样本资料秩和检验.

常用逻辑用语复习课李娟.

一、原函数与不定积分二、不定积分的几何意义三、基本积分公式及积分法则四、牛顿—莱布尼兹公式五、小结

第四章定积分及其应用 4.3 定积分的概念与性质微积分基本公式定积分的换元积分法与分部积分法 4.5 广义积分

第5章定积分及其应用基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法

第三节函数的求导法则一函数的四则运算的微分法则二反函数的微分法则三复合函数的微分法则及微分形式不变性四微分法小结.

第三节格林公式及其应用（2）一、曲线积分与路径无关的定义二、曲线积分与路径无关的条件三、二元函数的全微分的求积四、小结.

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

第二章　导数与微分第二节　函数的微分法一、导数的四则运算二、复合函数的微分法.

2-7、函数的微分教学要求教学要点.

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

余角、补角.

第5章 §5.3 定积分的积分法换元积分法不定积分分部积分法换元积分法定积分分部积分法.

第三章多维随机变量及其分布 §2 边缘分布边缘分布函数边缘分布律边缘概率密度.

§3.7 热力学基本方程及麦克斯韦关系式热力学状态函数 H, A, G 组合辅助函数 U, H → 能量计算

元素替换法 ——行列式按行(列)展开（推论）

计算机数学基础主讲老师: 邓辉文.

§2 求导法则 2.1 求导数的四则运算法则下面分三部分加以证明, 并同时给出相应的推论和例题 .

第十章方差分析.

第七章参数估计 7.3 参数的区间估计.

习题一、概率论 1.已知随机事件A，B，C满足在下列三种情况下，计算（1）A，B，C相互独立（2）A，B独立，A，C互不相容

抽样和抽样分布基本计算 Sampling & Sampling distribution

实数与向量的积.

3 主讲人陶育纯 MEDICAL MULTIVARIATE STATISTICS ANALYSIS 多元统计分析教案

概率统计主讲教师叶宏山东大学数学院.

线性代数厦门大学线性代数教学组 2019年4月24日6时8分 / 45.

5.2 常用统计分布一、常见分布二、概率分布的分位数三、小结.

第十章双线性型 Bilinear Form 厦门大学数学科学学院网址: gdjpkc.xmu.edu.cn

定理21.9(可满足性定理)设A是P(Y)的协调子集，则存在P(Y)的解释域U和项解释，使得赋值函数v(A){1}。

第16讲相似矩阵与方阵的对角化主要内容： 1.相似矩阵 2. 方阵的对角化.

§8.3 不变因子一、行列式因子二、不变因子.

§6.7 子空间的直和一、直和的定义二、直和的判定三、多个子空间的直和.

相关与回归非确定关系在宏观上存在关系，但并未精确到可以用函数关系来表达。青少年身高与年龄，体重与体表面积非确定关系：

1.设A和B是集合，证明：A=B当且仅当A∩B=A∪B

第三章　函数的微分学第二节　导数的四则运算法则一、导数的四则运算二、偏导数的求法.

4) 若A可逆，则也可逆，证明：所以.

第4课时绝对值.

第一部分：概率产生随机样本：对分布采样均匀分布其他分布伪随机数很多统计软件包中都有此工具如在Matlab中：rand

2.2矩阵的代数运算.

第15讲特征值与特征向量的性质主要内容：特征值与特征向量的性质.

§5.2 抽样分布　　确定统计量的分布——抽样分布，是数理统计的基本问题之一．采用求随机向量的函数的分布的方法可得到抽样分布．由于样本容量一般不止2或 3(甚至还可能是随机的)，故计算往往很复杂，有时还需要特殊技巧或特殊工具．　　由于正态总体是最常见的总体，故本节介绍的几个抽样分布均对正态总体而言．

概率论与数理统计B.

§2 方阵的特征值与特征向量.

第三节随机区组设计的方差分析随机区组设计资料的总平方和可以分解为三项：（10.10）.

第十五讲区间估计本次课讲完区间估计并开始讲授假设检验部分下次课结束假设检验，并进行全书复习本次课程后完成作业的后两部分

第三节函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.

定义5 把矩阵 A 的行换成同序数的列得到的矩阵,

第四节向量的乘积一、两向量的数量积二、两向量的向量积.

第四章　函数的积分学第七节　定积分的换元积分法　　　与分部积分法一、定积分的换元积分法二、定积分的分部积分法.

§4.5 最大公因式的矩阵求法（ Ⅱ ）.

第三章线性方程组 §4 n维向量及其线性相关性（续7）

一元一次方程的解法(－).

§2 自由代数定义19.7:设X是集合，G是一个T-代数，为X到G的函数,若对每个T-代数A和X到A的函数，都存在唯一的G到A的同态映射,使得=，则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变， 变 变， 也变对给定的 和A，是唯一的.

Presentation transcript:

第十章典型相关分析 §10.1 引言 §10.2 总体典型相关 §10.3 样本典型相关 §10.4 典型相关系数的显著性检验

§10.1 引言典型相关分析（canonical correlation analysis）是研究两组变量之间相关关系的一种统计分析方法，它能够有效地揭示两组变量之间的相互线性依赖关系。典型相关分析是由霍特林（Hotelling,1935,1936）首先提出的。

典型相关分析的应用例子在工厂里，考察产品的q个质量指标(y1,y2,⋯,yq)与原材料的p个质量指标(x1,x2,⋯,xp)之间的相关关系；牛肉、猪肉的价格与按人口平均的牛肉、猪肉的消费量之间的相关关系；初一学生的阅读速度、阅读才能与数学运算速度、数学运算才能之间的相关关系；硕士研究生入学考试的各科成绩与本科阶段一些主要课程成绩之间的相关关系；一组政府政策变量与一组经济目标变量之间的相关关系。

§10.2 总体典型相关一、典型相关的定义及导出二、典型相关变量的性质三、从相关矩阵出发计算典型相关

一、典型相关的定义及导出设x=(x1,x2,⋯,xp)′和y=(y1,y2,⋯,yq)′是两组随机变量，且V(x)=Σ11(>0)，V(y)=Σ22(>0)，Cov(x, y)=Σ12，即有其中Σ21=Σ12′。我们研究u=a′x与v=b′y之间的相关关系，其中 a=(a1,a2,⋯,ap)′，b=(b1,b2,⋯,bq)′ Cov(u,v)=Cov(a′x,b′y)=a′Cov(x,y)b=a′Σ12b V(u)=V(a′x)=a′V(x)a=a′Σ11a V(v)=V(b′y)=b′V(y)b=b′Σ22b

所以附加约束条件 V(u)=1，V(v)=1 即 a′Σ11a=1，b′Σ22b=1 在此约束条件下，求a∈Rp和b∈Rq，使得 ρ(u,v)=a′Σ12b 达到最大。

令，于是约束条件化为 α′α=1，β′β=1 利用柯西不等式(1.8.1)，有由(1.8.3)式知，当β=β1时，达到最大值，其中是非负定矩阵的最大特征值，β1相应的单位特征向量。若取 (10.2.7)

则依 (1.8.1) 式知，不等式(10.2.7)中的等号成立。从而，当取时，ρ(u,v)=a′Σ12b达到最大值ρ1（显然ρ1≤1）。称为第一对典型相关变量，称ρ1为第一个典型相关系数。记m为Σ12的秩，则从而，有m个正特征值，记为，相应的正交单位特征向量记为 β1,β2,⋯,βm。和都具有相同的非零特征值。

ρ(u2,u1)=ρ(a′x,a1′x)=Cov(a′x, a1′x)=a′Σ11a1=0 令则α1,α2,⋯,αm为的相应于的正交单位特征向量；a1,a2,⋯,am为的相应于的特征向量；b1,b2,⋯,bm为的相应于的特征向量。第一对典型相关变量u1,v1提取了x与y之间相关的最主要部分，如果这一部分还显得不够，可以在剩余相关中再求出第二对典型相关变量u2=a′x,v2=b′y，也就是a,b应满足标准化条件且应使得第二对典型相关变量不包括第一对典型相关变量所含的信息，即 ρ(u2,u1)=ρ(a′x,a1′x)=Cov(a′x, a1′x)=a′Σ11a1=0 ρ(v2,v1)=ρ(b′y,b1′y)=Cov(b′y,b1′y)=b′Σ22b1=0

ρ(u2,v2)=ρ(a′x,b′y)=a′Σ12b 达到最大。在这些约束条件下使得 ρ(u2,v2)=ρ(a′x,b′y)=a′Σ12b 达到最大。一般地，第i（1<i≤m）对典型相关变量ui=a′x,vi=b′y是指，找出a∈Rp,b∈Rq，在约束条件 a′Σ11a=1，b′Σ22b=1 a′Σ11ak=0，b′Σ22bk=0，k=1,2,⋯,i−1 下，使得 ρ(ui,vi)=ρ(a′x,b′y)=a′Σ12b 令，于是上述约束条件等价于 α′α=1，β′β=1 α′αk=0，β′βk=0，k=1,2,⋯,i−1

由 (1.8.4) 式知，在该约束条件下，当β=βi时，达到最大值。若取则依 (1.8.1) 式，不等式(10.2.7)中的等号成立。所以，当取a=ai,b=bi时，ρ(ui,vi)达到最大值ρi，称它为第i个典型相关系数，称ai,bi为第i对典型系数。

二、典型相关变量的性质 1.同一组的典型变量互不相关 2.不同组的典型变量之间的相关性 3.原始变量与典型变量之间的相关系数 4.典型相关系数也是某种复相关系数 5.简单相关、复相关和典型相关之间的关系

1.同一组的典型变量互不相关设x,y的第i对典型变量为 ui=ai′x，vi=bi′y， i=1,2,⋯,m 则有 V(ui)=ai′Σ11ai=1，V(vi)=bi′Σ22bi=1，i=1,2,⋯,m ρ(ui,uj)=Cov(ui,uj)=ai′Σ11aj=0，1≤i≠j≤m ρ(vi,vj)=Cov(vi,vj)=bi′Σ22bj=0，1≤i≠j≤m

V(u)=I，V(v)=I，Cov(u,v)=Λ 2.不同组的典型变量之间的相关性 ρ(ui,vi)=ρi，i=1,2,⋯,m 记u=(u1,u2,⋯,um)′，v=(v1,v2,⋯,vm)′，则上述两个性质可用矩阵表示为 V(u)=I，V(v)=I，Cov(u,v)=Λ 或其中Λ=diag(ρ1,ρ2,⋯,ρm)。

3.原始变量与典型变量之间的相关系数记A=(a1,a2,⋯,am)，B=(b1,b2,⋯,bm)，则原始变量与典型变量之间的协方差矩阵为 Cov(x,u)=Cov(x,A′x)=Σ11A Cov(x,v)=Cov(x,B′y)=Σ12B Cov(y,u)=Cov(y,A′x)=Σ21A Cov(y,v)=Cov(y,B′y)=Σ22B 原始变量与典型变量之间的相关矩阵为其中 (10.2.18)

(10.2.18)式的证明现证明第一个等式，其余三个等式的证明是完全类似的。令其中μ1=E(x)，μ2=E(y)，即对x和y的各分量作标准化变换，于是

4.典型相关系数也是某种复相关系数与y的复相关系数为与x的复相关系数为

5.简单相关、复相关和典型相关之间的关系当p=q=1时，x与y之间的（惟一）典型相关就是它们之间的简单相关；可见，复相关是典型相关的一个特例，而简单相关是复相关的一个特例。第一个典型相关系数至少同x（或y）的任一分量与y（或x）的复相关系数一样大，即使所有这些复相关系数都较小，第一个典型相关系数仍可能很大；同样，从复相关的定义也可以看出，当p=1（或q=1）时，x（或y）与y（或x）之间的复相关系数也不会小于x（或y）与y（或x）的任一分量之间的相关系数，即使所有这些相关系数都较小，复相关系数仍可能很大。

三、从相关矩阵出发计算典型相关有时，x和y的各分量的单位不全相同，我们希望在对各分量作标准化变换之后再作典型相关分析。

于是因为所以式中，有。同理式中，有。

由此可见，为x*和y*的第i对典型系数，其第i个典型相关系数仍为ρi，在标准化变换下具有不变性，这一点与主成分分析有所不同。由于故x*和y*的第i对典型变量是x和y的第i对典型变量ui=ai′x，vi=bi′y的中心化值，自然都具有零均值。例10.2.1 设x,y有如下相关矩阵：这里|α|＜1, | γ|＜1，可以保证存在。

由于11′有惟一的非零特征值1′1=2，故有惟一非零特征值在约束条件下，相应于特征值的特征向量为。同理，在约束条件下，

相应于特征值的特征向量为。所以，第一对典型相关变量为第一个典型相关系数为。由于|α|<1， |γ|<1，故ρ1>|β|，表明第一个典型相关系数大于两组原始变量之间的相关系数。

§10.3 样本典型相关设数据矩阵为则样本协方差矩阵为 S可用来作为Σ的估计。当n>p+q时， §10.3 样本典型相关设数据矩阵为则样本协方差矩阵为 S可用来作为Σ的估计。当n>p+q时，可分别作为的估计；它们的非零特征值可用来估计；

相应的特征向量作为a1,a2,⋯,am的估计，作为b1,b2,⋯,bm的估计。的正平方根rj称为第i个样本典型相关系数，称为第i对样本典型相关变量, i=1,2,⋯,m。中心化的m对典型变量为将样本(xj,yj)，j=1,2,⋯,n代入上式，有分别称uji和vij为（第j个样品的）xj和yj的第i个样本典型变量得分。由约束条件可得ui的样本方差同理可得vi的样本方差

可画出第一对典型变量得分(uj1,vj1)，j=1,2,⋯,n的散点图，该图能最大限度地呈现两组变量之间的相关性，也可用来检查是否有异常值出现。如需要，可再画出第二对或更多对的典型变量得分散点图。样本典型变量对（在前述的约束条件下）使样本相关系数达到最大，而非使（总体）相关系数达到最大；同组的样本典型变量之间是样本不相关，而非（总体）不相关；样本典型变量的样本方差为1，而非（总体）方差为1。

例10.3.1 某康复俱乐部对20名中年人测量了三个生理指标：体重(x1)、腰围(x2)、脉搏(x3)和三个训练指标：引体向上(y1)、起坐次数(y2)、跳跃次数(y3)。其数据列于表10.3.1。表10.3.1 某康复俱乐部的生理指标和训练指标数据编号 x1 x2 x3 y1 y2 y3 1 191 36 50 5 162 60 2 189 37 52 110 3 193 38 58 12 101 4 35 62 105 46 13 155 6 182 56 42 7 211 8

8 167 34 60 6 125 40 9 176 31 74 15 200 10 154 33 56 17 251 250 11 169 50 120 38 12 166 52 13 210 115 64 14 215 105 247 46 1 193 36 70 16 202 37 62 54 4 25 18 157 32 230 80 19 156 225 73 20 138 68 2 110 43

的特征值分别为0.6630、0.0402和0.0053，于是 r1=0.797，r2=0.201，r3=0.073 相应的样本典型变量系数为

因此，第一对样本典型变量为如果需要，第二对样本典型变量为

例10.3.2 在研究组织结构对“职业满意度”的影响时，作为其中一部分，邓讷姆(Dunham)调查了职业满意度与职业特性相关的程度。对从一大型零售公司各分公司挑出的n=784个行政人员，测量了p=5个职业特性变量：用户反馈(x1)、任务重要性(x2)、任务多样性(x3)、任务特性(x4)及自主权(x5)和q=7个职业满意度量：主管满意度(y1)、事业前景满意度(y2)、财政满意度(y3)、工作强度满意度(y4)、公司地位满意度(y5)、工种满意度(y6)及总体满意度(y7)。对784个被测者的样本相关矩阵为

样本典型相关系数和样本典型变量系数列于表10.3.2中。

表10.3.2 典型相关系数和典型变量系数标准化变量 x1* 0.42 0.34 −0.86 −0.79 0.03 x2* 0.20 表10.3.2 典型相关系数和典型变量系数标准化变量 x1* 0.42 0.34 −0.86 −0.79 0.03 x2* 0.20 −0.67 0.44 −0.27 0.98 x3* 0.17 −0.85 −0.26 0.47 −0.91 x4* −0.02 0.36 −0.42 1.04 0.52 x5* 0.46 0.73 −0.17 −0.44 rj 0.55 0.24 0.12 0.07 0.06 y1* 0.43 −0.09 0.49 −0.13 −0.48 y2* 0.21 −0.78 −0.34 −0.75 y3* −0.04 −0.61 0.35 y4* 0.02 0.93 −0.01 0.40 0.31 y5* 0.29 −0.10 0.28 −0.45 0.70 y6* −0.55 −0.41 0.69 0.18 y7* −0.11 −0.03 0.27

第一对样本典型变量为根据典型系数，u1*主要代表了用户反馈和自主权这两个变量，三个任务变量显得并不重要；而v1*主要代表了主管满意度和工种满意度变量，其次代表了事业前景满意度和公司地位满意度变量。我们也可从相关系数的角度来解释典型变量，原始变量与第一对典型变量间的样本相关系数列于表10.3.3中。

表10.3.3 原始变量与典型变量的样本相关系数所有五个职业特性变量与第一典型变量u1*有大致相同的相关系数，故u1*可以解释为职业特性变量，这与基于典型系数的解释不同。v1*主要代表了主管满意度、事业前景满意度、公司地位满意度和工种满意度，v1*可以解释为职业满意度—公司地位变量，这与基于典型系数的解释基本相一致。第一对典型变量u1*与v1*的样本相关系数r1=0.55，可见，职业特性与职业满意度之间有一定程度的相关性。原始变量样本典型变量 x u1* v1* y x1：用户反馈 0.83 0.46 y1：主管满意度 0.42 0.76 x2：任务重要性 0.73 0.40 y2：事业前景满意度 0.36 0.64 x3：任务多样性 0.75 y3：财政满意度 0.21 0.39 x4：任务特性 0.62 0.34 y4：工作强度满意度 0.38 x5：自主权 0.86 0.48 y5：公司地位满意度 0.65 y6：工种满意度 0.45 0.80 y7：总体满意度 0.28 0.50

§10.4 典型相关系数的显著性检验一、全部总体典型相关系数均为零的检验二、部分总体典型相关系数为零的检验

一、全部总体典型相关系数均为零的检验设。又设S为样本协差阵，且n>p+q。考虑假设检验问题： H0：ρ1=ρ2=⋯=ρm=0 其中m=min{p,q}。若检验接受H0，则认为讨论两组变量之间的相关性没有意义；若检验拒绝H0，则认为第一对典型变量是显著的。(10.4.1)式实际上等价于假设检验问题 H0：Σ12=0，H1：Σ12≠0 H0成立表明x与y互不相关。 (10.4.1)

似然比检验统计量为对于充分大的n，当H0成立时，统计量在给定的α下，若，则拒绝H0，认为典型变量u1与v1之间的相关性是显著的；否则，就认为第一个典型相关系数不显著。

例10.4.1 在例10.3.1中，假设为多元正态数据，欲检验： H0：ρ1=ρ2=ρ3=0，H1：ρ1≠0 它的似然比统计量为查χ2分布表得，，因此在α=0.10的显著性水平下，拒绝原假设H0，也即认为至少有一个典型相关是显著的。

二、部分总体典型相关系数为零的检验若H0：ρ1=ρ2=⋯=ρm=0经检验被拒绝，则应进一步检验假设 H0：ρ2=⋯=ρm=0 若原假设H0被接受，则认为只有第一对典型变量是有用的；若原假设H0被拒绝，则认为第二对典型变量也是有用的。如此进行下去，直至对某个k，假设H0：ρk+1=⋯=ρm=0被接受，这时可认为只有前k对典型变量是显著的。对于假设检验问题 H0：ρk+1=⋯=ρm=0 H1：ρk+1,⋯,ρm至少有一个不为零

其检验统计量为对于充分大的n，当H0为真时，统计量近似服从χ2 [(p−k)(q−k)] 。给定α，若，则拒绝H0，认为ρk+1是显著的，即第k+1对典型变量显著相关。以上的一系列检验实际上是一个序贯检验，检验直到对某个k值H0未被拒绝为止。事实上，检验的总显著性水平已不是α了，且难以确定。还有，检验的结果易受样本容量大小的影响。因此，检验的结果只宜作为确定典型变量个数的重要参考依据，而不宜作为惟一的依据。通常选择尽可能小的k。

例10.4.2 在例10.3.1中，欲进一步检验： H0：ρ2=ρ3=0，H1：ρ2≠0 检验统计量为故接受H0，即认为第二个典型相关是不显著的。因此，只有一个典型相关是显著的。