郑伟诗 Wei-Shi Jason Zheng

Slides:

Advertisements

Similar presentations

第十六週：個資外洩與資訊安全國立高雄餐旅學院餐飲管理系副教授劉聰仁博士編撰.

Advertisements

教师队伍建设组员：王英利赵香媖侯娟. 主讲内容 2. 中小学教师队伍建设 1. 职业教育师资队伍建设国际比较 3. 高校教师队伍建设与管理.

大公教育行政职业能力测验讲义邢长文老师. Page 2 大公教育全国客服热线：

提纲三次考察与改革的回顾 1 学院三周来的新面貌及下一步工作思路 2 凝心聚力、团结协作、狠抓落实 3.

——以通渭县图书馆青树小项目“携老上网游”为例

窦娥冤关汉卿感天动地元·关汉卿.

1. 福康安紀功碑 2. 丙午震災紀念碑 3. 十二門古砲 4. 陳澄波畫架 5. 牆之道 6. 一江山紀念碑 7. 孔廟

人教版语文三年级下册语文园地四作者：佚名来源：网络.

桃園市都市設計審議(暨建照預審)報告書案名：申請單位 / 行政區 / 地段號 / 工程類型/變更設計次數送審依據：

营改增政策交流烟台市国家税务局.

第四章先秦说理散文.

返本归原在课文，精讲多练会高考 ——2012届高三语文复习的几点做法.

2013浙江省行测专题密卷解析及备考冲刺罗姮.

課程設計者：新北市育林國中林憶辰老師分享者：林慧娟

簡報大綱前言為何會有異質採購最低標異質採購最低標法令規定各種決標方式之履約成果分析.

知其不可而为之.

概率图模型林琛博士、副教授.

中国画家协会理事、安徽省美术家协会会员、工艺美术师、黄山市邮协常务理事余承平主讲

十二年國民基本教育年度中投區免試入學超額比序與志願選填宣導說明

第二讲北洋军阀的兴起与衰亡主讲：徐成发.

请欣赏《水调歌头·明月几时有》但愿人长久.mp3

中国好看的PPT模板网：搜集整理发布

第八章了解法律制度自觉遵守法律.

汇报人：李臻中国海洋大学信息科学与工程学院计算机科学与技术系

第四节地域文化与人口有儿无女不称心，有女无儿就伤心；一儿一女不放心，多子多女才舒心。有权的顶着生，有钱的买着生；

汉字的构造.

诵读欣赏古代诗词三首.

第三章心理安全广西师范大学罗蕾.

蔬菜常见缺素症状及防治方法龙岩市科技局.

第五讲主成分分析 Principal Component Analysis

性別平權教育的實施輔一乙第一組謝筱柔－上台報告李竹萱－上台報告張瓊心－ ppt製作

提示语、广告词颁奖词、衔接语感谢信、通告启事图文转换

时间管理 -----高一团体辅导.

他是一位叱咤风云的人物，一位毁誉参半的领袖。

物资供应简报第三期 2014年3月中铁二局物资重庆分公司项目物资简报.

“08高考化学学业水平（必修科目）测试的命题和教学对策研究”

贴近教学服务师生方便老师.

攜手計畫補救教學低成就學生的心理特質與輔導低成就學生的班級經營與師生互動經驗分享台師大陳慧娟

生命与和平相爱铁凝.

六年级语文下册第四单元指尖的世界.

（浙教版）四年级品德与社会下册共同生活的世界第四单元世界之窗第二课时.

如何實施危害辨識、危害控管檢討分析講解與實作

隐马尔可夫模型 Hidden Markov model

隐马尔可夫模型 Hidden Markov model

第9章因子分析 factor analysis

認識香港廢紙回收.

PPT宝藏_www.pptbz.com_提供下载.

特殊教育相关政策法规解析王辉南京特殊教育职业技术学院

隐马尔可夫模型 Hidden Markov model

仲介業最新法規說明及因應策略 ..

1.3 矩阵与数组 MATLAB中矩阵的生成 MATLAB矩阵操作数组创建与运算.

蓝色图示 — 无动画版.

性騷擾之調查與防治主講人：龜山分局家防官劉淑卿.

Bioelectromagnetics Key Laboratory, College of Medicine

Facebook 内部高效工作指南

伯乐相马的故事相传伯乐是春秋时代人，姓孙名阳。据说，有一匹千里马拉着沉重的盐车翻越太行山。在羊肠小道上，马蹄用力挣扎，膝盖跪屈；尾巴下垂着，皮肤也受了伤；浑身冒汗，汗水淋漓，在山坡上艰难吃力地爬行还是拉不上去，伯乐遇见了，就下了自己的车，挽住千里马而对它淌眼泪，并脱下自己的麻布衣服覆盖在千里马身上。千里马于是低下头吐气，抬起头来长鸣，嘶叫声直达云霄。这是它感激伯乐了解并且体贴它啊。

CLICK HERE TO ADD YOUR TITLE

72% 29% 33% ADD YOUR TITLE HERE 点击此处添加文本信息。

張智星 (Roger Jang) 清大資工系多媒體檢索實驗室

106年度成果發表競賽辦法(最新修訂版) 組別團體組個人組人數 2人以上,原則上最多6人同一實習公司,或同一產業得併組參賽 1人為限

隐马尔可夫模型简介 X1 X2 XT ………… O1 O2 OT 刘群

Xián 伯牙绝弦安徽淮南市八公山区第二小学　陈燕朵.

組員：溫富鈞 F 陳俊宇 F 陳韋仲 F 游智翔F 謝孟儒F

蓝色PPT图示 1 2.

隐马尔可夫模型 Hidden Markov model

ADD YOUR TITLE CLICK HERE TO ADD YOUR TEXT.

官峰A+小豪宅三面採光、通風採光極佳、均有前後陽台、空間多元

关于复旦大学体锻制度的调查报告仇璐宛蓉.

Presentation transcript:

郑伟诗 Wei-Shi Jason Zheng wszheng@ieee.org 统计分析进阶郑伟诗 Wei-Shi Jason Zheng wszheng@ieee.org Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 1

简单的自我介绍 2011年加入中山大学，百人计划，副教授广东省引进创新科研团队计算科学科研团队核心成员广东省自然科学杰出青年基金获得者研究方向：机器视觉与智能学习计算机视觉与模式识别：人脸和行人识别动作识别人群社交活动分析机器学习(统计学习)方法：高性能机器学习大规模的图像搜索和分类面向大规模数据的特征提取迁移学习

高性能机器学习算法？ Search your favour image

Relation between two images (far/near)? Similarity between two images? 高性能机器学习算法？ Search your favour image Relation between two images (far/near)? Similarity between two images? How to learn a metric if you are given billions of images?

围绕人的计算机视觉研究 Face Recognition in the Wild Google / Facebook

围绕人的计算机视觉研究 Activity Torso Right-arm Left-arm Right-leg Left-leg Head

围绕人的计算机视觉研究 Group Activity

围绕人的计算机视觉研究 Culture

回到主课---数学实践课教学理念是一门承上启下的课适当拓展一二年级的知识范围非真正的数学建模课一二年级：基本的数学，如线性代数，高等代数，概率统计与分析三四年级：专业课尽量不讲一般的例子，但会比较理论适当拓展一二年级的知识范围重点非面面俱到侧用应用：简介，自学深入的数学知识非真正的数学建模课选取适合二年级学生的知识点做重点介绍更多结合当前计算机科学的研究及应用（部分结合经济）小学期教学不强调掌握具体算法的理论部分，但要会用（计算机应用研究更要学会怎么用）数计学院：数学建模 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 9

统计分析进阶课程安排 PPT下载地址：隐马尔可夫模型多元统计分析：简介多元主成分分析 SVD分解（奇异值矩阵分解算法）案例分析作业：提交打印版作业截止时间：9月21日 PPT下载地址： http://www.eecs.qmul.ac.uk/~jason/sysu/course/maths_model Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 10

一个例子 Object Tracking from Oxford University CVPR 2011, by Ben Benfold and Ian Reid Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 11

一个例子 Object Tracking from Oxford University 从例子中，我们至少发现： CVPR 2011, by Ben Benfold and Ian Reid 从例子中，我们至少发现：时间序列的建模二维及更高维特征的建模 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 12

一个例子人脸超分辨率分析 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 13

I 隐马尔可夫模型隐马尔可夫模型(HMM)的由来马尔可夫性和马尔可夫链 HMM实例 HMM的三个基本算法 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 14

HMM的由来 1870年，俄国有机化学家Vladimir V. Markovnikov第一次提出马尔科夫模型马尔可夫模型马尔可夫链隐马尔可夫模型 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 15

马尔可夫性如果一个过程的“将来”仅依赖“现在”而不依赖“过去”，则此过程具有马尔可夫性,或称此过程为马尔可夫过程 X(t+1) = f( X(t) ) 隐马尔可夫：只观察到Oi, Oi由隐含变量Xi的状态值决定，且(Oi,Xi)独立。 X1 X2 XT ………… O1 O2 OT Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 16

马尔科夫链时间和状态都离散的马尔科夫过程称为马尔科夫链记作{Xn = X(n), n = 0,1,2,…} 在时间集T1 = {0,1,2,…}上对离散状态的过程相继观察的结果链的状态空间记做I = {a1, a2,…}, ai∈R. 条件概率Pij ( m ,m+n)=P{Xm+n = aj|Xm = ai} 为马氏链在时刻m处于状态ai条件下，在时刻m+n转移到状态aj的转移概率。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 17

转移概率矩阵阴天晴天下雨晴天阴天下雨晴天 0.50 0.25 0.25 阴天 0.375 0.25 0.375 下雨 0.25 0.125 0.625 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 18

转移概率矩阵(续) 由于链在时刻m从任何一个状态ai出发，到另一时刻m+n，必然转移到a1，a2…，诸状态中的某一个，所以有当Pij(m,m+n)与m无关时，称马尔科夫链为齐次马尔科夫链，通常说的马尔科夫链都是指齐次马尔科夫链。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 19

HMM实例——实例描述设有N个缸，每个缸中装有很多彩球，球的颜色由一组概率分布描述。实验进行方式如下根据缸中球颜色的概率分布，随机选择一个球，记球的颜色为O1，并把球放回缸中根据描述缸的转移的概率分布，随机选择下一口缸，重复以上步骤。最后得到一个描述球的颜色的序列O1,O2,…，称为观察值序列O。 Urn 3 Urn 1 Urn 2 Veil Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 20 Observed Ball Sequence

HMM实例——约束不能被直接观察缸间的转移从缸中所选取的球的颜色和缸并不是一一对应的每次选取哪个缸由一组转移概率决定在上述实验中，有几个要点需要注意：不能被直接观察缸间的转移从缸中所选取的球的颜色和缸并不是一一对应的每次选取哪个缸由一组转移概率决定 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 21

HMM概念 HMM的状态是不确定或不可见的，只有通过观测序列的随机过程才能表现出来观察到的事件与状态并不是一一对应，而是通过一组概率分布相联系 HMM是一个双重随机过程，两个组成部分：马尔可夫链：描述状态的转移，用转移概率描述。一般随机过程：描述状态与观察序列间的关系，用观察值概率描述。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 22

HMM组成 Markov链（, A）随机过程（B） HMM的组成示意图状态序列观察值序列 q1, q2, ..., qT o1, o2, ..., oT HMM的组成示意图 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 23

HMM的基本要素用模型五元组＝（ N, M, π , A, B）用来描述HMM，或简写为 =(π ，A，B) 参数含义实例 N 状态数目缸的数目 M 每个状态可能的观察值数目彩球颜色数目 A 与时间无关的状态转移概率矩阵在选定某个缸的情况下，选择另一个缸的概率 B 给定状态下，观察值概率分布每个缸中的颜色分布 p 初始状态空间的概率分布初始时选择某口缸的概率 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 24

HMM需解决的问题问题1：给定观察序列O=O1,O2,…OT,以及模型 , 如何计算P(O|λ)？问题2：给定观察序列O=O1,O2,…OT以及模型λ,如何选择一个对应的状态序列 S = q1,q2,…qT，使得S能够最为合理的解释观察序列O？问题3：如何调整模型参数 , 使得P(O|λ)最大？ Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 25

解决问题1 的基础方法给定一个固定的状态序列S=(q1，q2，q3…) 表示在qt 状态下观测到Ot 的概率计算量相当大 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 26

解决问题1: 前向法定义前向变量初始化：递归：终结： Wei-Shi Zheng 3/3/2017, Page 27 wszheng@ieee.org 3/3/2017, Page 27

前向法示意图 N=5, M=100, => 计算量3000 1 ... t t+1 ... qN atN . qi qj ati aNj aij a1j at1 1 ... t t+1 ... N=5, M=100, => 计算量3000 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 28

解决问题1 后向法与前向法类似定义后向变量初始化：递归：终结： Wei-Shi Zheng 3/3/2017, Page 29 wszheng@ieee.org 3/3/2017, Page 29

解决问题2: Viterbi算法目的：给定观察序列O以及模型λ,如何选择一个对应的状态序列S ，使得S能够最为合理的解释观察序列O？ N和T分别为状态个数和序列长度定义：我们所要找的，就是T时刻最大的所代表的那个状态序列 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 30

解决问题2: Viterbi算法初始化：递归：终结：求S序列： Wei-Shi Zheng 3/3/2017, Page 31 wszheng@ieee.org 3/3/2017, Page 31

解决问题3: Baum-Welch算法(模型训练算法) 目的：给定观察值序列O，通过计算确定一个模型l ，使得P(O| l)最大。算法步骤： 1. 初始模型（待训练模型） l0, 2. 基于l0 以及观察值序列O，训练新模型 l； 3. 如果 log P(O|l) - log(P(O|l0) < Delta，说明训练已经达到预期效果，算法结束。 4. 否则，令l0 ＝ l ，继续第2步工作 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 32

Baum-Welch算法(续) 定义： Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 33

Baum-Welch算法(续2) 参数估计： Wei-Shi Zheng 3/3/2017, Page 34 wszheng@ieee.org 3/3/2017, Page 34

案例：基于HMM的语音分析我们平时在说话时，脑子就是一个信息源。我们的喉咙（声带），空气，就是如电线和光缆般的信道。听众耳朵的就是接收端，而听到的声音就是传送过来的信号。根据声学信号来推测说话者的意思，就是语音识别。这样说来，如果接收端是一台计算机而不是人的话，那么计算机要做的就是语音自动识别。同样，在计算机中，如果我们要根据接收到的英语信息，推测说话者的汉语意思，就是机器翻译；如果我们要根据带有拼写错误的语句推测说话者想表达的正确意思，那就是自动纠错。如果我们要根据输入的汉语词语片段推测出每个片段的语法含义,那就是自动词法标注。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 35

基于HMM的语音分析那么怎么根据接收到的信息来推测说话者真正想表达的意思呢？可以利用叫做“隐含马尔可夫模型” （Hidden Markov Model）来解决问题。以自动词法标注为例，当我们观测到词语片断 o1,o2,o3 时，我们要根据这组信号推测出发送的词语语法片断 s1,s2,s3。显然，我们应该在所有可能的语法片断中找最有可能性的一个。用数学语言来描述，就是在已知 o1,o2,o3,...的情况下，求使得条件概率P (s1,s2,s3,...|o1,o2,o3....) 达到最大值的那个语法片断 s1,s2,s3,... Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 36

基于HMM的语音分析当然，上面的概率不容易直接求出，于是我们可以间接地计算它。利用贝叶斯公式并且省掉一个常数项，可以把上述公式等价变换成： P(o1,o2,o3,...|s1,s2,s3....) * P(s1,s2,s3,...) 其中 P(o1,o2,o3,...|s1,s2,s3....) 表示某个语法片断序列 s1,s2,s3...被读成 o1,o2,o3,...的可能性, 而 P(s1,s2,s3,...) 表示字串 s1,s2,s3,...本身能够成为一个合乎情理的语法片断序列的可能性，所以这个公式的意义是用发送信号为 s1,s2,s3...这个数列的可能性乘以 s1,s2,s3...本身是一个语法片断序列的可能性，得出概率。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 37

基于HMM的语音分析我们在这里做两个假设：第一，s1,s2,s3,... 是一个马尔可夫链，也就是说，si 只由 si-1 决定；第二，第 i 时刻的接收信号 oi 只由发送信号 si 决定（又称为独立输出假设, 即 P(o1,o2,o3,...|s1,s2,s3....) = P(o1|s1) * P(o2|s2)*P(o3|s3)...。满足上述两个假设的模型就叫隐含马尔可夫模型。我们之所以用“隐含”这个词，是因为状态 s1,s2,s3,...是无法直接观测到的。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 38

基于HMM的语音分析隐含马尔可夫模型的应用远不只在自动词法标注和语音识别中。在上面的公式中，如果我们把 s1,s2,s3,...当成中文，把 o1,o2,o3,...当成对应的英文，那么我们就能利用这个模型解决机器翻译问题；如果我们把 o1,o2,o3,...当成扫描文字得到的图像特征，就能利用这个模型解决印刷体和手写体的识别。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 39

HMM的罐子比喻(L.R.Rabiner,1989) Wei-Shi Zheng 3/3/2017, Page 40 wszheng@ieee.org 3/3/2017, Page 40

基于HMM的词性标注问题： HMM模型：训练：求解统计词性转移矩阵[aij]和词性到单词的输出矩阵[bik] 已知单词序列w1w2…wn，求词性序列c1c2…cn HMM模型：将词性为理解为状态将单词为理解为输出值训练：统计词性转移矩阵[aij]和词性到单词的输出矩阵[bik] 求解 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 41

基于HMM的词性标注 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 42

基于HMM的词性标注 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 43

基于HMM的词性标注 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 44

基于HMM的词性标注 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 45

基于HMM的词性标注 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 46

词性转移矩阵（用于转移概率计算） Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 47

词语词性频度表（用于输出概率计算） Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 48

词性频度表 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 49

算法标注示例 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 50

隐马尔可夫模型的其他应用（不限于）语音识别音字转换词性标注（POS Tagging）组块分析基因分析一般化：任何与线性序列相关的现象 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 51

进一步的资料工具箱：http://www.cs.ubc.ca/~murphyk/Software/HMM/hmm.html HMM at Wikipedia：http://en.wikipedia.org/wiki/Hidden_Markov_model 建议教材：http://www.shokhirev.com/nikolai/abc/alg/hmm/hmm.html 后续课程: 随机过程（数计学院，岭南学院）***通讯及网络分析、图像分割、视频处理等*** Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 52

II 多元统计简介多元分布的基本概念多元正态分布多元线性回归分析主成分分析 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 53

多元分布的基本概念假定所讨论的是多个变量的总体，所研究的数据是同时观测个指标（即变量），又进行了次观测得到的，把这个指标表示为常用向量若观测了 n 个个体，则可得到如下数据。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 54

多元分布的基本概念表示第个样品的观测值。表示对第个变量的n次观测数值。可用矩阵语言表示为: 记 Wei-Shi Zheng 表示第个样品的观测值。表示对第个变量的n次观测数值。记可用矩阵语言表示为: Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 55 55

多元分布的基本概念 1.随机向量 X的均值设定义随机向量X的均值为: 当为常数矩阵时，推出如下性质： Wei-Shi Zheng 当为常数矩阵时，推出如下性质： Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 56

多元分布的基本概念 X的广义方差 2、随机向量自协方差阵 Wei-Shi Zheng 3/3/2017, Page 57 2、随机向量自协方差阵 X的广义方差 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 57

多元分布的基本概念 3、随机向量X 和Y 的协差阵设分别为p维和q维随机向量，它们之间的协方差阵定义为一个p×q矩阵，其元素是cov(Xi,Yj) ，即 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 58

多元分布的基本概念当A、B为常数矩阵时，有如下性质：（3）设X为p维随机向量，期望和协方差存在记则对称阵，同时总是非负定（也称半正定）的。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 59

若随机向量的协差阵存在,且每个分量的方差大于零，则X的相关阵定义为: 多元分布的基本概念 4、随机向量X 的相关阵若随机向量的协差阵存在,且每个分量的方差大于零，则X的相关阵定义为: 也称为分量与之间的（线性）相关系数。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 60

多元分布的基本概念在数据处理时，为了克服由于指标的量纲不同对统计分析结果带来的影响，往往在使用某种统计分析方法之前，常需将每个指标“标准化”，即做如下变换 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 61

多元正太分布本节将介绍多元正态分布的定义，并简要给出它的基本性质。多元正态分布是一元正态分布的推广。迄今为止,多元分析的主要理论都是建立在多元正态总体基础上的, 本节将介绍多元正态分布的定义，并简要给出它的基本性质。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 62

多元正太分布定义1：若p元随机向量的概率密度函数为：则称遵从p元正态分布，也称X为p元正态变量。记为 |∑|为协差阵∑的行列式。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 63

只是均值换成平均向量，方差换成协方差矩阵多元正太分布定理设则这个跟一元统计是差不多的，只是均值换成平均向量，方差换成协方差矩阵 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 64

多元正太分布的性质 1、如果正态随机向量的协方差阵∑是对角阵，则X的各分量是相互独立的随机变量。 2、多元正态分布随机向量X的任何一个分量子集的分布（称为X的边缘分布）仍然遵从正态分布。而反之，若一个随机向量的任何边缘分布均为正态，并不能导出它是多元正态分布。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 65

多元正太分布的性质例如，设有密度容易验证，但显然不是正态分布。 Wei-Shi Zheng 3/3/2017, Page 66 例如，设有密度容易验证，但显然不是正态分布。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 66

多元正太分布的性质 4、若 ,则 3、多元正态向量的任意线性变换仍然服从多元正态分布 Wei-Shi Zheng 4、若 ,则 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 67

多元正太分布的性质条件分布和独立性设 p≥2,将X、μ和Σ剖分如下： , 我们希望求给定的条件分布，即的分布。下一个定理指出：正态分布的条件分布仍为正态分布。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 68

多元正太分布的性质定理：设，Σ>0，则 Wei-Shi Zheng 3/3/2017, Page 69 定理：设，Σ>0，则 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 69

多元正太分布的参数估计均值向量的估计在一般情况下,设样本矩阵为：设样品相互独立,同遵从于P元正态分布 ,而且n>p,Σ>0,则总体参数均值μ的估计量是 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 70

多元正太分布的参数估计即均值向量μ的估计量,就是样本均值向量.这可由极大似然法推导出来。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 71

多元正太分布的参数估计协方差阵的估计总体参数协差阵Σ的极大似然估计是 Wei-Shi Zheng 3/3/2017, Page 72 wszheng@ieee.org 3/3/2017, Page 72

多元正太分布的参数估计其中L是离差阵，它是每一个样品（向量）与样本均值（向量）的离差积形成的n个阶对称阵的和。同一元相似，不是Σ的无偏估计，为了得到无偏估计我们常用样本协差阵作为总体协差阵的估计。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 73 73

多元线性回归分析 1.多元线性回归的数学模型 2.模型参数的最小二乘估计 Wei-Shi Zheng 3/3/2017, Page 74 wszheng@ieee.org 3/3/2017, Page 74

多元线性回归分析模型的理论假设设是个自变量（解释变量），是因变量，则多元线性回归模型的理论假设是其中，是个未知参数，称为回归常数，称为回归系数为随机误差. Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 75

多元线性回归分析模型的建立求 p 元线性函数的经验回归方程其中，是的统计估计，分别是的统计估计，称为经验回归系数. Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 76

多元线性回归分析设对变量向量的次观测得到的样本数据为为了今后讨论方便，我们引进矩阵 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 77

多元线性回归分析于是，多元线性回归模型的数据结构为称为多元样本回归方程，其中且各个相互独立.由于矩阵是样本数据，的数据可以进行设计和控制，因此，矩阵称为回归设计矩阵或资料矩阵. Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 78

多元线性回归分析 ⑴ 条件表明，是一个满稚矩阵，即矩阵列向量（解释变量）间线性无关，样本容量的个数应当大于解释变量的个数. 违反该假设时，称模型存在多重共线性问题. ⑵ 条件且各个相互独立 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 79 79

多元线性回归分析时，称回归模型存在异方差.当时，称回归模型存在自相关. 当模型违反上述假设后，就不能使用最小二乘法估计来求解回归系数.解决方法可参考回归分析相关教材。先介绍模型符合假设时的参数估计方法. Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 80

多元线性回归分析：最小二乘法定义离差平方和求使得  参数估计的准则 Wei-Shi Zheng 3/3/2017, Page 81 wszheng@ieee.org 3/3/2017, Page 81

多元线性回归分析：最小二乘法称为模型参数的最小二乘估计，称为因变量的回归拟合值，简称回归值或拟合值.称为因变量的残差. Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 82

多元线性回归分析：最小二乘法当满足元线性回归模型理论假设的条件时，模型参数的最小二乘解为可以证明 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 83

多元线性回归分析：最小二乘法其中由此可见，是的无偏估计.协方差阵反映出估计量的波动大小,由于是右乘一个矩阵所以的波动大小可以由抽样过程中进行控制.同一元线性回归分析一样，在多元线性回归中，样本抽样要尽可能的分散. Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 84

主成分分析主成分分析主成分回归 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 85

主成分分析—例子汇报什么？假定你是一个公司的财务经理，掌握了公司的所有数据，比如固定资产、流动资金、每一笔借贷的数额和期限、各种税费、工资支出、原料消耗、产值、利润、折旧、职工人数、职工的分工和教育程度等等。如果让你向上面介绍公司状况，你能够把这些指标和数字都原封不动地摆出去吗？当然不能。你必须要把各个方面作出高度概括，用一两个指标简单明了地把情况说清楚。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 86 86

主成分分析—例子每个人都会遇到有很多变量的数据。比如全国或各个地区的带有许多经济和社会变量的数据；各个学校的研究、教学等各种变量的数据等等。这些数据的共同特点是变量很多，在如此多的变量之中，有很多是相关的。人们希望能够找出它们的少数“代表”来对它们进行描述。介绍两种把变量维数降低以便于描述、理解和分析的方法：主成分分析（principal component analysis）和因子分析（factor analysis）。实际上主成分分析可以说是因子分析的一个特例。在引进主成分分析之前，先看下面的例子。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 87

主成分分析—例子一个经济学的例子：一项十分著名的工作是美国的统计学家斯通(stone)在1947年关于国民经济的研究。他曾利用美国1929一1938年各年的数据，得到了17个反映国民收入与支出的变量要素，例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存、股息、利息外贸平衡等等。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 88 88

主成分分析—例子在进行主成分分析后，竟以97.4％的精度，用三新变量就取代了原17个变量。根据经济学知识，斯通给这三个新变量分别命名为总收入F1、总收入变化率F2和经济发展或衰退的趋势F3。更有意思的是，这三个变量其实都是可以直接测量的。斯通将他得到的主成分与实际测量的总收入I、总收入变化率I以及时间t因素做相关分析，得到下表： Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 89

F1 F2 F3 i t 1 0.995 -0.041 0.057 l -0.056 0.948 -0.124 -0.102 -0.369 -0.282 -0.836 -0.414 -0.112 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 90

主成分分析—例子主成分分析是把各变量之间互相关联的复杂关系进行简化分析的方法。在社会经济的研究中，为了全面系统的分析和研究问题，必须考虑许多经济指标，这些指标能从不同的侧面反映我们所研究的对象的特征，但在某种程度上存在信息的重叠，具有一定的相关性。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 91

主成分分析—例子成绩数据: 100个学生的数学、物理、化学、语文、历史、英语的成绩如下表（部分）。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 92

主成分分析—例子从本例可能提出的问题目前的问题是，能不能把这个数据的6个变量用一两个综合变量来表示呢？这一两个综合变量包含有多少原来的信息呢？能不能利用找到的综合变量来对学生排序呢？这一类数据所涉及的问题可以推广到对企业，对学校进行分析、排序、判别和分类等问题。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 93

主成分分析—例子主成分分析例中的的数据点是六维的；也就是说，每个观测值是6维空间中的一个点。我们希望把6维空间用低维空间表示。先假定只有二维，即只有两个变量，它们由横坐标和纵坐标所代表；因此每个观测值都有相应于这两个坐标轴的两个坐标值；如果这些数据形成一个椭圆形状的点阵（这在变量的二维正态的假定下是可能的）那么这个椭圆有一个长轴和一个短轴。在短轴方向上，数据变化很少；在极端的情况，短轴如果退化成一点，那只有在长轴的方向才能够解释这些点的变化了；这样，由二维到一维的降维就自然完成了。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 94 94

主成分分析—例子几何分析当坐标轴和椭圆的长短轴平行，那么代表长轴的变量就描述了数据的主要变化，而代表短轴的变量就描述了数据的次要变化。但是，坐标轴通常并不和椭圆的长短轴平行。因此，需要寻找椭圆的长短轴，并进行变换，使得新变量和椭圆的长短轴平行。如果长轴变量代表了数据包含的大部分信息，就用该变量代替原先的两个变量（舍去次要的一维），降维就完成了。椭圆（球）的长短轴相差得越大，降维也越有道理。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 95 95

主成分分析—例子 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 96

主成分分析—例子主成分分析对于多维变量的情况和二维类似，也有高维的椭球，只不过无法直观地看见罢了。首先把高维椭球的主轴找出来，再用代表大多数数据信息的最长的几个轴作为新变量；这样，主成分分析就基本完成了。注意，和二维情况类似，高维椭球的主轴也是互相垂直的。这些互相正交的新变量是原先变量的线性组合，叫做主成分(principal component)。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 97 97

主成分分析—例子主成分分析试图在力保数据信息丢失最少的原则下，对这种多变量的截面数据表进行最佳综合简化，也就是说，对高维变量空间进行降维处理。很显然，识辨系统在一个低维空间要比在一个高维空间容易得多。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 98

主成分分析—例子在力求数据信息丢失最少的原则下，对高维的变量空间降维，寻找主成分，即研究指标体系的少数几个线性组合，这些综合指标将尽可能多地保留原来指标变异方面的信息。要讨论的问题是： (1) 基于相关系数矩阵还是基于协方差矩阵做主成分分析。当分析中所选择的经济变量具有不同的量纲，变量水平差异很大，应该选择基于相关系数矩阵的主成分分析。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 99 99

（2）选择几个主成分。主成分分析的目的是简化变量，一般情况下主成分的个数应该小于原始变量的个数。关于保留几个主成分，应该权衡主成分个数和保留的信息。（3）如何解释主成分所包含的实际意义。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 100

数学模型与几何解释假设我们所讨论的实际问题中，有p个指标，我们把这p个指标看作p个随机变量，记为X1，X2，…，Xp，主成分分析就是要把这p个指标的问题，转变为讨论p个指标的线性组合的问题，而这些新的指标F1，F2，…，Fk(k≤p），按照保留主要信息量的原则充分反映原指标的信息，并且相互独立。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 101

主成分分析—例子这种由讨论多个指标降为少数几个综合指标的过程在数学上就叫做降维。主成分分析通常的做法是，寻求原指标的线性组合Fi。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 102

主成分分析—例子每个主成分的系数平方和为1。即满足如下的条件：主成分之间相互独立，即无重叠的信息。即主成分的方差依次递减，重要性依次递减，即 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 103

主成分分析—例子主成分分析的几何解释平移、旋转坐标轴 • Wei-Shi Zheng 3/3/2017, Page 104 wszheng@ieee.org 3/3/2017, Page 104

主成分分析—例子为了方便，我们在二维空间中讨论主成分的几何意义。设有n个样品，每个样品有两个观测变量xl和x2，在由变量xl和x2 所确定的二维平面中，n个样本点所散布的情况如椭圆状。由图可以看出这n个样本点无论是沿着xl 轴方向或x2轴方向都具有较大的离散性，其离散的程度可以分别用观测变量xl 的方差和x2 的方差定量地表示。显然，如果只考虑xl和x2 中的任何一个，那么包含在原始数据中的经济信息将会有较大的损失。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 105

主成分分析—例子主成分分析的几何解释平移、旋转坐标轴 • Wei-Shi Zheng 3/3/2017, Page 106 wszheng@ieee.org 3/3/2017, Page 106

主成分分析—例子如果我们将xl 轴和x2轴先平移，再同时按逆时针方向旋转角度，得到新坐标轴Fl和F2。Fl和F2是两个新变量。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 107

主成分分析—例子旋转变换的目的是为了使得n个样品点在Fl轴方向上的离散程度最大，即Fl的方差最大。变量Fl代表了原始数据的绝大部分信息，在研究某经济问题时，即使不考虑变量F2也无损大局。经过上述旋转变换原始数据的大部分信息集中到Fl轴上，对数据中包含的信息起到了浓缩作用。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 108

主成分分析—例子 Fl，F2除了可以对包含在Xl，X2中的信息起着浓缩作用之外，还具有不相关的性质，这就使得在研究复杂的问题时避免了信息重叠所带来的虚假性。二维平面上的个点的方差大部分都归结在Fl轴上，而F2轴上的方差很小。Fl和F2称为原始变量x1和x2的综合变量。F简化了系统结构，抓住了主要矛盾。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 109

主成分分析数学基础简介其中是A的特征根。一、两个线性代数的结论 1、若A是p阶实对称阵，则一定可以找到正交阵U，使 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 110

主成分分析数学基础简介令则实对称阵属于不同特征根所对应的特征向量是正交的，即有 2、若上述矩阵的特征根所对应的单位特征向量为则实对称阵属于不同特征根所对应的特征向量是正交的，即有 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 111

主成分分析数学基础简介由于Σx为非负定的对称阵，则有利用线性代数的知识可得，必存在正交阵U，使得（一）第一主成分设X的协方差阵为 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 112

主成分分析数学基础简介其中1， 2，…， p为Σx的特征根，不妨假设1 2  … p 。而U恰好是由特征根相对应的特征向量所组成的正交阵。下面我们来看，是否由U的第一列元素所构成为原始变量的线性组合是否有最大的方差。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 113

主成分分析数学基础简介设有P维正交向量 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 114

主成分分析数学基础简介等号成立： Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 115

主成分分析数学基础简介当且仅当a1 =u1时，即时，有最大的方差1。因为Var(F1)=u’1xu1=1。如果第一主成分的信息不够，则需要寻找第二主成分。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 116

主成分分析数学基础简介（二）第二主成分则，对p维向量，有在约束条件下，寻找第二主成分因为所以 Wei-Shi Zheng 在约束条件下，寻找第二主成分因为所以则，对p维向量，有 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 117

主成分分析数学基础简介所以如果取线性变换：则的方差次大。类推 Wei-Shi Zheng 3/3/2017, Page 118 则的方差次大。类推 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 118

主成分分析数学基础简介写为矩阵形式： Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 119

主成分分析-性质二、方差为所有特征根之和 tr(cov(F))=tr(U’cov(X)U)=tr(cov(X)) 一、均值二、方差为所有特征根之和 tr(cov(F))=tr(U’cov(X)U)=tr(cov(X)) 说明主成分分析把P个随机变量的总方差分解成为P个不相关的随机变量的方差之和。协方差矩阵的对角线上的元素之和等于特征根之和。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 120 120

主成分分析-性质 1）贡献率：第i个主成分的方差在全部方差中所占比重，称为贡献率，反映了原来P个指标多大的信息，有多大的综合能力。 2）累积贡献率：前k个主成分共有多大的综合能力，用这k个主成分的方差和在全部方差中所占比重来描述，称为累积贡献率。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 121 121

主成分分析-性质我们进行主成分分析的目的之一是希望用尽可能少的主成分F1，F2，…，Fk（k≤p）代替原来的P个指标。到底应该选择多少个主成分，在实际工作中，主成分个数的多少取决于能够反映原来变量80%以上的信息量为依据，即当累积贡献率≥80%时的主成分的个数就足够了。最常见的情况是主成分为2到3个。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 122

主成分分析-性质原始变量与主成分之间的相关系数 Wei-Shi Zheng 3/3/2017, Page 123 wszheng@ieee.org 3/3/2017, Page 123

主成分分析-性质可见，和的相关的密切程度取决于对应线性组合系数的大小。 Wei-Shi Zheng 可见，和的相关的密切程度取决于对应线性组合系数的大小。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 124

主成分分析-性质原始变量被主成分的提取率前面我们讨论了主成分的贡献率和累计贡献率，他们度量了F1，F2，……，Fm分别从原始变量X1，X2，……XP中提取了多少信息。那么X1，X2，……XP各有多少信息分别F1，F2，……，Fm被提取了。应该用什么指标来度量？我们考虑到当讨论F1分别与X1，X2，……XP的关系时，可以讨论F1分别与X1，X2，……XP的相关系数，但是由于相关系数有正有负，所以只有考虑相关系数的平方。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 125 125

主成分分析-性质是Fj 能说明的第 i 原始变量的方差是Fj 提取的第 i 原始变量信息的比重如果我们仅仅提出了m个主成分，则第i 原始变量信息的被提取率为： Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 126

主成分分析-性质例设的协方差矩阵为解得特征根为例设的协方差矩阵为，，解得特征根为第一个主成分的贡献率为5.83/（5.83+2.00+0.17）=72.875%，尽管第一个主成分的贡献率并不小，但在本题中第一主成分不含第三个原始变量的信息，所以应该取两个主成分。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 127 127

主成分分析-性质平方 xi 1 0.925 0.855 2 -0.998 0.996 3 Xi与F1的相关系数 Xi与F2的相关系数信息提取率 xi 1 0.925 0.855 2 -0.998 0.996 3 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 128

总结：主成分分析的步骤一、基于协方差矩阵在实际问题中，X的协方差通常是未知的，样品有第一步：由X的协方差阵Σx，求出其特征根，即解方程，可得特征根。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 129

总结：主成分分析的步骤第二步：求出分别所对应的特征向量U1，U2，…，Up，第三步：计算累积贡献率，给出恰当的主成分个数。第四步：计算所选出的k个主成分的得分。将原始数据的中心化值: 代入前k个主成分的表达式，分别计算出各单位k个主成分的得分，并按得分值的大小排队。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 130

主成份分析-案例分析例一应收账款是指企业因对外销售产品、材料、提供劳务及其它原因，应向购货单位或接受劳务的单位收取的款项，包括应收销货款、其它应收款和应收票据等。出于扩大销售的竞争需要，企业不得不以赊销或其它优惠的方式招揽顾客，由于销售和收款的时间差，于是产生了应收款项。应收款赊销的效果的好坏，不仅依赖于企业的信用政策，还依赖于顾客的信用程度。由此，评价顾客的信用等级，了解顾客的综合信用程度，做到“知己知彼，百战不殆”，对加强企业的应收账款管理大有帮助。某企业为了了解其客户的信用程度，采用西方银行信用评估常用的5C方法，5C的目的是说明顾客违约的可能性。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 131

主成份分析-案例分析 1、品格（用X1表示），指顾客的信誉，履行偿还义务的可能性。企业可以通过过去的付款记录得到此项。 2、能力（用X2表示），指顾客的偿还能力。即其流动资产的数量和质量以及流动负载的比率。顾客的流动资产越多，其转化为现金支付款项的能力越强。同时，还应注意顾客流动资产的质量，看其是否会出现存货过多过时质量下降，影响其变现能力和支付能力。 3、资本（用X3表示），指顾客的财务势力和财务状况，表明顾客可能偿还债务的背景。 4、附带的担保品（用X4表示），指借款人以容易出售的资产做抵押。 5、环境条件（用X5表示），指企业的外部因素，即指非企业本身能控制或操纵的因素。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 132

主成份分析-案例分析首先并抽取了10家具有可比性的同类企业作为样本，又请8位专家分别给10个企业的5个指标打分，然后分别计算企业5个指标的平均值，如表。 76.5 81.5 76 75.8 71.7 85 79.2 80.3 84.4 70.6 73 67.6 68.1 78.5 94 87.5 89.5 92 90.7 87.3 91 80 84.6 66.9 68.8 64.8 66.4 77.5 73.6 70.9 69.8 74.8 57.7 60.4 57.4 60.8 65 85.6 68.5 70 62.2 69.2 64.9 68.9； Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 133

主成份分析-案例分析 COV = cov(X'); [COEFF, latent, explained] = pcacov(X) 0.4664 0.1948 -0.4613 0.2780 -0.6741 0.4828 0.7253 0.0527 -0.0552 0.4848 0.4646 -0.5341 -0.4883 -0.3744 0.3469 0.3963 -0.3732 0.3781 0.7203 0.2046 0.4202 -0.1072 0.6348 -0.5105 -0.3852 Latent(特征根) = 533.3213 47.4022 18.4800 12.9058 7.9303 explained (累计贡献率)= 86.0141 7.6450 2.9805 2.0814 1.2790 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 134

主成份分析-案例分析在正确评估了顾客的信用等级后，就能正确制定出对其的信用期、收帐政策等，这对于加强应收帐款的管理大有帮助。第一主成份的贡献率为86%，第一主成份 Z1=0.466X1+0.483X2+0.465X3+0.396X4+0.42X5 的各项系数大致相等，且均为正数，说明第一主成份对所有的信用评价指标都有近似的载荷，是对所有指标的一个综合测度，可以作为综合的信用等级指标。可以用来排序。将原始数据的值中心化后，代入第一主成份Z1的表示式，计算各企业的得分，并按分值大小排序: 序号 1 2 3 4 5 6 7 8 9 10 得分 10.017 3.198 -0.695 -8.674 1.727 8.044 -2.151 -4.032 -4.522 -2.912 排序 1 3 5 10 4 2 6 8 9 7 在正确评估了顾客的信用等级后，就能正确制定出对其的信用期、收帐政策等，这对于加强应收帐款的管理大有帮助。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 135

主成份分析-案例分析例二基于相关系数矩阵的主成分分析。对美国纽约上市的有关化学产业的3个证券和石油产业的2个证券做了100周的收益率调查。下表是其相关系数矩阵。 1）利用相关系数矩阵做主成分分析。 2）决定要保留的主成分个数，并解释意义。 1 0.577 0.509 0.0063 0.0037 0.599 0.389 0.52 0.436 0.426 0.523 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 136

主成份分析-案例分析 >> [U,D] = eig(A) U = 0.5954 0.2143 0.0586 -0.6906 0.3452 -0.6208 0.4206 -0.3556 -0.1691 0.5317 -0.2238 -0.7419 0.3442 -0.1382 0.5118 0.1347 0.4293 0.6258 0.4998 0.3951 0.4381 -0.2062 -0.6000 0.4748 0.4244 D = 0.2112 0 0 0 0 0 0.3795 0 0 0 0 0 0.5179 0 0 0 0 0 1.2360 0 0 0 0 0 2.6553 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 137

主成分分析主要有以下几方面的应用根据主成分分析的定义及性质，我们已大体上能看出主成分分析的一些应用。概括起来说，主成分分析主要有以下几方面的应用。 1．主成分分析能降低所研究的数据空间的维数。即用研究m维的Y空间代替p维的X空间(m＜p)，而低维的Y空间代替高维的x空间所损失的信息很少。即：使只有一个主成分Yl(即 m＝1)时，这个Yl仍是使用全部X变量(p个)得到的。例如要计算Yl的均值也得使用全部x的均值。在所选的前m个主成分中，如果某个Xi的系数全部近似于零的话，就可以把这个Xi删除，这也是一种删除多余变量的方法。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 138

主成分分析主要有以下几方面的应用 2．有时可通过因子负荷(uij)的结构，弄清X变量间的某些关系。 3. 多维数据的一种图形表示方法。我们知道当维数大于3时便不能画出几何图形，多元统计研究的问题大都多于3个变量。要把研究的问题用图形表示出来是不可能的。然而，经过主成分分析后，我们可以选取前两个主成分或其中某两个主成分，根据主成分的得分，画出n个样品在二维平面上的分布况，由图形可直观地看出各样品在主分量中的地位。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 139

主成分分析主要有以下几方面的应用 4．由主成分分析法构造回归模型。即把各主成分作为新自变量代替原来自变量x做回归分析。 5．用主成分分析筛选回归变量。回归变量的选择有着重要的实际意义，为了使模型本身易于做结构分析、控制和预报，好从原始变量所构成的子集合中选择最佳变量，构成最佳变量集合。用主成分分析筛选变量，可以用较少的计算量来选择量，获得选择最佳变量子集合的效果。 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 140

Matlab: 主成分分析求特征值：eig 排序：sort pca Wei-Shi Zheng 3/3/2017, Page 141 wszheng@ieee.org 3/3/2017, Page 141

矩阵的奇异值分解 (SVD) 奇异值分解则半正定阵的特征值称为 A 的奇异值。定理：设其中则存在正交阵使得

矩阵的奇异值分解 (SVD) 其中V 是正交阵。令

矩阵的奇异值分解 (SVD) 由前式可知其中

矩阵的奇异值分解 (SVD) 扩充成交阵把即求解方程的基础解系，再规范正交化即得

矩阵的奇异值分解 (SVD) 例、求的奇异值分解。

矩阵的奇异值分解 (SVD) 解：

矩阵的奇异值分解 (SVD) 标准正交化:

矩阵的奇异值分解 (SVD)

矩阵的奇异值分解 (SVD) 例6、求的奇异值分解。

矩阵的奇异值分解 (SVD) 解：

矩阵的奇异值分解 (SVD)

矩阵的奇异值分解 (SVD)

SVD应用-图像压缩对于一幅用像素矩阵表示的图像，如果传送所有个数据，显然数据量太大。因此我们希望传送少一些的数据，并且在接收端还能重构原图像。如果我们从矩阵的SVD中选择个奇异三元组来逼近原图像，即用个数值代替像素矩阵。那么在接收端，我们可得到

从而在接收端近似地重构出原图像。此时，图像的压缩比为 SVD应用-图像压缩从而在接收端近似地重构出原图像。此时，图像的压缩比为

SVD应用-图像压缩

SVD应用-图像压缩

SVD应用-图像压缩

SVD应用-图像压缩

SVD应用-图像压缩

进一步学习后续基础课程：多元统计，高等统计学（数计学院）后续专业课程：模式识别、机器学习、（现代）数字图像处理、生物信息学、人工智能 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 161

回顾开头的例子 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 162

回顾开头的例子假设每个被检测的人第n时刻的位置是xn n+1时刻的位置xn+1有如下的建模：马尔可夫性多元统计分析 Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 163

Exercise I: ：最高成绩得分100 1.下载阅读论文： 2. 对ORL数据库，自行设计一套人脸识别算法 Title: Face recognition using eigenfaces (http://www.cs.ucsb.edu/~mturk/Papers/mturk-CVPR91.pdf) Authors: M. Turk and A. Pentland CVPR 1991 参考：http://scholar.fju.edu.tw/%E8%AA%B2%E7%A8%8B%E5%A4%A7%E7%B6%B1/upload/058029/content/991/D-7604-07699-E.pdf 2. 对ORL数据库，自行设计一套人脸识别算法

作业要求自行分组，每组最多5人作业打印 9月22日，由各班班长收集作业，交到学院413房间，找李翔同学每组成员给出各自的贡献比例抄袭上届作业者，本次作业为0分（上届有过） Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 165

That is all! 谢谢大家！ Wei-Shi Zheng wszheng@ieee.org 3/3/2017, Page 166