主成分分析专题 Principal Component Analysis(PCA)

Slides:



Advertisements
Similar presentations
校园及周边治安防范 暨应急预案桌面演练 实 训 乐山应急管理学会 贾 伟. 目 录 校园治安问题包含的内容 校园治安问题的特点 避免引发校园治安问题的对策 校园应急预案桌面演练实训 校园治安问题的成因.
Advertisements

“ 我不能 上学了,我 每天还要帮 家里拾柴火 呢。 ” 给远方的小学生写一封信 书信的基本格式: 开头顶格写称呼,打上冒号; 换行空两格写问候语; 接下来换行空两格写正文部分; 正文结束后,换行写祝颂语; 最后在右下方写上寄信人姓名和 写信日期。
电话: XXXXX 主讲: XXXXX 任务五 组织旅游线路. 本节任务:设计一条旅游线路 休闲度假天堂游 早烟台集合,乘车赴蓬莱,游览人间仙境 — 蓬莱阁风景区 ( 1.5 小时)、水城、古船馆、八仙群雕。 第一天 然后自由活动或自费游览:八仙渡海口风景区( 60 元自 理)海洋极地世界( 120.
中醫藥就醫用藥 - 婦女篇 中醫藥安全衛生教育資源中心 中醫藥就醫用藥百分百、就是藥做到: 停、看、聽、選、用專業.
下背痛 林口長庚醫院內科 住院醫師 毛畯台. 下背痛常見原因 軟組織受傷/背部筋膜發炎 椎間盤突出症 脊椎退化性關節炎 壓迫性骨折 椎間盤滑脫 惡性腫瘤 泌尿道疾患 姿勢不良.
華德學校上午校 「協助小學中國語文科教師建立專業學習型社群」計劃 (2008) 總結分享會 二零零九年一月十日.
園藝二乙 1 號 丁楷儒 32 號 孫子恩. 1. 福山萵苣 ( 大陸妹 ) : 福山萵苣,萵苣家族成員之一,鮮甜脆綠又帶有萵苣類的 特殊苦味,用來代替生菜搭配烤肉也別具風味。極少病蟲 害,只需定時澆水施肥就能健康長大,是相當容易種植又 能有大收穫的蔬菜 。 感想: 雖然大陸妹好吃又好種,但種了太多而吃不完.
营养俱乐部零售 & 接待客人技巧详解. 成功销售的必要条件 自信心 (自信来自专业,有自信才有气势) 得宜的穿着打扮 (必要的化妆) 注意坐的位置及环境 工具备妥当 (秤,相片簿,细心关怀表,量尺 … ) 足够的产品.
社交礼仪.
第五单元 口语交际和作文.
第八章 負債 8-1 負債之意義及內容 8-2 流動負債 8-3 長期負債 8-4 其他負債.
工业财务状况表 财务部分培训 (2010年年报).
報告者:蕭曄鴻 班級:溫馨甲孝 指導教授:李開濟博士
單元名稱: 健康的兩性交往.
定海区渔农村集体资产 股份合作制改革工作 档案管理培训班
《中国共产党发展党员工作细则》 学习提纲 中共进贤县委组织部 宋 剑
严格发展程序,提高工作能力 黄 玉 2010年9月.
述 职 报 告 ——报告人:xxxxx.
北京市工作居住证办理讲解.
上海体育职业学院 祁社生 一、重视体育科研在提高竞技运动训练水平中的意义和作用
XX市公安局政治部 为XX公安队伍提供强有力的心理素质保障
成品成本计算 鞠传英.
机电设备概论 安全管理概述 XXXXX.
祝贺您获得国家留学基金资助 请您登陆“国家留学网”查看《出国留学人员须知》,您在出国前及在外学习期间所需要办理的手续及具体流程,以及可能遇到的政策上疑问均在此《须知》上有所列明。
实际问题与一元二次方程(一).
医师变更执业注册申请审核表 填写说明 医务部.
审题与立意 夏邑高中高四语文组.
论文撰写的一般格式和要求 孟爱梅.
习作一 作文的一般写法.
述职报告 ( 二○○七年度 ) 述职人: xxx 部 门: 计划财务部 岗 位: 部门经理.
转正述职报告 电商文案策划 XXX.
經濟部工業局 產業升級創新平台輔導計畫 (創新優化計畫)
基层违纪违法案件 查办的基本程序 基本要求和案例解析 学 思 践 悟 基层违纪违法案件 查办的基本程序 基本要求和案例解析 内蒙古纪委案件审理室 方瑛 2015年5月24日.
护患沟通技巧 护理部 马红云.
一、會計循環之意義 二、會計憑證概要 三、日記簿概要 四、分類帳概要
几种常见应用文体示例.
思想道德修养与法律基础 主讲人:XXX.
2015年中国微生物学会学术年会 墙报题目 图 1 图 2 图3 中国微生物学会 安琪酵母股份有限公司 三峡大学
特种设备安全法简介 中原油田分公司 杜习广 2015年4月 视频.
马街乡综治维稳工作情况汇报 汇报人:xxx.
組員:簡年佑組員:xxx 組員:xxx組員:xxx
第三課 宗教(倫理)的獨特向度 單元 3.2 全球倫理:兩項原則和四項座右銘
通病文章 休 闲   今天天气真好,晴空万里,天上飘着朵朵白云。(偶可从没见过这样的情景^_^)我和同学小刚一起骑车去上学,突然他的车气门芯坏了,我就把我车上的拔下来给他装上,我俩继续一起高高兴兴地骑车往学校赶。(原来“我”的自行车可以不用气门芯啊^_^)   我们经过一家百货商店时,我不禁感慨道:啊!看来人民生活水平的确提高了,你看那位农民老大爷,左手一台电冰箱,右手一台电视机,一溜小跑回家去了。(比周星弛在《功夫》里还要厉害?!)都说一心不能二用,当我注视老大爷的时候,冷不丁岔道里冲出来一位老太太,说
科學與科技課程 教師分享會 二OO四年五月七日.
初中《思想品德》课程改革 回顾·现状·展望
应如何深化普通高中学生综合素质评价 北京教科院基础教育研究所 赵学勤 2010、12、14-15.
赵德成 北京师范大学教育管理学院 让教师成为研究者 赵德成 北京师范大学教育管理学院
《社交礼仪分享》 阳晨牧业科技有限公司 市场中心 二O一二年四月十八日.
追问课堂,寻求效益 —有效教学的几点思考 牟平区实验小学 战丽娜.
电商2班 第五组. 电商2班 第五组 小组成员: 组长:汤昀 成员:杨阳、陆萍、邹斯斯、吴晓庆、吴盈盈.
陈 汉 文 厦门大学会计系 主任 经济学教授 博士生导师
建设工程档案编制组卷范例 北京市城建档案馆.
我真的很不想活,日子過得太沒有意思了。. 我真的很不想活,日子過得太沒有意思了。 聽起來,你現在的日子真難熬,你 願意說說看為什麼嗎?
让道德之花越开越鲜艳 主讲 xxx.
老员工心态管理.
平昌县泥龙初中校本培训 中小学微型课题研究
二、感谢信的种类 根据寄送对象不同,感谢信可以分为三种: 1、直接寄送给感谢对象; 2、寄送对方所在单位有关部门或在其单位公开张贴; 3、寄送给广播电台、电视台、报社、杂志社等媒体公开播发。
热烈祝贺医院开业.
传媒学院2013年度团委工作 总结分析报告
產品責任險的意義 想一想,什麼是「產品責任險」? Q
主成分分析的原理 主成分分析的解法 主成分分析方法应用实例
奔跑吧! 2015 年终总结汇报暨新年计划 精美实用、框架完整的年终总结、工作汇报、新年计划PPT.
古诗鉴赏.
第九章 結 帳 9-1 了解結帳的意義及功能 9-2 了解虛帳戶結清之會計處理 9-3 了解實帳戶結轉的會計處理
認識多項式 1 多項式的加法 2 多項式的減法
判別下列何者是 x 的多項式。以「○」表示是x的多項式,「×」表示不是 x的多項式 :
107年度 主計業務宣導及教育訓練 報告人:主計室賴美燕組長
中国大连高级经理学院博士后入站申请汇报 汇报人:XXX.
第十一章 應付公司債與長期應付票據 11-1 公司債之性質及分類 11-2 應付公司債之會計處理 11-3 分期還本公司債
實習學生:陳姵儒 指導教授:潘明全 實習單位:戴正彥升大學中心
Presentation transcript:

主成分分析专题 Principal Component Analysis(PCA) 2019/5/3 知识管理与数据分析实验室

原理 将原来众多具有一定相关性(比如 P 个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。 做法:选取方差最大的,作为第一个指标,因为方差越大包含的信息越多。依次找出替代原指标的主要指标。

1)对原始数据矩阵进行标准化处理 相当于对原始变量进行坐标平移与尺度伸缩: 求解步骤 1)对原始数据矩阵进行标准化处理 相当于对原始变量进行坐标平移与尺度伸缩: 2)求协方差矩阵Z

3) 计算特征值与特征向量: 相当于将原来的坐标轴进行旋转得到新的坐标 轴 ▲ 解特征方程    ,常用雅可比法(Jacobi)求出特征值,并使其按大小顺序排列 ; ▲分别求出对应于特征值 的特征向量   ,要求   =1,即     ,其中 表示向量 的第j个分量。 ­特征值表示新变量(主成分)方差的大小 ­得到的特征矢量的方差比前一个特征矢量的更小,也就是依次递减 ­特征矢量相互正交,即不相关

4) 计算主成分贡献率及累计贡献率 ▲贡献率: ▲累计贡献率: 5) 计算主成分载荷 一般取累计贡献率达85—95%的特征值 所对应的第一、第二、…、第m(m≤p)个主成分。 5) 计算主成分载荷

6) 求主成分得分-新的变量值 Z阵的每一行相当于原数据矩阵的所有行(即原始变量构成的向量)在主成分坐标轴(载荷轴)上的投影,这些新的投影构成的向量就是主成分得分向量。

主成分分析方法应用实例 下面,我们根据下表给出的数据,对某农业生态经济系统做主成分分析 。 某农业生态经济系统各区域单元的有关数据

步骤如下:(1)将上表中的数据作标准差标准化处理,然后计算相关系数矩阵(见下表)。

(2)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率。可知,第一,第二,第三主成分的累计贡献率已高达86 (2)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率。可知,第一,第二,第三主成分的累计贡献率已高达86.596%(大于85%),故只需要求出第一、第二、第三主成分z1,z2,z3即可。 特征值及主成分贡献率

(3)对于特征值=4.6610,=2.0890,=1.0430分别求出其特征向量e1,e2,e3,再用公式计算各变量x1,x2,…,x9在主成分z1,z2,z3上的载荷。

分析 ①第一主成分z1与x1,x5,x6,x7,x9呈显出较强的正相关,与x3呈显出较强的负相关,而这几个变量则综合反映了生态经济结构状况,因此可以认为第一主成分z1是生态经济结构的代表。 ②第二主成分z2与x2,x4,x5呈显出较强的正相关,与x1呈显出较强的负相关,其中,除了x1为人口总数外,x2,x4,x5都反映了人均占有资源量的情况,因此可以认为第二主成分z2代表了人均资源量。

③第三主成分z3,与x8呈显出的正相关程度最高,其次是x6,而与x7呈负相关,因此可以认为第三主成分在一定程度上代表了农业经济结构。 ④另外,表最后一列(占方差的百分数),在一定程度反映了三个主成分z1、z2、z3包含原变量(x1,x2,…,x9)的信息量多少。 显然,用三个主成分z1、z2、z3代替原来9个变量(x1,x2,…,x9),描述农业生态经济系统,可以使问题更进一步简化、明了。

主成分分析的优缺点 」它能找到表现原始数据阵最重要的变量的组合 」通过表示最大的方差,能有效地直观反映样本之间的关系 」能从最大的几个主成分的得分来近似反映原始的数据阵的信息 〤当主成分的因子负荷的符号有正有负时,综合评价函数意义就不明确 〤命名清晰性低 〤新的变量是原始变量的线形组合,有局限

Spss中操作 数据源 book1

因子载荷矩阵

程序的实现 具体见源代码演示