多元统计分析及R语言建模 第9章 因子分析及R使用 王斌会 教授.

Slides:



Advertisements
Similar presentations
高等数学( XJD ) 第二章 导数与微分 返回 高等数学( XAUAT ) 高等数学( XJD ) 求导法则 基本公式 导 数 导 数 微 分微 分 微 分微 分 求导方法 高阶导数 微分法则 导数与微分关系图导数与微分关系图.
Advertisements

一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
第五节 全微分方程 一、全微分方程及其求法 二、积分因子法 三、一阶微分方程小结. 例如 所以是全微分方程. 定义 : 则 若有全微分形式 一、全微分方程及其求法.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
第二章 导数与微分 习题课 主要内容 典型例题 测验题. 求 导 法 则求 导 法 则 求 导 法 则求 导 法 则 基本公式 导 数 导 数 微 分微 分 微 分微 分 高阶导数 高阶微分 一、主要内容.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
第三节 微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出 实例 : 正方形金属薄片受热后面积的改变量.
2012 年长春高新技术产业股 份(集团)有限公司 小组成员:胡佳英 杨玲 陈依云 骆朱岚. 长春高新技术产业集团概况 : 年末流动资产合计( ) 年末流动负债合计( ) 存货( 0 ) 经营活动产生的现金流量净额( ) 资产总额(
项目名称: 公司名称:上海 有限公司 logo: 网站:
信号与系统 第三章 傅里叶变换 东北大学 2017/2/27.
情境12 会计报表分析.
企业经营管理基础 模块一 企业组织结构概述 模块二 采购管理 模块三 生产管理 模块四 销售管理 模块五 仓储管理 模块六 人力资源管理
第八章 现代企业财务管理 第一节 企业财务管理内容与原则 第二节 资金筹集与资产管理 第三节 成本与利润管理 第四节 财务报表分析.
房地产投资的财务分析 财务分析概述 资金等效值的计算 财务评价基本报表 房地产投资的财务分析指标.
第七章 综合财务分析.
第六章 主成分分析与因子分析 6.1 主成分分析 6.2 因子分析.
20个常用财务指标 判断短期偿债能力的两大财务指标: 1, 流动比率=流动资产/流动负债>1
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
证券投资技术分析.
因子分析与地质成因解释 (Factor Analysis)
参见郭志刚主编,《社会统计分析方法—SPSS软件应用》
《高等数学》(理学) 常数项级数的概念 袁安锋
第七章 固定资产 本章结构 固定资产的性质与分类 固定资产的增加 固定资产的折旧 固定资产的修理 固定资产的减少
常用逻辑用语复习课 李娟.
第七章 因子分析 第一节 引言 第二节 因子分析模型 第三节 因子载荷矩阵求解 第四节 公因子重要性的分析 第五节 实例分析与计算机实现.
财务绩效评价计分方法 1、基本指标计分 财务绩效定量评价的基本指标计分是按照功效系数法计分原理,将评价指标实际值对照相应行业标准值,按照规定的计分公式计算各项基本指标得分。    (1)单项指标得分= 本档基础分 调整分 + 本档基础分=指标权数×本档标准系数 功效 系数 实际值-本档标准值 调整分=
例题 教学目的: 微积分基本公式 教学重点: 牛顿----莱布尼兹公式 教学难点: 变上限积分的性质与应用.
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第二节 微积分基本公式 1、问题的提出 2、积分上限函数及其导数 3、牛顿—莱布尼茨公式 4、小结.
§5.3 定积分的换元法 和分部积分法 一、 定积分的换元法 二、 定积分的分部积分法 三、 小结、作业.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
定积分习题课.
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
全 微 分 欧阳顺湘 北京师范大学珠海分校
第三章 导数与微分 习 题 课 主要内容 典型例题.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
主成分分析方法 主成分分析的基本原理 主成分分析的计算步骤 主成分分析方法应用实例.
§3.7 热力学基本方程及麦克斯韦关系式 热力学状态函数 H, A, G 组合辅助函数 U, H → 能量计算
辅导课程六.
计算机数学基础 主讲老师: 邓辉文.
二.换元积分法 ò ( ) (一)第一类换元积分法 1.基本公式 把3x当作u,“d”后面凑成u 2.凑微分 调整系数 (1)凑系数 C x
What have we learned?.
数学模型实验课(三) 插值与三维图形.
第十章 方差分析.
数据挖掘工具性能比较.
实验十 SPSS 因子分析.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
C语言程序设计 主讲教师:陆幼利.
第二十二章 曲面积分 §1 第一型曲面积分 §2 第二型曲面积分 §3 高斯公式与斯托克斯公式.
线性规 Linear Programming
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
第五节 对坐标的曲面积分 一、 对坐标的曲面积分的概念与性质 二、对坐标的曲面积分的计算法 三、两类曲面积分的联系.
实体描述呈现方法的研究 实验评估 2019/5/1.
例7.1 (主成分分析) xi :5支股票的周回报率 x1 :JP Morgan x2 :Citibank x3 :Wells Fargo
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第4课时 绝对值.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
昆明理工大学先进计算软件技术与应用云南省创新团队昆明理工大学计算机应用重点实验室
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
概率论与数理统计B.
§2 方阵的特征值与特征向量.
教学大纲(甲型,54学时 ) 教学大纲(乙型, 36学时 )
第十七讲 密码执行(1).
数学模型实验课(二) 最小二乘法与直线拟合.
Presentation transcript:

多元统计分析及R语言建模 第9章 因子分析及R使用 王斌会 教授

多元统计分析及R语言建模 第9章 因子分析及R使用 plot(1:100)

多元统计分析及R语言建模 内容与要求 第9章 因子分析及R使用 内容: 要求: 因子分析模型的基本思想,与主成分分析的区别。 数学模型,基本假定,因子载荷阵的估计方法,因子旋转,因子得分。 因子旋转和因子得分的实际统计意义和数学表达式。 计算程序中有关因子分析的算法基础。 内容与要求 要求: 了解因子分析的目的和实际意义。 熟悉因子分析数学模型建模的假设条件和各个分量的实际统计意义。 掌握由主成分方法估计因子载荷阵的推导步骤,以及重要的基本性质。 能够利用计算软件编程解决实际问题中的因子分析问题,给出统计分析报告。

9 因子分析及R使用 区别与联系 9.1 因子分析的思想 区别 联系 主成分分析通过线性组合将原变量综合成几个主成分,用较少的综合指标来代替原来较多的指标。因子分析通过构筑若干意义较为明确的公因子,并以它们为框架分解原变量考察原变量间的联系与区别。 主成分分析是“变异数”导向的方法,因子分析是“共变异数”导向的方法。 区别与联系 联系 因子分析是主成分分析的推广,也是一种把多个变量化为少数几个综合变量的多变量分析方法。

9 因子分析及R使用 特点与用途 9.1 因子分析的思想 特点 用途 因子分析把众多的指标综合成几个为数较少的公共指标,即因子。其特点是: 因子变量的数量远远少于原始变量的个数; 因子变量并非原始变量的简单取舍,而是一种新的综合; 因子变量之间没有线性关系; 因子变量具有明确的解释性,可以最大限度地发挥专业分析的作用。 特点与用途 用途 因子分析主要用途: 减少分析变量个数; 通过对变量间相关关系探测,将原始变量进行分类。

9 因子分析及R使用 模型提出 9.2 因子分析模型 基本思想 Q型与R型因子分析 因子分析是将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,每一类变量代表了一个基本结构,即公共因子。 对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。 模型提出 Q型与R型因子分析 研究样品间的相互关系的因子分析称为Q型因子分析, 研究变量间相互关系的因子分析称为R型因子分析。 本章主要讨论并运用的是R型因子分析。

9 因子分析及R使用 9.2 因子分析模型 因子分析模型:

9 因子分析及R使用 9.2 因子分析模型 因子分析模型:

9 因子分析及R使用 9.3 因子载荷的估计及解释 因子载荷的估计 要建立实际问题的因子模型,关键是要根据样本数据估计因子的载荷矩阵,其中使用最为普遍的方法是主因子法(也称主成分法)。 主因子估计法 极大似然估计法 因子载荷估计方法 因子载荷的统计意义 因子载荷aij表示xi依赖Fj的程度,其值越大,依赖程度越大。

9 因子分析及R使用 9.3 因子载荷的估计及解释 因子分析函数factanal()的用法 注:该函数是基于极大似然方法来求解的。 factanal(X,factors,scores=c("none", "regression","Bartlett"), rotation="varimax", ...) 自编因子分析函数factpc()的用法 注:该函数是基于主因子方法来求解的,该函数对数据的分布要求不高。 factpc<-function(X,m=2,scores = c("none", "regression"), rotation="varimax")

9 因子分析及R使用 9.3 因子载荷的估计及解释 【例9.1】水泥行业上市公司经营业绩因子模型实证分析 评价指标的选择 评价指标的选择  盈利能力:主营业务利润率、净资产收益率、销售毛利率和净值报酬率 偿债能力:流动比率、速动比率、现金比率、资产负债率 发展能力:主营业务收入增长率、营业利润增长率、净利增长率 2. 数据整理和标准化

9 因子分析及R使用 9.3 因子载荷的估计及解释 【例9.1】水泥行业上市公司经营业绩因子模型实证分析 3. 计算相关系数矩阵 3. 计算相关系数矩阵 #在mvstats4.xls: d9.1中选取A1:G15区域,然后拷贝 主营业务利润率x1与销售毛利率x2呈高度正相关,速动比率x3与资产负债率x4呈较强的负相关。主营业务收入增长率x5和营业利润增长率x6呈中度相关关系。为了消除各财务指标之间的相关性,采用因子分析方法并提取因子。 X=read.table("clipboard",header=T) cor(X)

9 因子分析及R使用 9.3 因子载荷的估计及解释 【例9.1】水泥行业上市公司经营业绩因子模型实证分析 4. 计算特征值、因子载荷及共同度 #极大似然法因子分析 (FA0=factanal(X,3,rot="none"))

9 因子分析及R使用 9.3 因子载荷的估计及解释 【例9.1】水泥行业上市公司经营业绩因子模型实证分析 4. 计算特征值、因子载荷及共同度 #主成份法因子分析 library(mvstats) (Fac=factpc(X,3))

9 因子分析及R使用 9.4因子旋转方法 旋转目的 建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个主因子的意义,以便对实际问题进行分析。 如果求出主因子后,各个主因子的典型代表变量不很突出,还需要进行因子旋转,通过适当的旋转得到比较满意的主因子。 使因子载荷矩阵中因子载荷的绝对值向0和1两个方向分化,使大的载荷更大,小的载荷更小。

9 因子分析及R使用 9.4因子旋转方法 旋转方法 因子旋转的方法有很多,最常用的方法是最大方差正交旋转法(Varimax)。 正交旋转 斜交旋转 最大方差正交旋转法(Varimax) Promax法

9 因子分析及R使用 9.4因子旋转方法 【例9.2】对例9.1的应用极大似然法因子进行旋转

9 因子分析及R使用 9.4因子旋转方法 【例9.2】对例9.1的应用极大似然法因子进行旋转 旋转前各综合因子代表的具体经济意义不很明显; 旋转后各因子代表的经济意义则十分明显。

9 因子分析及R使用 9.4因子旋转方法 【例9.2】对例9.1的应用极大似然法因子进行旋转 #varimax法旋转因子分析 (Fa1=factanal(X,3,rot="varimax"))

9 因子分析及R使用 9.5因子得分计算 因子得分函数 因子分析模型建立后,还有一个重要的作用是应用因子分析模型去评价每个样品在整个模型中的地位,即进行综合评价。 因子得分函数 回归估计法 Bartlett估计法 因子得分估计方法

9 因子分析及R使用 9.5因子得分计算 【例9.3】(续例9.1)对例9.1的因子计算因子得分 #使用回归估计法的极大似然法因子分析 Fa1=factanal(X,3,scores="regression") Fa1$scores

9 因子分析及R使用 9.5因子得分计算 【例9.3】(续例9.1)对例9.1的因子计算因子得分 #使用回归估计法的主成份法因子分析 Fac1=factpc(X,3,scores="regression") Fac1$scores

9 因子分析及R使用 9.6因子分析的步骤 1 2 3 4 因子分析的步骤 确认待分析的原变量是否适合作因子分析。 构造因子变量。 利用旋转方法使因子变量更具有可解释性。 4 计算因子变量得分

9 因子分析及R使用 9.6因子分析的步骤 因子分析的计算过程 1 2 3 4 5 6 7 8 9 原始数据标准化 求标准化数据的相关矩阵 求相关矩阵的特征值和特征向量 4 计算方差贡献率与累积方差贡献率 5 确定因子 6 因子旋转 7 用原指标的线性组合来求各因子得分 8 综合得分 9 得分排序

9 因子分析及R使用 9.6因子分析的步骤 【例9.4】对例9.1数据计算综合因子得分,对水泥行业进行综合评价 #因子得分作图与排名 factanal.rank(Fa1,plot=T)

9 因子分析及R使用 9.6因子分析的步骤 信息重叠图函数 biplot(scores, loadings...) 例子 #前2个因子信息重叠图 biplot(Fa1$scores,Fa1$loadings)

9 因子分析及R使用 9.6因子分析的步骤 【例9.5】 (续例7.2和例8.2) #在mvstats.xls:d7.2中选取A1:I32区域,然后拷贝 X=read.table("clipboard",header=T) #读取例7.2数据 library(mvstats) Fac0=factpc(X,3) #因子分析 Fac0$Vars #方差及贡献率

9 因子分析及R使用 9.6因子分析的步骤 【例9.5】 (续例7.2和例8.2) Fac1=factpc(X,3,rot="varimax") #运用旋转因子分析 Fac1$Vars #方差及贡献率

9 因子分析及R使用 9.6因子分析的步骤 【例9.5】 (续例7.2和例8.2) 公共因子在原始变量上的载荷值不太好解释,故对其进行因子旋转(方差最大化正交旋转)。

9 因子分析及R使用 9.6因子分析的步骤 【例9.5】 (续例7.2和例8.2) Fac0$loadings #因子载荷

9 因子分析及R使用 9.6因子分析的步骤 【例9.5】 (续例7.2和例8.2) 有了各个公共因子合理的解释,结合各个省、市、区在三个公共因子上的得分和综合得分,就可以对各省、市、区的综合人均消费水平进行评价了。

··· ··· 9 因子分析及R使用 9.6因子分析的步骤 【例9.5】 (续例7.2和例8.2) 回归法估计出因子得分 Fac1$scores #因子得分 Fac1$Rank #排名 ··· ···

9 因子分析及R使用 9.6因子分析的步骤 【例9.5】 (续例7.2和例8.2) plot.text(Fac1$scores) #因子得分图 biplot(Fac1$scores,Fac1$loading) #信息重叠图

9 因子分析及R使用 9.7实际中如何进行因子分析 1 2 3 4 5 6 7 因子分析的步骤 问题的定义 一个完整的因子分析过程应当包含如下方面: 2 选择因子分析的方法 3 确定因子数目 4 因子旋转 5 因子解释 6 因子得分 7 因子分析的意义