因素分析方法的整合 ---- 结构效度的一种计算方法.

Slides:



Advertisements
Similar presentations
簡介 …………………………p.1 健康新天地 ………………….p.2 小食餐單 …………………….p.3 士多啤梨 蘋果 之營養 p.4 蕃茄 葡萄之營養 p.5 鮮奶的益處 ………………….p.6 有關圖片...…………………..p.7 總結.
Advertisements

中医特色疗法及其在临床 中的应用 静乐县中医院 主治中医师 曹怀奎. 中药熏洗疗法是根据中医辨证论治的原则,依据疾 病治疗的需要,选配一定的中药组成熏蒸方剂,将中药 煎液趁热在皮肤或患处进行熏蒸、熏洗,而达到治疗效 果,是一种祖国医学最常用的传统外治方法。
index 目次 ( 請按一下滑鼠,解答就會出現喔 !) 接續下頁解答 3-1 極限的概念.
猜谜语 有个小娃娃,真是没 礼貌。 见到小树摇一摇,吓 得树叶哇哇叫。 见到小花逗一逗,摘 去她的太阳帽。 没人和它交朋友,只 好自已到外处跑。
毛周角化症的植物护理. 引 言 —— 本课题的必要性和可信度  目前 美容市场常用毛周角化症的护理方法:自行使 用去角质沐浴用品,像是磨砂膏、去角质刷、丝瓜 布等等。适度的去角质有一定的帮助,但过头就会 造成皮肤的伤害。过度的摩擦不只会使皮肤受伤, 还会使角质层变得更厚。  我们小组设计了一套天然植物的毛周角化症护理,
鼻后孔阻塞综合征 程靖 1 、吴小海 2 1. 广东药学院附属第一医院(临床医学院) 耳鼻咽喉科学教研室 广州 广东药学院附属第二医院耳鼻咽喉科.
项目一:准备出库 出入库作业实务. 学习目标 1 .掌握出库的基本要求 2 .理解货物出库的依据和基本方法 3 .明确出库的作业流程 4 .能按要求完成货物出库前的准备工作 ,能计算出库货物的仓容,安排调配装 卸机具 5 .会填写各种出库单证 6 .掌握货物出库的各种方式.
张 猛,陕西安康人。 振东健康培训经理。 曾任教育培训师、保健品营销主管等职务。 从事中药保健养生护理用品研发工作 3 年,带领团 队完成 4 项课题 10 个产品的研发工作.
第三节 特殊饮食的护理 一、鼻饲法 目的 准备 操作步骤 注意事项 鼻饲法是将导管经鼻腔 插入胃内,从管内注入 流质食物、营养液、水 分和药物的方法。
小儿脑性瘫痪 广州中医药大学第二临床医学院 针灸教研室 樊莉. 概述 定义:指由于大脑在尚未成熟阶段受到损 伤所导致的运动障碍和姿势障碍,可伴有 智力低下、惊厥、听觉与视觉障碍、学习 困难等。是一种非进行性中枢性运动功能 障碍。 发病率为 1.3% ,男多于女。 属中医 “ 五软 ” 、 “ 五迟.
Chapter Five 效度:基本概念.
2013执业医师考试辅导 —卫生法规.
小荳荳-義大利麵 組員: 顏瑄誼.林欣嫻.李昱暄.黃珮瑜.潘錡..
第二节 散剂的特点及制备 散剂:系指药物或与适宜的辅料经粉碎、均 匀混合制成的干燥粉末状制剂,分为 口服散剂和局部用散剂。 特点 :①起效快 ②相对比较稳定 ③制法简 单 ④应用方式灵活 ⑤不宜制成散剂 的药物.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
成为顾客贴心、老板放心的金牌服务人员 ——顾客服务案例培训
Basic concepts of structural equation modeling
現在最幸福 (Lee 上) 曹宇.
关 爱 老 人 关 爱 健 康 第八章 老年人呼吸系统的变化及护理.
詹天佑.
春季是细菌、病毒繁殖滋生的旺季,肝脏具有解毒、排 毒的功能,负担最重,而且由于人们肝气升发,也会引起旧 病复发,如春季肝火上升,会使虚弱的肺阴更虚,故肺结核 病会乘虚而入。中医认为,春在人体主肝,而肝气自然旺于 春季。如果春季养生不当,便易伤肝气。为适应季节气候的 变化,保持人体健康,在饮食调理上应当注意养肝为先。
吸烟有害健康 课题调查报告 无锡市新安中学初三(4)班.
健管之刊 ——处暑养生 健 康 管 理 部 第十四期.
7.5 乳化作用.
第二章 因素分析 陳順宇 教授 成功大學統計系.
國立彰化師範大學教育研究所 學校行政碩士班 碩士論文
红花酒精湿敷 用于乳腺癌术后皮瓣坏死的新进展.
口服给药术 南通大学护理学院基础护理教研室.
实验四 果蝇培养、麻醉及雌雄鉴别 一 实验目的
保良局方王錦全小學 學校健康促進經驗分享    盧淑宜校長.
大家都来关注国家安全 南京市江宁中学 傅德柱.
猪生产与综合实训 授课教师:徐元青 联系电话:
月经不调的简易 分类诊断与治疗.
月经生理.
产后出血 定义:胎儿娩出后24小时内阴道出血≥500ml,称产后出血。 一、病因
第二章 人体的营养 第一节 食物中的营养物质. 第二章 人体的营养 第一节 食物中的营养物质.
中醫療法解決失眠問題 指導老師: 林儒禮 報告人:呂佳祐 謝宜璟
多變量分析 Multivariant Analysis
血液循环的意义:在人的体内循环流动的血液,可以把营养物质输送到全身各处,并将人体内的废物收集起来,排出体外。促进人的新陈代谢。
第一节 食物 一、食物中含有多种营养成分.
第 6 章 温里剂.
单位:临朐县龙岗镇上林初中 作者:王晓英 王复刚 课时量:1课时 适合学段:初中
碳水化合物、蛋白质、脂肪、无机盐、维生素、水
Structural Equation Modeling
营养早餐 小组成员:李鸿磊.官鸿铭.李智恒.梁振.徐林焰.林禧.胡喜燕.黄晟.林梦舒.徐锦海.陈莹、陈斯杭。
课件 第 三 单 元 物质构成的奥秘 课 题 1 分子和原子(1) 华池县五蛟初中 张诚
的蒸气压增大到与外界压力相等时,就有大量气泡从液体内部逸出,即液体开始沸腾。这时的温度称为液体的沸点。 纯粹的液体有机化合物在一定的压力下具有恒定的沸点(沸程 ℃)。液体有机化合物含有水等杂质时,沸点通常会降低,沸程变宽。据此我们可以测定纯液体有机物的沸点及定性检验液体有机物的纯度。蒸馏还是提.
环境和我们 六年级下册第四单元 温州市水心小学 缪旭春.
儿童饮食卫生习惯.
第四章 测试效度及其 验证方法(一) 湖南师范大学外国语学院 邓 杰 教授.
我国的人民民主专政.
結構方程模式 結構方程模式由測量模型(measurement model)及結構模型(structural model)所組成。
項目分析與探索式因素分析 李茂能, 2007,成大 Fred Li, 2007.
第12章 因素分析  本章的學習主題  1. 因素分析的主要概念及目的 2. 主成份分析與一般因素分析之差異 3. 因素分析轉軸的概念
衛生署公佈台灣地區約有5000人是屬單腳肢體殘障。已知台灣地區約有2,300萬人口。求台灣地區人民的平均腳數?
楊志強 博士 多變量分析在測驗暨量表編製之應用 楊志強 博士
第四章 测试效度及其 验证方法(一) 湖南师范大学外国语学院 邓 杰 教授.
项目五 价格策划.
Development of the Sales Locus of Control Scale
報告人: 吳以雯 指導教授:任維廉教授 報告日期:2011/05/25
§6.7联立方程计量经济学模型的系统估计方法 the Systems Estimation Methods
任务2.3 平板菌落计数.
作者:梁建、樊景立 授課教師:任維廉教授 報告者:黃紹軒
第十七章 因素分析 Factor Analysis 第十七章 因素分析.
从茶叶中提取咖啡因.
2013年广州军区医疗机构 医用耗材及检验试剂集中招标采购
北师大版五年级下册 购物策略.
第三节 多重共线性的检验 本节基本内容: ● 简单相关系数检验法 ● 方差扩大(膨胀)因子法 ● 直观判断法 ● 逐步回归法.
Presentation transcript:

因素分析方法的整合 ---- 结构效度的一种计算方法

传统的因素分析是探索性的因素分析(Exploratory Factor Analysis,以下简 称EFA), 现代统计方法增加了验证性的因素分 析(Confirmatory Factor Analysis,以 下简称CFA)。

一、探索性因素分析(EFA) (一) EFA实施过程中的方法问题 因素分析既是一种重要的数学方法,又是一种理论,它是以心理原子论或机能论为基础的。同时,因素分析也是一种多元分析的方法,即通过对一组测验进行分析,进而发现隐藏在其中的潜在因素。 与其它的统计方法不同,EFA的实施过程中需要研究者作出一系列重要的决策。具体而言,至少有以下6个方面的问题需要考虑。

1. 研究设计问题 (1)对于EFA而言,最重要的设计问题是测量变量的选择问题。公共因素必须包括在测量变量中,且测量变量一定要与研究领域紧密相关。如果测量中包括的变量不充分,公共因素将不具有代表性。更进一步,如果测量的变量与研究目的不相关,将导致假的公共因素的出现。 统计学家建议,测量变量的数目至少应该是公共因素数的3—5倍 。因此,研究者首先应该考虑期望抽取多少公共因素,从而决定设置多少测量变量。

(2)第二个重要的设计问题是样本的选择。研究者必须决定样本的容量大小以及如何抽取样本。统计学家建议,根据测量的变量数决定样本的容量(变量的数目越多,需要的样本容量越大)。关于这一点,也有不同意见。例如,Gorsuch建议,应达到一个测量项目对应5个被试的标准,且样本容量不得少于100。Nunnally和Everitt建议,此比例要达到10∶1。而近期的研究则认为,以上建议是不充分的。主要是因为,样本容量并非测量变量的函数。当公共因素确定过多时,公共贡献率必然提高。因此,即使测量特性好的,被试数也至少要达到200以上。据Comrey 和Lee(1992)研究,在因素分析中,样本容量达到500为非常好,1000或更多则极好。

但样本容量并非影响参数估计的唯一标准。研究者还应该考虑样本的特性。研究者往往根据方便性选取样本,这通常不会出现问题。然而,如果样本过于一致,可能会限制测量的范围,从而导致变量间相关的改变。这种改变会导致因素负荷估计的失真。另外,选择偏差对单个变量而言也会产生项目质量分析的偏差最终出现失真结果。因此,研究者应该选择差异大一些的被试,并使其在测量变量上的方差达到最大。

2.决定EFA是否为合适的研究方法 EFA的目的是以一组更少的公共因素来代表和解释更多的测量变量。也就是说,当研究者希望验证一组测量变量中的潜在变量时,才能使用EFA。 在作出这一决定时,重要的是区别验证潜在结构与数据的归类是不同的。数据归类是用更少的一组组合数据来代替更多的测量变量,而尽量保持原来变量的信息,它并不希望构建原有变量相关系数的结构模型。这一区别是重要的,因为要达到这两个目标需要采取不同的方法。如果目标是寻找简单结构,EFA是合适的;如果目标是数据归类,主成分分析(Principal Components Analysis,以下简称PCA)更加合适。

EFA是建立在公共因素模型之上的,这一模型假定,一系列测量变量之中的每一变量都是一个或多个公共因素和一个唯一性变量的线性函数。公共因素是不能观察的潜在变量,但它会影响多个测量变量并解释它们之间的相关,唯一性因素是那些仅仅影响一个测量变量的潜在变量。通常假定唯一性因素含有两个成分:一个特定的因素成分和测量误差成分。

3.选择适合模型的程序 假如EFA是最合适的方法,接下来就是选择提取因素的程序。应用最广泛的方法有极大似然估计法(Maximum Likelihood,简称ML)、主因素法等等。ML的主要优势在于,它允许计算模型拟合程度指数的更宽的范围。其局限性主要是要服从多元正态分布。否则,结果会出现偏差。

4.确定抽取公共因子的数目 在进行EFA时,研究者必须决定模式中包含的因素数。一般认为,抽取因素太少比抽取因素过多会产生更为严重的误差(Cattell,1978;Thurstone,1947)。经验上的研究支持了这一说法。但不管是多估或是少估因素数,都是不好的。

关于如何确定因素数,其中最著名的是Kaiser 的计算特征值的标准。此法是先计算相关矩阵的特征根,以1为标准,有多少特征值大于1,就有多少个公共因素(Gorsuch,1983)。这一方法具有简单性和客观性。但也存在明显问题:首先,它通常得到误用。很多情况下,用缩减的相关矩阵的特征根代替了非缩减的相关矩阵的特征根。其次,此标准带有机械性。如特征根为1.01就能成为公共素而0.99的则不是。最后,它可能导致过多估计偶尔又会过少估计因素数。另外,采用这种方法时,样本容量也会影响因素数。

另一著名的确定因子数的方法是“碎石检验”(“scree test”)。在这一程序中,先计算相关矩阵的特征值后按照递减的顺序画图,然后检查图形中的“拐点”,处于“拐点”以下的特征根的数目即为因素数。这一程序通常用于非递减的相关矩阵。但这一方法的主观性太强。首先是关于拐点的概念没有明确的定义; 其次,当“碎石图”比较模糊时,没有清晰的拐点,此时难以判断何处是拐点;另外,此法缺少数量上的标准。

第三个确定因子数的方法是“平行分析”。即将来自样本数据的特征值与来自完全随机的模拟数据(当然,样本容量与变量数同真正的样本)的特征值进行比较。在取出相同公共因素的前提下,如果来自样本的公共因素的特征值大于来自随机性数据的特征值,则结果是较为理想的。 另外,还可采用对再生矩阵进行检验的方法;也有人提出,因素数的确定以所有因素的贡献率之和达到总方差的75%至80%为好;还有人认为,因素数应在n/5至n/3之间(n为测量变量的数目)。而且不断有新的方法问世。

5.因素的旋转问题 多于一个因素的EFA模型不存在唯一解,研究者必须从众多恒等的合适解中选择一个单一解。在EFA中最常用的选择标准是塞斯顿(Turstone,1947)提出的“简单结构”(simple structure),他提出了符合简单结构准则的五个条件。他还认为,对于数学上恒等的解集,带有最好的“简单结构”的解应该是最容易解释的、最充满心理意义的和可复制的。

为了获得“简单结构”,对因素进行旋转是必要的。实际上,旋转就是转换因素轴,在转换的过程中,各变量的相对位置没有发生变化,只是参照点改变了,前后的变化仿佛是从不同角度观察同一事物似的。通过转轴使因素负荷都成为正的了,特别是使因素负荷发生了变化。由于值为零的因素负荷数目的增多,形成了简单的结构,这就使得因素更容易辨认、说明与命名。

旋转有正交旋转与斜交旋转的区别。正交旋转,在理论上是假定被分析出来的因素是相互独立的。一些研究者认为正交旋转具有简单性和概念清晰性,但实际并非如此。首先,在心理学研究的建构中(如心理能力、个性倾向、态度),不管是从理论上还是经验中都认为这些建构之间存在相关。其次,因为正交旋转需要因素旋转900,正交旋转可能对于那些存在相关的因素产生较差的简单结构。最后,斜交旋转比正交旋转能提供更多的信息。斜交旋转能提供因素间相关的估计。这对解释公共因素的概念特性是有用的。

为克服上述理论上的缺陷,取得良好的旋转效果,要采用斜交旋转的方法。斜交旋转比正交旋转更常用,因为它不强制因素必须是独立的。斜交旋转产生两个矩阵,模式矩阵和结构矩阵。模式矩阵是一个简单的结构排列,是决定哪一因子代表哪些变量的基础。模式矩阵中包含的因子负荷量通常在研究报告中会给出,“它……反映了因素到变量之间的清楚的关系,这种关系在统计上是独立于任何其它因素的。”(Gorsuch, 1983)。结构矩阵是变量与因素之间的相关系数的矩阵。Gorsuch(1983)相信,两个矩阵对解释因素结构都是必要的。

应当注意的是,斜交旋转允许因素间存在相关,但并不强求因素间一定相关。一种错误的概念是斜交旋转要求因素间相关,实际上并非如此。假如带有最好的简单结构的特定解包含正交因素,那么一个成功的斜交旋转将提供因素间相关接近于0的估计,并产生一组非常类似于正交旋转的解。然而,如果最好的简单结构是带有相关因素的,斜交旋转能提供带有相关因素的解。因此,在心理学研究中采用斜交旋转应该更适合研究对象的特点。

6.因素的命名问题 因素的数目确定以后,接下来的问题就是给所抽取的因素进行命名。实际上,这一问题已超出EFA的范畴,而成为所研究领域的一个专业问题,这是统计学家所无能为力的。 多数研究者是根据自己对在某因素上有高负荷的分测验的心理过程的主观推测来解释该因素。由于用于进行因素分析的分测验的心理意义一般不明显,因而研究者的主观推断往往会带有较大的随意性,不同的研究者对同一测验的心理过程的看法会相距甚远,由此导致对因素解释的任意性。

当然,上述的六个问题并非因素分析本身所固有的,如量表的质量问题、因素的命名问题以及正交或斜交旋转的问题等,关键原因在于研究变量的不同特点。由于教育、心理研究中研究变量的特殊性,教育与心理研究中的数据具有与自然科学研究变量非常不同的特点,因此我们在进行研究时要注意研究方法的适用性。

二、CFA的特点与实施步骤 (一) CFA的特点 由于在社会和行为研究中,许多变量都是不可直接观察的或只是研究者的理论构思,因此模型中多数变量可能属于潜变量。为了使潜变量能有效、可靠地得到表现,就应该对每个潜变量选用多种指标变量进行测量。经抽样测查后,获得一组观测变量的数据和基于此数据而形成的协方差矩阵,这个协方差矩阵是进行验证性分析的基础。

在CFA中,研究者首先要根据已有的经验或其它有关信息判定公共因素数的值,同时还需针对问题的实际情况将模型中的某些参数设定为某一定值。模型一经界定就可根据观测数据的协方差矩阵估计出各个参数,并进行模型对观测数据的拟合性检验。如模型不能被接受,则需要对设定的模型进行修正(王权,2000)。 因此,与EFA不同,CFA的目的是利用变量的实测数据来验证假设模型的有效性。如果经过检验,初始假设模型不能接受时,若要进一步确认问题的真实结构,可对初始模型作出修正,然后用实测数据再加以验证。

(二)实施CFA的基本步骤 在实施CFA的过程中,有如下基本步骤: 1.建模 实施CFA,首先要针对问题选定公共因素数和设定模型中的固定参数和自由参数,决定一个确定性模型。 2.估计自由参数 估计自由参数最常用的方法是“极大似然估计”(ML),其它估计自由参数的方法有“未加权最小平方法”(ULS)、“一般最小平方法”(GLS)和“一般加权最小平方法”(WLS)。

3.检验模型的拟合度 模型对观察数据的拟合程度,用拟合度指标来表示。通常把拟合指数分为三类。一类是“拟合优指数”(Goodness of fit index)。另一类拟合优指数称为“增值拟合指数”(Incremental fit index)。第三类拟合指数叫“失拟指数”(Lack of fit index)。每类指标都有相应的评价标准,实际分析时,应该根据各个指数的量值综合考虑而作出判断。

4.修正模型 在CFA的输出结果中,还报告了“修正指数”(MI)和“期望改变量”(CH)。模型中的每个固定参数或约束参数(指限定在某一 区间内的参数)均相应地有一对MI和CH。可以根据有关标准对模型作出修正。 总之,CFA目前已成为心理学和社会、行为科学各领域最强有力的研究手段之一,它是理论发展的重要工具,能促使研究者细致、认真地考虑研究的理论构思与变量结构,使研究更为严密并富有理论与实际意义。

三、EAF与CFA的整合 实际上,CFA与EFA是研究过程的两个阶段,不能截然分开,两者结合运用能够相得益彰,使研究更有深度。Anderson(1990)建议,在发展理论的过程中,先通过探索型分析建立模型,再用验证型分析去检验和修正模型。例如,在一个样本中先用EFA找出变量的因素结构,再在另一个样本中用CFA验证和修改,这个程序称为交叉证实(cross-validation)。其实,二者的关系是既有联系又有区别,是一个事物对立统一的两个方面。

就二者的联系而言。首先,EFA与CFA都是建立在公共因素模型上的,且都是寻找测量变量之间相关结构的代表,并通过一组潜在变量来表示。 EFA是长期建立起来的统计方法,它提供了发现模型以验证假设的概念和计算工具,其提供的结果为CFA建立假设提供了重要的基础和保证。缺乏了EFA和CFA中的任一个,因素分析都是不完整的(John,1997)。

从二者的区别来看。EFA 主要是一种“数据—驱使”(data-driven)的方法。事先没有特定的公共因素数以及较少公共因素与潜在变量间的限制。EFA主要提供来自于数据的程序以决定合适的因素数以及因素负荷的模型。相反,CFA需要研究者给出一些假设,比如特定的因素数,因素负荷的模型,且这些假设可能是不同的。在提出假设的过程中,EFA提供了非常重要的前提基础。CFA的主要目的是验证这些假设成立与否。

通常需要将EFA和CFA结合起来使用。EFA可以为CFA提供假设模型的基础。如果样本容量足够大的话,可以将之随机分成两半,先对一部分进行EFA,为另一部分做CFA提供基础和假设,而另一部分数据则用来验证哪种假设模型拟合程度更好一些(Leandre,1999)。 总而言之,EFA与CFA是因素分析(FA)的两个不可分割的重要组成部分,其整合本身只不过是还其本来归属,尤其对教育与心理研究是非常必要的。

四、结构效度的一种估计 关于量表的结构效度问题,王权教授认为,假设我们从一测验中抽取了若干公共因素,如果这些因素就是测验所要测量的行为属性,则各公共因素的“方差贡献”(variance contribution)的大小正好反映了这份测验所能测到该行为属性的程度。因此,在这种情况下,各因素的“方差贡献率”之和可作为该测验的效度指标,心理测量学称之为“结构效度”(construct validity)(王权,1993,P7。漆书青等,1998,P370-379)。