第二章 因素分析 陳順宇 教授 成功大學統計系.

Slides:



Advertisements
Similar presentations
1/67 美和科技大學 美和科技大學 社會工作系 社會工作系. 2/67 社工系基礎學程規劃 ( 四技 ) 一上一下二上二下三上 校訂必修校訂必修 英文 I 中文閱讀與寫作 I 計算機概論 I 體育 服務與學習教育 I 英文 II 中文閱讀與寫作 II 計算機概論 II 體育 服務與學習教育 II.
Advertisements

§ 3 格林公式 · 曲线积分 与路线的无关性 在计算定积分时, 牛顿 - 莱布尼茨公式反映 了区间上的定积分与其端点上的原函数值之 间的联系 ; 本节中的格林公式则反映了平面 区域上的二重积分与其边界上的第二型曲线 积分之间的联系. 一、格林公式 二、曲线积分与路线的无关性.
公司為社團法人 股東之人數 林宜慧 陳冠蓉. 公司之意義  根據公司法第一條規定 : 「本法所 稱公司,謂以營利為目的,依照 本法組織、登記、成立之社團法 人。」
專業科目必修 管理學概論、化 妝品行銷與管理、 專題討論、藥妝 品學、流行設計、 專題講座、時尚 創意造型與實務 專業科目必修 化妝品法規、生 理學、化妝品原 料學、化妝品有 效性評估、時尚 化妝品調製與實 務、藝術指甲、 生物化學概論、 美容經絡學、校 外實習 專業科目必修 應用色彩學、化 妝品概論、時尚.
截肢的作业治疗 Amputation 李福胜 主讲. 第一节 概 述 一、定义: 是将没有生命、丧失功能或因 局部疾病严重威胁生命的肢体截 除的手术。 分类: 截骨:将肢体截除 关节离断:从关节分离.
聖若翰天主教小學 聖若翰天主教小學歡迎各位家長蒞臨 自行分配中一學位家長會 自行分配中一學位家長會.
認識食品標示 東吳大學衛生保健組製作.
后勤保卫竞聘讲演报告 竞聘岗位: 后勤保卫副科长 竞聘人: XX 2014年5月2日.
第二十三章 皮肤附属器疾病 主讲 朱姗姗.
地方自治團體之意義與組織 范文清 SS 2011.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
手术切口的分级与抗菌药物的应用 贵阳医学院附属白云医院感染管理科 沈 锋
颞下颌关节常见病.
「健康飲食在校園」運動 2008小學校長高峰會 講題:健康飲食政策個案分享 講者:啟基學校-莫鳳儀校長 日期:二零零八年五月六日(星期二)
因素分析方法的整合 ---- 结构效度的一种计算方法.
授課教師:國立臺灣大學 法律學系 許宗力 教授
清代章回小說----儒林外史 製作群:侑桂、品希、萱容、怡靜、佩涓、凸凸.
致理科技大學保險金融管理系 實習月開幕暨頒獎典禮
☆ 104學年度第1學期 活動藏寶圖 ☆ II III IV V 找到心方向-談壓力調適 陳佩雯諮商心理師
脊柱损伤固定搬运术 无锡市急救中心 林长春.
行政訴訟法 李仁淼 教授.
第一节 工业的区位选择 一、工业的主要区位因素 1、工业区位选择应注意的问题 2、影响工业布局的主要区位因素 3、不同工业部门的区位选择
詹婉華 台北縣新店市中正國民小學 呂玉琴 國立台北師範學院數學教育學系
XXX分析室组长竞聘 演讲人: XXX
結腸直腸腫瘤的認知.
經歷復活的愛 約翰福音廿一1-23.
幼兒社會發展與活動設計.
大学英语教学在学分制教学的比重 类别 文科 理科 大学英语 《课程要求》 总学时 周学时 总学分
郭詩韻老師 (浸信會呂明才小學音樂科科主任)
第8章 政府的財政預算.
I.禱告先來親近神─ 我們在天上的父 1.敬拜讚美 2.認罪
《政府采购非招标采购方式管理办法》的理解与适用
務要火熱服事主.
多變量分析 Multivariant Analysis
通識教育科 單元三 現代中國 主題1:中國的改革開放 課題(四)︰ 中國的綜合國力及外交
作业现场违章分析.
蒙福夫妻相处之道 经文:弗5:21-33.
基于课程标准的教学与评价: 政策执行讲评与后续要求
2. 戰後的經濟重建與復興 A. 經濟重建的步驟與措施 1.
好好學習 標點符號 (一) 保良局朱正賢小學上午校.
第三章 我們如何利用時間— 日常生活的韻律.
快遞貨物常見之偽禁藥簡介與 通關注意事項 報告人:臺北關快遞機放組快遞一課 于志安 1.
4. 聯合國在解決國際衝突中扮演的角色 C. 聯合國解決國際衝突的個案研究.
6.5滑坡 一、概述 1.什么是滑坡? 是斜坡的土体或岩体在重力作用下失去原有的稳定状态,沿着斜坡内某些滑动面(滑动带)作整体向下滑动的现象。
行政處分6 – 行政執行 范文清 SS 2011.
新陸書局股份有限公司 發行 第十九章 稅捐稽徵法 稅務法規-理論與應用 楊葉承、宋秀玲編著 稅捐稽徵程序.
舊制勞退準備金提繳與集體勞動權行使 明理法律事務所 李瑞敏律師 明理法律事務所 1 1.
破漏的囊袋.
民法第四章:權利主體 法人 楊智傑.
項目分析與探索式因素分析 李茂能, 2007,成大 Fred Li, 2007.
第12章 因素分析  本章的學習主題  1. 因素分析的主要概念及目的 2. 主成份分析與一般因素分析之差異 3. 因素分析轉軸的概念
第12章 因素分析  本章的學習主題  1. 因素分析的主要概念及目的 2. 主成份分析與一般因素分析之差異 3. 因素分析轉軸的概念 4. 決定因素萃取的個數 5. 如何對因素作命名 6. 因素得點的作用及計算.
四年級 中 文 科.
生鲜谈判.
音樂與節日 —感恩節 3A(12) 李嘉雯.
聖本篤堂 主日三分鐘 天主教教理重温 (94) (此簡報由聖本篤堂培育組製作).
聖公會聖匠堂長者地區中心 長者支援服務隊 香港房屋協會 家維邨義工隊
安慰能力測試 我感到非常孤單 為何要這麼痛苦?做人毫無價值,活著根本沒有意思。 我拖累了你。 假如我不在,情況會如何呢?
聖誕禮物 歌羅西書 2:6-7.
「傳心傳意 2003」 工商機構創意義工服務計劃比賽 計劃主題 : ( I ) 減少廢物 ( II ) 節省能源 ( III ) 愛護大自然
舊制勞退準備金提繳與集體勞動權行使 明理法律事務所 李瑞敏律師 明理法律事務所 1 1.
圣依纳爵堂 主日三分钟 天主教教理重温 (95) (此简报由香港圣本笃堂培育组制作).
第 四 章 迴歸分析應注意之事項.
第十七章 因素分析 Factor Analysis 第十七章 因素分析.
依撒意亞先知書 第一依撒意亞 公元前 740 – 700 (1 – 39 章) 天主是宇宙主宰,揀選以民立約,可惜他們犯罪遭
基督是更美的祭物 希伯來書 9:1-10:18.
明愛屯門馬登基金中學 中國語文及文化科 下一頁.
經文 : 創世紀一章1~2,26~28 創世紀二章7,三章6~9 主講 : 周淑慧牧師
圣经概論 09.
Presentation transcript:

第二章 因素分析 陳順宇 教授 成功大學統計系

2.1、因素分析簡介

例2.2汽車經銷商為了解國人對 國產車的偏見,設計問卷共13題 1. 國產車看起來很笨重 2. 國產車沒有高級感 3. 國產車設計不佳 4. 國產車安全性不高 5. 國產車折舊率高 6. 國產車板金不良 7. 國產車沒有品味 8. 國產車沒有流線型 9. 國產車不摩登 10. 國產車操作不方便 11. 國產車外觀不吸引人 12. 國產車品質不佳 13. 國產車容易故障

因素分析模式

1.因素分析的意義 因素分析起源於心 理學(約在1904年) 因為在心理學研究領域常遇到一些 如智力、道德、操守等 不能直接測量的因素  因素分析起源於心 理學(約在1904年) 因為在心理學研究領域常遇到一些 如智力、道德、操守等 不能直接測量的因素 我們對這些觀念也相當含糊 經由可測量的變數訂定出共同因素。

因素無法直接觀測 因素分析的主要假設是對 因素無法直接觀測到

共同因素、獨特因素 因素分析是以少數幾個因素 來解釋一群相互之間有關係存在的變數, 每個變數除了受 共同因素(Common Factor)的影響外, 尚有獨特因素(Specific Factor)。

因素做命名 在因素分析中,分析人員首先需 決定資料結構的維度(即因素的個數) 然後對每個因素指出是哪些變數是被此因素所解釋,也就是對因素做命名

因素分析兩個目標: 資料簡化與摘要。 資料簡化是以計算因子得點達成 摘要是以少數因素說明 一大群原有變數

因素分析分成 (1)探索性因素分析 (Exploratory Factor Analysis簡稱因素分析) (2)驗證性因素分析 (Confirmatory Factor Analysis)

2.因素分析的應用 找出潛在因素 從一大堆變數找出少數幾個共同因素,

例如,某航空公司對 旅客發出包括50題問卷 調查他們選擇搭乘航空公司的理由 問項包括 (1)服務人員的禮貌、 (2)準時的績效、 (3)班次、 (4)訂票手續

因素分析的目標是想將這50個問題(變數)簡化成少數幾個如 服務態度、 滿意度、 忠誠度 等較一般化及抽象化的因素 已便了解旅客如何選擇航空公司。

(2) 篩選變數 因素分析第二個主要目標是篩選變數 以便做為後繼進一步統計研究 (如迴歸分析、或區別分析)之用。 透過因素分析能找出幾群 內部相關性高的變數族群,

代表 在每一個族群中 挑選一兩個變數當做該族群的代表 (或是就以因素本身當代表), 可以避免變數間的共線性問題

例如,人事部門 從應徵者資料如 高中成績 個人專長、 興趣等一堆資料中, 找出幾個重要因素,

再由這些共同因素 各找出代表的變數, 做為以後對應徵者提問的問題, 並由此了解這些問項 與未來工作績效之間的相關性

設計一份簡短的測驗 可以由一大群內部有高度相關的題目中 經由因素分析將題目作分組, 由每個因素中選取代表性的題目 組成一份試題。

這份簡短的測驗可以 節省測驗時間 不損失測驗的代表性 也可以利用此種方式選題, 組成多份平行測驗。

(3) 對資料做摘要 由很多變數中選取少數幾個因素 (選取的因素個數由研究者決定), 選取多少個因素的彈性是 因素分析的第3個特徵(或應用)。

例如,一群有投票權的選民 對一些候選人在一大群問項上做評分, 包括好的管理者的特徵、有進取心是否重要等問題, 候選人可透過因素分析將注意力集中在幾個簡化而較抽象的因素上, 因這些因素已可以解釋大部分選民意向

(4) 由變數中選取代表性變數 因素分析的第四個應用是 從一大群問項(變數)中 選取一小部分變數做代表, 以便能解決實務問題。

例如,某汽車廣告商要在 電視上做30秒商業廣告 從幾十個問題中 選3或4種汽車的重要特徵, 以便在廣告上特別加強

挑選的問題就不會有重複現象 但經由因素分析先選出3、4個共同因素 然後在由每個因素中 再挑選一個問題, 這樣挑選的問題就不會有重複的現象

(5) 建構效度 因素分析也是研究一份測驗的建構效度(參看第八章)最有效方法之一, 藉由因素的發現可確定心理學上一些 特質觀念的結構成份, 得知測驗中有效的測量因素是那些?

智力測驗 透過因素分析可發現一些互相獨立因素(或能力) 如經因素分析後智力測驗可能分成 語文能力、 數學性向、 空間關係、 算術推論、 知覺速度

3.因素分析與主成份分析的差異 因素分析 (包括主成份分析和驗證性因素分析) 是一種統計方法 用來分析內部有相關的一群變數 所得共同因素來說明這些變數的結構,

(1) 因素分析是主成份分析的擴展, 它能提供更多不同的新變數, 可對原資料結構有更多了解與解釋。

(2)因素分析與主成份分析 做資料簡化 都是針對內部相關性高的變數 它們將每個變數同等看待, 而無應變數與獨立變數, 此與迴歸分析不同。

(3) 主成份分析以變異數為導向, 因素分析以共變異數為導向 (3) 主成份分析以變異數為導向, 因素分析以共變異數為導向 因素分析關心每個變數與 其他變數共同享有部 份 的大小。

(4)主成份分析主要是選擇一組成份 儘可能的解釋原變數的變異數。 因素分析主要是選取因素, 它能解釋原變數之間的相關情形。

主成份分析適合於做資料簡化, 因素分析適合做偵測資料結構 (5)主成份分析是所有問項(或變數)的 變異都考慮在內, 而因素分析只考慮每一問項與 其他問項共同享有的變異。

因素分析是做變數分組, 需要做旋轉 主成份分析是做指標用, 不需要旋轉 因素分析是做變數分組, 需要做旋轉 才能對因素做命名與解釋。

單位變量 (6) 主成份分析是單位變量 (變數使用不同單位所得結果會不同), 但因素分析是單位不變量, 也就是以做因素分析結果是相同的。

假設 (7) 主成份分析只是對資料做變換, 對資料不需要任何假設; 相對的,因素分析是假設資料滿足 某結構(如(2.1)~(2.4)式), 如果這些假設條件不滿足, 則所得結果便受到質疑

圖2.2 主成份路徑圖

圖2.3 探索性因素分析路徑圖

圖2.4 驗證性因素分析路徑圖

2.2、因素分析模式架構

(i)獨特因素1, ... , p是互相獨立且是常態分配,i的平均數為0

(ii)共同因素f1, ... , fq間的 共變量矩陣為

(iii)共同因素與獨特因素間 也是獨立的

例2.1(例1.3續) 5項成績如有兩個共同因素f1、f2,試畫路徑圖

2.因素模式幾個重要結果

(2) 當即因素間是直交的情形,

(3)因素個數之決定 因素分析要達到簡化目標 必需選取愈少個因素愈好, 但少數因素其解釋能力相對的也較低, 因此簡化與代表性, 變成進退兩難問題?

(i) 凱莎(Kaiser)準則 保留特徵值大於1 (或大於所有變數的平均變異數)的主成份,

(ii) 陡坡圖(Scree)檢驗 陡坡圖是Cattell(1966)提出的 一種圖形判斷方法, 其原理與主成份分析相同, 當折線開始不陡時, 表示以下的特徵值都差不多, 因此以下的特徵值都不選取

(iii) 累積解釋能力 選取的累積解釋變異比例 要達到研究者設定的門檻 (如70%以上)

(iv) 特徵值 選取特徵值 大於所有變數變異數的平均 (在以相關矩陣做分析即要大於1)

共通性與獨特性

因素f3 變數xi 因素f1 因素f2

3.因素分析步驟 (1)參數估計:利用下節討論的各種方法 (主成份法、主因素法、最概法), 求負荷及獨特性的估計。

(2)模式適合性評估: 利用殘差分析與適合度 檢定模式的合適與否。

(3)因素旋轉: 因素模式解非唯一, 需要做“直交”旋轉, 使每個共同因素fj 只有少數幾個係數很大, 然後再以此做為因素命名 或變數分組之依據

2.3、因素選取法 1. 主成份法 2. 主因素法 3. 最概法

1. 主成份法 利用主成份分析法求出p個主成份y1,…,yp, 設其特徵值分別為1,…,p

矩陣

第i個主成份yi的變異數是i,因素的變異數要求等於1

負荷(或係數)矩陣L

例2.1續 15位學生國文、英文、統計、會計、經濟等5科成績,試以主成份法分析選取2個因素,求因素負荷、共通性與獨立性 例2.1續 15位學生國文、英文、統計、會計、經濟等5科成績,試以主成份法分析選取2個因素,求因素負荷、共通性與獨立性

取兩個共同因素

負荷矩陣

共通性

(b)獨特性

註:獨特性的總和

STATISTICA

因素的負荷

共通性

2.主因素法: 上面主成份分析法是以 相關矩陣R為分析工具, 求R的特徵值與特徵向量, 如果R的對角線元素不是取“1”, 而是以小於“1”的某些正數取代, 稱之為主因素法(Principal Factor Analysis)

SMC 最常用的主因素法是相關矩陣R 對角線上第i個元素的“1”以xi的SMC 取代而成矩陣, 它是xi與x1 , ... , xi-1 , xi+1 , ... , xp的 複相關係數平方

例2.1(續) 由x1對x2 , x3 , x4 , x5 的複迴歸算出 判定係數為 = 0.90746

特徵值

二個因素

主因素法共通性

主因素法最後的共通性

主因素法共通性起始值 (1)PRIORS = ONE, (2)PRIORS = SMC, (3)PRIORS 。 (4)PRIORS = c1,c2,…,cp,c1,c2,…,cp是使用者自訂的正數。 (5)逐步改善法,先設定一組起始共通性,然後的對角線就以此組代替,求出的特徵值,特徵向量後算共通性,再以此當起始共通性(即的對角線值改為),求出因素後算其共通性,依次進行到第k次與第k + 1次的共通性、對每個i都很接近時才停止(或指定多少次後停止)。

3.最概法

求解過程需透過 逐次改善方式才能求出

STATISTICA最概法的選取 兩個因素報表

因素負荷

共通性

2.4、模式適合性評估 1.殘差分析 2. MSA判斷準則 3.最概法判斷準則 4.偏相關的判斷準則

1.殘差分析

平均殘差

2. MSA判斷準則 凱莎(Kaiser)提出MSA (Measure of Sampling Adequacy), 資料做因素分析適合性指標

MSA > 0.8 雖然MSA大小沒有統計上的判斷臨界點,但實證經驗, 當MSA > 0.8表示做因素分析是合適的,

3.最概法判斷準則

例2.1(續2) 以最概法選取兩個因素後, 檢定:所有獨特性皆為0。

可以接受所有獨特性皆為0, 即選取2個因素是適合的

例2.1(續) 如以主成份法做 因素分析抽取2個共同因素

主因素法做因素分析 抽取2個共同因素

因素分析模式要好的條件 (1)殘差矩陣數值小; (2)獨特性小; (3)MSA值要大; (4)偏相關小。

例2.1(續3)殘差矩陣 試分別求 (1)主成份法 (2)主因素法 (3)最概法 選取兩個因素後的殘差矩陣

(1)主成份法 平均殘差為0.05022659

(2)主因素法 平均殘差為0.01436

(3)最概法

2.5、旋轉

使因素命名容易常做旋轉 使每一列 中只有一個元素接近1, 而大部份其他的元素接近0, 旋轉(Rotation)分成 直交旋轉與斜交旋轉二種,

採用直交旋轉,因素間不相關; 採用斜交旋轉,因素間可能有相關。

常用的直交旋轉有 變異最大法(Varimax)、 四方最大法(Quartimax)、 一般直交法(Orthomax)。

表2.1 因素負荷表

因素負荷是因素命名的依據 因素會以其負荷較大的變數 共同現象做為命名, 但負荷要多大以上才能做為選取依據,並沒有定論,

一般是以實務為考量,有時負荷只達0.3也可以選取做為命名參考, 最好負荷能達0.6以上較佳, 統計上負荷的顯著性與樣本數多寡有關,如下表

當樣本數50時,負荷要達0.75以上,因素與此變數才有相關

(i) 變異最大旋轉法(Varimax)

1.變異最大旋轉法(Varimax) 座標旋轉使因素負荷表中每行變異最大,稱為變異最大旋轉法(Varimax)。 變異最大旋轉法的目的是將 因素負荷矩陣的“行”做簡化, 也就是將座標旋轉使每一個因素(行) 只在少數幾個變數上有很高負荷

正規化變異最大法

2.四方最大法(Quartimax) 四方最大法是使因素負荷矩陣每一列變異最大, 四方最大法目的是將因素負荷矩陣“列”做簡化, 也就是將座標旋轉,使每一個變數只在某一個因素上負荷很高,而在其他因素上負荷儘可能的小, 但因第行的平方和= 即使下式最大

例2.1(續)主成份法

因素經直交旋轉後有下列現象

經變異最大旋轉後的共通性

(2)四方最大法(Quartimax)旋轉

STATISTICA四方最大法 旋轉後的因素負荷

例2.1(續5) (1)主因素法 (2)最概法, 選取2個因素, 分別求變異最大法旋轉後的共通性

主因素法選取兩個因素,再做 變異最大法旋轉,旋轉後共通性

以最概法選取兩個因素,再經變異數最大法旋轉,共通性

例2.1(續6) 以主成份法選取2個因素,Promax旋轉後因素負荷

因素負荷

2.6、因素得點 例2.1(續7) 以主成份法選取兩個因素 再經變異最大法旋轉, 求因素得點及得點散佈圖

各變數在因素1、 因素2得點之係數

5位學生的因素1、因素2得點

圖2.8 因素得點散佈圖

例2.2汽車經銷商為了解國人對 國產車的偏見,設計問卷共13題 1. 國產車看起來很笨重 2. 國產車沒有高級感 3. 國產車設計不佳 4. 國產車安全性不高 5. 國產車折舊率高 6. 國產車板金不良 7. 國產車沒有品味 8. 國產車沒有流線型 9. 國產車不摩登 10. 國產車操作不方便 11. 國產車外觀不吸引人 12. 國產車品質不佳 13. 國產車容易故障

200位顧客得相關矩陣

13個特徵值與解釋變異百分比

圖2.10 陡坡圖

主成份法因素分析得 3個因素,因素負荷

共通性

經變異最大法旋轉後因素負荷

殘差矩陣

(6)變異最大法旋轉

因素命名 因素1 命名為品質:5個變數 因素2 命名為外觀:5個變數 因素3 命名為安全:3個變數 (安全感)、(操作)、(故障) 因素1 命名為品質:5個變數 (設計)、(折舊率)、(板金)、(品味)、(品質) 因素2 命名為外觀:5個變數 (笨重)、(高級感)、(流線型)、(摩登)、(外觀) 因素3 命名為安全:3個變數 (安全感)、(操作)、(故障)

因素負荷散佈圖

旋轉後共通性

圖2.12 三個共同因素 對各變數影響路徑圖

因素得點

得點散佈圖

四方最大法旋轉後的因素負荷

例2.3 收集奧林匹克160位 10項運動比賽選手成績相關矩陣

10個特徵值與解釋變異數百分比

圖2.14 十項運動陡坡圖

解釋各項運動成績能力的 變異數百分比(即共通性)

主成份法未旋轉前4個因素負荷

例2.3十項運動因素分析 (主成份法)殘差矩陣

變異最大法(Varimax)

因素命名 因素1:速度(百公尺、跳遠、四百公尺) 因素2:擲力(鉛球、鐵餅、標槍) 因素3:耐力(1500公尺) 因素4:跳高(跳高、撐竿跳高、高欄)

因素負荷散佈圖

十項運動因素負荷散佈圖 (3度空間)

四方最大法

最概法

下面檢定以最概法選取 4個因素其獨特性是否皆為0?

最概法選取4個因素再經變異 最大法旋轉後因素負荷與共通性

如只選3個共同因素, 檢定其獨特性是否為0

結果是顯著的, 即表示選3個因素後有些變數 仍未能被解釋足夠 (此題為撐竿、跳高與標槍)

選3個因素的共通性

例2.5 顧客購買汽車考慮的 14項重要變數 x1 :修車便宜 x2 :色彩鮮豔 x3 :車內空間寬敞 x4 :省油 x5 :操作容易

例2.5之4個因素負荷

結論 1.因素I(舒適性) 車內空間寬敞,舒適,及車箱容量大 2.因素II(經濟性) 修車便宜,省油,折舊率低,引擎排氣量小。 色彩鮮豔,車型摩登,車型亮麗,引人注意。 4.因表IV(操作性) 好駕駛,容易停車