Presentation is loading. Please wait.

Presentation is loading. Please wait.

第二章 因素分析 陳順宇 教授 成功大學統計系.

Similar presentations


Presentation on theme: "第二章 因素分析 陳順宇 教授 成功大學統計系."— Presentation transcript:

1 第二章 因素分析 陳順宇 教授 成功大學統計系

2 2.1、因素分析簡介

3 例2.2汽車經銷商為了解國人對 國產車的偏見,設計問卷共13題
1. 國產車看起來很笨重 2. 國產車沒有高級感 3. 國產車設計不佳 4. 國產車安全性不高 5. 國產車折舊率高 6. 國產車板金不良 7. 國產車沒有品味 8. 國產車沒有流線型 9. 國產車不摩登 10. 國產車操作不方便 11. 國產車外觀不吸引人 12. 國產車品質不佳 13. 國產車容易故障

4

5 因素分析模式

6 1.因素分析的意義 因素分析起源於心 理學(約在1904年) 因為在心理學研究領域常遇到一些 如智力、道德、操守等 不能直接測量的因素
 因素分析起源於心 理學(約在1904年) 因為在心理學研究領域常遇到一些 如智力、道德、操守等 不能直接測量的因素 我們對這些觀念也相當含糊 經由可測量的變數訂定出共同因素。

7 因素無法直接觀測 因素分析的主要假設是對 因素無法直接觀測到

8 共同因素、獨特因素 因素分析是以少數幾個因素 來解釋一群相互之間有關係存在的變數, 每個變數除了受
共同因素(Common Factor)的影響外, 尚有獨特因素(Specific Factor)。

9 因素做命名 在因素分析中,分析人員首先需 決定資料結構的維度(即因素的個數)
然後對每個因素指出是哪些變數是被此因素所解釋,也就是對因素做命名

10 因素分析兩個目標: 資料簡化與摘要。 資料簡化是以計算因子得點達成 摘要是以少數因素說明 一大群原有變數

11 因素分析分成 (1)探索性因素分析 (Exploratory Factor Analysis簡稱因素分析) (2)驗證性因素分析
(Confirmatory Factor Analysis)

12 2.因素分析的應用 找出潛在因素 從一大堆變數找出少數幾個共同因素,

13 例如,某航空公司對 旅客發出包括50題問卷 調查他們選擇搭乘航空公司的理由 問項包括 (1)服務人員的禮貌、 (2)準時的績效、
(3)班次、 (4)訂票手續

14 因素分析的目標是想將這50個問題(變數)簡化成少數幾個如
服務態度、 滿意度、 忠誠度 等較一般化及抽象化的因素 已便了解旅客如何選擇航空公司。

15 (2) 篩選變數 因素分析第二個主要目標是篩選變數 以便做為後繼進一步統計研究 (如迴歸分析、或區別分析)之用。 透過因素分析能找出幾群
內部相關性高的變數族群,

16 代表 在每一個族群中 挑選一兩個變數當做該族群的代表 (或是就以因素本身當代表), 可以避免變數間的共線性問題

17 例如,人事部門 從應徵者資料如 高中成績 個人專長、 興趣等一堆資料中, 找出幾個重要因素,

18 再由這些共同因素 各找出代表的變數, 做為以後對應徵者提問的問題, 並由此了解這些問項 與未來工作績效之間的相關性

19 設計一份簡短的測驗 可以由一大群內部有高度相關的題目中 經由因素分析將題目作分組, 由每個因素中選取代表性的題目 組成一份試題。

20 這份簡短的測驗可以 節省測驗時間 不損失測驗的代表性 也可以利用此種方式選題, 組成多份平行測驗。

21 (3) 對資料做摘要 由很多變數中選取少數幾個因素 (選取的因素個數由研究者決定), 選取多少個因素的彈性是
因素分析的第3個特徵(或應用)。

22 例如,一群有投票權的選民 對一些候選人在一大群問項上做評分, 包括好的管理者的特徵、有進取心是否重要等問題,
候選人可透過因素分析將注意力集中在幾個簡化而較抽象的因素上, 因這些因素已可以解釋大部分選民意向

23 (4) 由變數中選取代表性變數 因素分析的第四個應用是 從一大群問項(變數)中 選取一小部分變數做代表, 以便能解決實務問題。

24 例如,某汽車廣告商要在 電視上做30秒商業廣告
從幾十個問題中 選3或4種汽車的重要特徵, 以便在廣告上特別加強

25 挑選的問題就不會有重複現象 但經由因素分析先選出3、4個共同因素 然後在由每個因素中 再挑選一個問題, 這樣挑選的問題就不會有重複的現象

26 (5) 建構效度 因素分析也是研究一份測驗的建構效度(參看第八章)最有效方法之一, 藉由因素的發現可確定心理學上一些 特質觀念的結構成份,
得知測驗中有效的測量因素是那些?

27 智力測驗 透過因素分析可發現一些互相獨立因素(或能力) 如經因素分析後智力測驗可能分成 語文能力、 數學性向、 空間關係、 算術推論、
知覺速度

28 3.因素分析與主成份分析的差異 因素分析 (包括主成份分析和驗證性因素分析) 是一種統計方法 用來分析內部有相關的一群變數
所得共同因素來說明這些變數的結構,

29 (1) 因素分析是主成份分析的擴展, 它能提供更多不同的新變數, 可對原資料結構有更多了解與解釋。

30 (2)因素分析與主成份分析 做資料簡化 都是針對內部相關性高的變數 它們將每個變數同等看待, 而無應變數與獨立變數, 此與迴歸分析不同。

31 (3) 主成份分析以變異數為導向, 因素分析以共變異數為導向
(3) 主成份分析以變異數為導向, 因素分析以共變異數為導向 因素分析關心每個變數與 其他變數共同享有部 份 的大小。

32 (4)主成份分析主要是選擇一組成份 儘可能的解釋原變數的變異數。 因素分析主要是選取因素, 它能解釋原變數之間的相關情形。

33 主成份分析適合於做資料簡化, 因素分析適合做偵測資料結構
(5)主成份分析是所有問項(或變數)的 變異都考慮在內, 而因素分析只考慮每一問項與 其他問項共同享有的變異。

34 因素分析是做變數分組, 需要做旋轉 主成份分析是做指標用, 不需要旋轉 因素分析是做變數分組, 需要做旋轉 才能對因素做命名與解釋。

35 單位變量 (6) 主成份分析是單位變量 (變數使用不同單位所得結果會不同), 但因素分析是單位不變量, 也就是以做因素分析結果是相同的。

36 假設 (7) 主成份分析只是對資料做變換, 對資料不需要任何假設; 相對的,因素分析是假設資料滿足 某結構(如(2.1)~(2.4)式),
如果這些假設條件不滿足, 則所得結果便受到質疑

37 圖2.2 主成份路徑圖

38 圖2.3 探索性因素分析路徑圖

39 圖2.4 驗證性因素分析路徑圖

40 2.2、因素分析模式架構

41 (i)獨特因素1, ... , p是互相獨立且是常態分配,i的平均數為0

42 (ii)共同因素f1, ... , fq間的 共變量矩陣為

43 (iii)共同因素與獨特因素間 也是獨立的

44 例2.1(例1.3續) 5項成績如有兩個共同因素f1、f2,試畫路徑圖

45 2.因素模式幾個重要結果

46 (2) 當即因素間是直交的情形,

47

48 (3)因素個數之決定 因素分析要達到簡化目標 必需選取愈少個因素愈好, 但少數因素其解釋能力相對的也較低, 因此簡化與代表性,
變成進退兩難問題?

49 (i) 凱莎(Kaiser)準則 保留特徵值大於1 (或大於所有變數的平均變異數)的主成份,

50 (ii) 陡坡圖(Scree)檢驗 陡坡圖是Cattell(1966)提出的 一種圖形判斷方法, 其原理與主成份分析相同,
當折線開始不陡時, 表示以下的特徵值都差不多, 因此以下的特徵值都不選取

51 (iii) 累積解釋能力 選取的累積解釋變異比例 要達到研究者設定的門檻 (如70%以上)

52 (iv) 特徵值 選取特徵值 大於所有變數變異數的平均 (在以相關矩陣做分析即要大於1)

53 共通性與獨特性

54 因素f3 變數xi 因素f1 因素f2

55

56 3.因素分析步驟 (1)參數估計:利用下節討論的各種方法 (主成份法、主因素法、最概法), 求負荷及獨特性的估計。

57 (2)模式適合性評估: 利用殘差分析與適合度 檢定模式的合適與否。

58 (3)因素旋轉: 因素模式解非唯一, 需要做“直交”旋轉, 使每個共同因素fj 只有少數幾個係數很大, 然後再以此做為因素命名
或變數分組之依據

59 2.3、因素選取法 1. 主成份法 2. 主因素法 3. 最概法

60 1. 主成份法 利用主成份分析法求出p個主成份y1,…,yp, 設其特徵值分別為1,…,p

61 矩陣

62

63 第i個主成份yi的變異數是i,因素的變異數要求等於1

64

65

66 負荷(或係數)矩陣L

67 例2.1續 15位學生國文、英文、統計、會計、經濟等5科成績,試以主成份法分析選取2個因素,求因素負荷、共通性與獨立性
例2.1續 15位學生國文、英文、統計、會計、經濟等5科成績,試以主成份法分析選取2個因素,求因素負荷、共通性與獨立性

68

69

70 取兩個共同因素

71

72 負荷矩陣

73 共通性

74 (b)獨特性

75 註:獨特性的總和

76 STATISTICA

77

78 因素的負荷

79 共通性

80 2.主因素法: 上面主成份分析法是以 相關矩陣R為分析工具, 求R的特徵值與特徵向量, 如果R的對角線元素不是取“1”,
而是以小於“1”的某些正數取代, 稱之為主因素法(Principal Factor Analysis)

81 SMC 最常用的主因素法是相關矩陣R 對角線上第i個元素的“1”以xi的SMC 取代而成矩陣,
它是xi與x1 , ... , xi-1 , xi+1 , ... , xp的 複相關係數平方

82 例2.1(續) 由x1對x2 , x3 , x4 , x5 的複迴歸算出 判定係數為 =

83

84 特徵值

85

86 二個因素

87 主因素法共通性

88 主因素法最後的共通性

89 主因素法共通性起始值 (1)PRIORS = ONE, (2)PRIORS = SMC, (3)PRIORS 。
(4)PRIORS = c1,c2,…,cp,c1,c2,…,cp是使用者自訂的正數。 (5)逐步改善法,先設定一組起始共通性,然後的對角線就以此組代替,求出的特徵值,特徵向量後算共通性,再以此當起始共通性(即的對角線值改為),求出因素後算其共通性,依次進行到第k次與第k + 1次的共通性、對每個i都很接近時才停止(或指定多少次後停止)。

90 3.最概法

91 求解過程需透過 逐次改善方式才能求出

92 STATISTICA最概法的選取 兩個因素報表

93 因素負荷

94 共通性

95 2.4、模式適合性評估 1.殘差分析 2. MSA判斷準則 3.最概法判斷準則 4.偏相關的判斷準則

96 1.殘差分析

97 平均殘差

98 2. MSA判斷準則 凱莎(Kaiser)提出MSA (Measure of Sampling Adequacy),
資料做因素分析適合性指標

99 MSA > 0.8 雖然MSA大小沒有統計上的判斷臨界點,但實證經驗, 當MSA > 0.8表示做因素分析是合適的,

100 3.最概法判斷準則

101

102 例2.1(續2) 以最概法選取兩個因素後, 檢定:所有獨特性皆為0。

103 可以接受所有獨特性皆為0, 即選取2個因素是適合的

104 例2.1(續) 如以主成份法做 因素分析抽取2個共同因素

105 主因素法做因素分析 抽取2個共同因素

106 因素分析模式要好的條件 (1)殘差矩陣數值小; (2)獨特性小; (3)MSA值要大; (4)偏相關小。

107 例2.1(續3)殘差矩陣 試分別求 (1)主成份法 (2)主因素法 (3)最概法 選取兩個因素後的殘差矩陣

108 (1)主成份法 平均殘差為

109

110 (2)主因素法 平均殘差為

111

112 (3)最概法

113 2.5、旋轉

114 使因素命名容易常做旋轉 使每一列 中只有一個元素接近1, 而大部份其他的元素接近0, 旋轉(Rotation)分成 直交旋轉與斜交旋轉二種,

115 採用直交旋轉,因素間不相關; 採用斜交旋轉,因素間可能有相關。

116 常用的直交旋轉有 變異最大法(Varimax)、 四方最大法(Quartimax)、 一般直交法(Orthomax)。

117 表2.1 因素負荷表

118 因素負荷是因素命名的依據 因素會以其負荷較大的變數 共同現象做為命名, 但負荷要多大以上才能做為選取依據,並沒有定論,

119 一般是以實務為考量,有時負荷只達0.3也可以選取做為命名參考,
最好負荷能達0.6以上較佳, 統計上負荷的顯著性與樣本數多寡有關,如下表

120 當樣本數50時,負荷要達0.75以上,因素與此變數才有相關

121 (i) 變異最大旋轉法(Varimax)

122

123 1.變異最大旋轉法(Varimax) 座標旋轉使因素負荷表中每行變異最大,稱為變異最大旋轉法(Varimax)。 變異最大旋轉法的目的是將
因素負荷矩陣的“行”做簡化, 也就是將座標旋轉使每一個因素(行) 只在少數幾個變數上有很高負荷

124

125 正規化變異最大法

126 2.四方最大法(Quartimax) 四方最大法是使因素負荷矩陣每一列變異最大, 四方最大法目的是將因素負荷矩陣“列”做簡化,
也就是將座標旋轉,使每一個變數只在某一個因素上負荷很高,而在其他因素上負荷儘可能的小, 但因第行的平方和= 即使下式最大

127

128 例2.1(續)主成份法

129

130

131 因素經直交旋轉後有下列現象

132

133

134

135

136

137

138

139

140

141

142 經變異最大旋轉後的共通性

143

144

145

146 (2)四方最大法(Quartimax)旋轉

147 STATISTICA四方最大法 旋轉後的因素負荷

148 例2.1(續5) (1)主因素法 (2)最概法, 選取2個因素, 分別求變異最大法旋轉後的共通性

149 主因素法選取兩個因素,再做 變異最大法旋轉,旋轉後共通性

150 以最概法選取兩個因素,再經變異數最大法旋轉,共通性

151 例2.1(續6) 以主成份法選取2個因素,Promax旋轉後因素負荷

152 因素負荷

153 2.6、因素得點 例2.1(續7) 以主成份法選取兩個因素 再經變異最大法旋轉, 求因素得點及得點散佈圖

154 各變數在因素1、 因素2得點之係數

155 5位學生的因素1、因素2得點

156 圖2.8 因素得點散佈圖

157 例2.2汽車經銷商為了解國人對 國產車的偏見,設計問卷共13題
1. 國產車看起來很笨重 2. 國產車沒有高級感 3. 國產車設計不佳 4. 國產車安全性不高 5. 國產車折舊率高 6. 國產車板金不良 7. 國產車沒有品味 8. 國產車沒有流線型 9. 國產車不摩登 10. 國產車操作不方便 11. 國產車外觀不吸引人 12. 國產車品質不佳 13. 國產車容易故障

158

159 200位顧客得相關矩陣

160 13個特徵值與解釋變異百分比

161 圖2.10 陡坡圖

162 主成份法因素分析得 3個因素,因素負荷

163

164 共通性

165 經變異最大法旋轉後因素負荷

166 殘差矩陣

167 (6)變異最大法旋轉

168 因素命名 因素1 命名為品質:5個變數 因素2 命名為外觀:5個變數 因素3 命名為安全:3個變數 (安全感)、(操作)、(故障)
因素1 命名為品質:5個變數 (設計)、(折舊率)、(板金)、(品味)、(品質) 因素2 命名為外觀:5個變數 (笨重)、(高級感)、(流線型)、(摩登)、(外觀) 因素3 命名為安全:3個變數 (安全感)、(操作)、(故障)

169 因素負荷散佈圖

170 旋轉後共通性

171 圖2.12 三個共同因素 對各變數影響路徑圖

172 因素得點

173 得點散佈圖

174 四方最大法旋轉後的因素負荷

175 例2.3 收集奧林匹克160位 10項運動比賽選手成績相關矩陣

176 10個特徵值與解釋變異數百分比

177 圖2.14 十項運動陡坡圖

178 解釋各項運動成績能力的 變異數百分比(即共通性)

179 主成份法未旋轉前4個因素負荷

180 例2.3十項運動因素分析 (主成份法)殘差矩陣

181 變異最大法(Varimax)

182 因素命名 因素1:速度(百公尺、跳遠、四百公尺) 因素2:擲力(鉛球、鐵餅、標槍) 因素3:耐力(1500公尺)
因素4:跳高(跳高、撐竿跳高、高欄)

183 因素負荷散佈圖

184 十項運動因素負荷散佈圖 (3度空間)

185 四方最大法

186 最概法

187 下面檢定以最概法選取 4個因素其獨特性是否皆為0?

188 最概法選取4個因素再經變異 最大法旋轉後因素負荷與共通性

189 如只選3個共同因素, 檢定其獨特性是否為0

190 結果是顯著的, 即表示選3個因素後有些變數 仍未能被解釋足夠 (此題為撐竿、跳高與標槍)

191 選3個因素的共通性

192

193 例2.5 顧客購買汽車考慮的 14項重要變數 x1 :修車便宜 x2 :色彩鮮豔 x3 :車內空間寬敞 x4 :省油 x5 :操作容易

194 例2.5之4個因素負荷

195 結論 1.因素I(舒適性) 車內空間寬敞,舒適,及車箱容量大 2.因素II(經濟性) 修車便宜,省油,折舊率低,引擎排氣量小。
色彩鮮豔,車型摩登,車型亮麗,引人注意。 4.因表IV(操作性) 好駕駛,容易停車


Download ppt "第二章 因素分析 陳順宇 教授 成功大學統計系."

Similar presentations


Ads by Google