Download presentation
Presentation is loading. Please wait.
1
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心
陸 卡方獨立性檢定 與 變數間的關聯性檢定 主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 2019/5/9 公共管理與政治學研究方法研討班
2
變數之間關係的描述 一、卡方獨立性檢定 二、關聯性的統計 公共管理與政治學研究方法研討班 2019/5/9
3
一、卡方獨立性檢定 在一般民意調查或是社會科學中, 最常使用的統計方法。 公共管理與政治學研究方法研討班 2019/5/9
4
卡方獨立性檢定的基本原則與程序 基本原則是檢視觀察值與期望值之間的差異,是否達到統計上的顯著程度。
基本原則是檢視觀察值與期望值之間的差異,是否達到統計上的顯著程度。 如果具有顯著差異,則再進一步解釋差異的來源。 公共管理與政治學研究方法研討班 2019/5/9
5
「南人食米、北人食麥」的卡方獨立性檢定 我們就以「南人食米、北人食麥」為例 按步就班分解卡方獨立性檢定 我們統計上的虛無假設是:
我們統計上的虛無假設是: 居住地區與飲食習慣之間是互相獨立的,沒有任何關聯。 公共管理與政治學研究方法研討班 2019/5/9
6
1.先列出兩個變數的次數(或是百分比)分配 公共管理與政治學研究方法研討班 2019/5/9
7
2. 假設兩個變數彼此獨立,並找出其期望值(E)
30 30 20 20 公共管理與政治學研究方法研討班 2019/5/9
8
3. 觀察值的實際分佈(O) 45 15 5 35 公共管理與政治學研究方法研討班 2019/5/9
9
4. 計算觀察值與期望值之間的差異(O-E) +15 -15 -15 +15 公共管理與政治學研究方法研討班 2019/5/9
10
5. 計算每一個格子的卡方值 225/30 225/30 225/20 225/20 公共管理與政治學研究方法研討班 2019/5/9
11
6. 加總所有格子內的卡方值 加總所有卡方值,我們得到=37.5 公共管理與政治學研究方法研討班 2019/5/9
12
7. 自由度的計算方式: r = row 橫列的類別數目 c = column 直欄的類別數目
df = (c-1) (r-1)=(2-1)*(2-1)=1 r = row 橫列的類別數目 c = column 直欄的類別數目 公共管理與政治學研究方法研討班 2019/5/9
13
8. 查表 卡方檢定表 得到p<0.001,所以拒絕虛無假設。 *: p<0.05 **: p<0.01
公共管理與政治學研究方法研討班 2019/5/9
14
卡方獨立性檢定的解釋程序 1.做卡方檢定,確定變數間的關係是否獨立。 2.以調整後餘值,觀察特定格子是否顯著偏高/低。
3.具體解釋表格內的百分比。 公共管理與政治學研究方法研討班 2019/5/9
15
調整後餘值的分布是接近標準常態分配,平均數為0而標準差為1。
調整後餘值 / 殘差的運用與解釋 調整後餘值的分布是接近標準常態分配,平均數為0而標準差為1。 通常絕對值大於等於1.96時,表示該細格與其他觀察值之間具有顯著差異,其正負值則表示該細格出現的頻率顯著偏高或顯著偏低。 若是其值落在正負1.96之間時,則表示該細格出現的頻率僅略高或是略低。 公共管理與政治學研究方法研討班 2019/5/9
16
調整後餘值 公共管理與政治學研究方法研討班 2019/5/9
17
不同地區民眾飲食習慣差異的卡方檢定 公共管理與政治學研究方法研討班 2019/5/9
18
表4-4 2000年總統大選省籍與投票對象的卡方獨立性檢定
表4-4 2000年總統大選省籍與投票對象的卡方獨立性檢定 公共管理與政治學研究方法研討班 2019/5/9
19
調整後餘值 公共管理與政治學研究方法研討班 2019/5/9
20
2000年總統大選省籍與投票對象卡方獨立性檢定 研究問題: 統計的虛無假設 統計的對立假設 公共管理與政治學研究方法研討班 2019/5/9
21
2000年總統大選省籍與投票對象卡方獨立性檢定 統計描述:
從範例表三中我們發現:卡方檢定的p值小於0.05,顯示我們得以拒絕虛無假設,民眾的省籍與投票對象之間並不獨立。 論文的說明: 本研究在於分析:民眾的省籍背景與投票對象之間的關聯性,在卡方檢定中我們發現兩者關係並非獨立,進一步檢視,我們發現:相對於全體選民,本省客家的民眾對於宋楚瑜的支持略高,約達四成;對於連戰的支持程度也略高,接近三成,不過,他們對於陳水扁的支持程度顯著偏低,僅不及三分之一。 公共管理與政治學研究方法研討班 2019/5/9
22
卡方獨立性檢定進行前的注意事項 需要注意的是,在進行卡方檢定時,一般的要求是每一個細格的期望值應大於或等於5,也有學者加以放寬到最小的期望值大於或是等於1。此外,小於5的細格數的比例不能超過所有格子數的20%,以免因為樣本過少而影響推論。細格太多,通常需要先做類目合併。 公共管理與政治學研究方法研討班 2019/5/9
23
勝算(odds)與勝算比(odds ratio)
勝算/成敗=(成功機率)/(失敗機率) 公共管理與政治學研究方法研討班 2019/5/9
24
2*2表格的勝算比 女性中,投給馬英九相對謝長廷的「勝算」(odds)=491/246=2.00
女性投給馬英九相對於謝長廷的勝算是男性(投給馬英九相對於謝長廷的勝算)的1.39倍 公共管理與政治學研究方法研討班 2019/5/9
25
機率與勝算的轉換 機率=(odds)/(odds+1) 女性中,投給馬英九相對謝長廷的「勝算」(odds)=491/246=2.00
女性投給馬英九的機率:2/(2+1)=0.666 公共管理與政治學研究方法研討班 2019/5/9
26
二、關聯性的統計 1 名目變數間的關聯性分析 2 順序變數間的關聯性分析 3 等距變數間的關聯性分析 公共管理與政治學研究方法研討班
1 名目變數間的關聯性分析 2 順序變數間的關聯性分析 3 等距變數間的關聯性分析 公共管理與政治學研究方法研討班 2019/5/9
27
1 類別變數間的關聯性分析 一種常用的相關性測量為 Goodman and Kruskal’s Lambda 測量。 這是屬於一種誤差降低率
1 類別變數間的關聯性分析 一種常用的相關性測量為 Goodman and Kruskal’s Lambda 測量。 這是屬於一種誤差降低率 (proportional reduction of error,或是 PRE) 的相關性測量。其值的分布從0到1。 基本概念是: 當知道一個變數之後, 可以減低我們預測另外一個變數所犯錯誤的比例。 公共管理與政治學研究方法研討班 2019/5/9
28
表4-5 2000年總統大選不同省籍選民投票的交叉列表
表4-5 2000年總統大選不同省籍選民投票的交叉列表 省籍 背景 _ X 次數分配小計 大陸各省_C Y 支持對象 宋楚瑜_1 連戰_2 陳水扁_3 47 33 183 224 98 29 369 245 38 383 22 443 118 790 149 1 ,057 本省客家_A 本省閩南_B 公共管理與政治學研究方法研討班 2019/5/9
29
Lambda 相關性測量實例 如果沒有選民省籍背景的資料(變數X)的相關資訊的話,X,我們預測選民的投票傾向(Y)的最佳方法是運用眾數,使我們的誤差減低到最小,所以,其誤差為=0.581。這是我們預測所有選民都投給陳水扁時,所得到的誤差比例。 當我們運用選民的省籍來預測選民的投票對象時,其誤差降為0.501,減低了原錯誤約14個百分點。 公共管理與政治學研究方法研討班 2019/5/9
30
2 順序變數間的關聯性分析 在進行分析之前, 要先將變數重新編碼, 讓兩個變數的數值愈大者,代表同一個方向。 教育程度:
2 順序變數間的關聯性分析 在進行分析之前, 要先將變數重新編碼, 讓兩個變數的數值愈大者,代表同一個方向。 教育程度: 1.大專以上 2.高中 3.初中 4.國小 政治參與: 1.從不參與2.偶爾參與 3.經常參與 公共管理與政治學研究方法研討班 2019/5/9
31
政治無力感的測量 「有人說:『像我這樣的人的看法,政府官員是不會關心的』,請問您同不同意這種說法?」 「老百姓無影響力」:
「官員不關心」: 「有人說:『像我這樣的人的看法,政府官員是不會關心的』,請問您同不同意這種說法?」 「老百姓無影響力」: 「有人說:『像我這樣的普通老百姓,對政府的政策是沒有什麼影響力的』,請問您同不同意這種說法?」。 選項:1=非常不同意,2=不太同意,3=有點同意,4=非常同意 數值愈高者,表示愈感無力 公共管理與政治學研究方法研討班 2019/5/9
32
政治效能感的測量 「有人說:『像我這樣的人的看法,政府官員是不會關心的』,請問您同不同意這種說法?」 「老百姓無影響力」:
「官員不關心」: 「有人說:『像我這樣的人的看法,政府官員是不會關心的』,請問您同不同意這種說法?」 「老百姓無影響力」: 「有人說:『像我這樣的普通老百姓,對政府的政策是沒有什麼影響力的』,請問您同不同意這種說法?」。 選項:1=非常不同意,2=不太同意,3=有點同意,4=非常同意 數值愈低者,表示效能感愈高 重新編碼 公共管理與政治學研究方法研討班 2019/5/9
33
表4-5 民眾政治無力感的交叉分析 公共管理與政治學研究方法研討班 2019/5/9
34
兩個變數數值間的四種關係 P = 變數高低順序的方向一致的情況﹔ Q = 變數高低順序的方向不一致的情況﹔
=X順序相同,但是Y順序不相同的情況﹔ = Y順序相同,但是X順序不相同的情況。 公共管理與政治學研究方法研討班 2019/5/9
35
P = 變數高低順序的方向一致的情況 公共管理與政治學研究方法研討班 2019/5/9
36
Q = 變數高低順序的方向不一致的情況 公共管理與政治學研究方法研討班 2019/5/9
37
P: 表格中的數字,乘以該數字右下角(東南方)的數字並將以加總,而不管同一直欄或是同一橫列的數字。
上述四種情況的計算方式如下: P: 表格中的數字,乘以該數字右下角(東南方)的數字並將以加總,而不管同一直欄或是同一橫列的數字。 Q: 表格中的數字,乘以該數字左下角(西南方)的數字並將以加總,而不管同一直欄或是同一橫列的數字。 公共管理與政治學研究方法研討班 2019/5/9
38
:每一格數字乘以 同一橫列右方的數字並加總。 同一直欄下方的數字並加總。 公共管理與政治學研究方法研討班 2019/5/9
39
表8-5 民眾政治無力感的交叉分析_P 公共管理與政治學研究方法研討班 2019/5/9
40
表8-5 民眾政治無力感的交叉分析_Q 公共管理與政治學研究方法研討班 2019/5/9
41
表8-5 民眾政治無力感的交叉分析_X0 公共管理與政治學研究方法研討班 2019/5/9
42
表8-5 民眾政治無力感的交叉分析_Y0 公共管理與政治學研究方法研討班 2019/5/9
43
表4-6 各種等第變數間關聯性測量的方法 公共管理與政治學研究方法研討班 2019/5/9
44
3.等距變數間的關聯性分析 我們最常用的是皮爾森積差相關 (Pearson’s Product-moment correlation,
簡稱Pearson’s r)。 公共管理與政治學研究方法研討班 2019/5/9
45
皮爾森積差相關係數的分佈 皮爾森積差相關的係數值會落在-1與+1之間,這個值告訴我們兩個變數之間的關係的方向性以及關聯程度的強弱。
當係數為正時,表示兩個變數之間的關係是正向關係,也就是當一個變數增加的時候,另外一個變數也一樣增加。 當係數為負時,代表兩個變數之間的關係是負向關係,也就是當一個變數的值增加時,另外一個變數的值會減少。 當係數值為0,這表示兩個變數完全獨立,沒有任何關聯性。 皮爾森積差相關係數的絕對值愈大,代表兩個變數之間的關聯程度愈密切。 公共管理與政治學研究方法研討班 2019/5/9
46
皮爾森積差相關的係數的解釋 絕對值在0.25以下時,變數之間的關聯性是非常地弱。
絕對值在0.26到0.50之間,變數間的關係可以算是中等的關係。 絕對值落在0.51到0.75之間,則變數之間的關聯程度就算是不錯的程度。 絕對值大於0.75時,變數之間的關聯程度就是相當不錯或是極佳的關係。 對社會科學而言,由於測量工具的不夠精確,社會科學認為當兩個變數之間的相關係數達到0.30時,就算是具有重要實質的相關性。 公共管理與政治學研究方法研討班 2019/5/9
47
皮爾森積差相關係數的計算與解釋實例 公共管理與政治學研究方法研討班 2019/5/9
48
皮爾森積差相關係數的計算與解釋實例 經過計算之後,我們發現民眾對李登輝先生的評價與對國民黨的評價之間的關聯程度是0.63。表示民眾對李登輝的評價與對國民黨的評價之間的關聯方向是正向關係,也就是當民眾對李登輝先生的評價愈高,對國民黨的評價就傾向愈高。係數值為0.63,表示兩個變數之間具有不錯的關聯程度。 公共管理與政治學研究方法研討班 2019/5/9
49
SPSS的具體操作 召集令:舊雨新知 我們要檢視: 交流利益與統一傾向是否獨立(卡方獨立假定)
四個政治信任指標之間是否無關(等第變數關聯性檢定) 對民進黨與對國民黨評價是否無關(等比變數關聯性檢定) 公共管理與政治學研究方法研討班 2019/5/9
50
SPSS的重新編碼語法 兩岸經貿交流利益K5 統一傾向M5 政治信任D4、D5、D6、D7 對民進黨評價N2A 對國民黨評價N2
公共管理與政治學研究方法研討班 2019/5/9
51
SPSS的卡方獨立性檢定 經貿交流利益保留為三類(K5N) 也將統一傾向重新編碼為兩類(M5N)
Analyze Descriptive Statistics Crosstabs… 自變量利益預期(row)、應變量統一傾向(column) Statistics選chi-square Cell選row與adjusted Standardized 公共管理與政治學研究方法研討班 2019/5/9
52
經貿利益預期與對統一態度表格 公共管理與政治學研究方法研討班 2019/5/9
53
經貿利益預期與對統一態度 研究假設: 本研究認為:基於民眾理性自利的假設,當其預期兩岸經貿交流得以獲利的情況下,當較傾向支持統一;若其預期兩岸經貿交流損及其利益的情況下,當不傾向支持統一。 統計的 虛無假設:兩岸經貿交流利益與對統一的態度之間彼此獨立 對立假設: 公共管理與政治學研究方法研討班 2019/5/9
54
經貿利益預期與對統一態度:統計描述 從表一中可發現:卡方值為77.22、自由度為2,經過查表得知p<0.001,故拒絕虛無假設,經貿利益預期與對統一態度之間,彼此並不獨立。 公共管理與政治學研究方法研討班 2019/5/9
55
經貿利益預期與對統一態度:論文描述 在檢定前,已對因變量分佈做過初步描述。
從表一中的卡方獨立性檢定可以發現:經貿利益預期與對統一態度之間,彼此並不獨立。進一步觀察表格對經貿利益的預期與統一態度之間的關係,我們可以發現:相對於全體民眾,預期兩岸經貿將讓台灣整體經濟變好者,有顯著較高的比例贊成統一,其比例接近五成,而不贊成的比例也顯著較低,略超過五成。……至於民眾認為不變者,傾向贊成統一的比例較全體略高,約超過四成……。 公共管理與政治學研究方法研討班 2019/5/9
56
四項政治信任間關聯性檢定 1.重新編碼(方向正確):分數愈高愈信任 2.挑對統計方法 公共管理與政治學研究方法研討班 2019/5/9
57
SPSS的等第變數間的關聯性檢定 四個新變數 Analyze Correlate Bivariate… 放入四個變數
Correlation coefficient選擇正確 公共管理與政治學研究方法研討班 2019/5/9
58
政治信任等變數間的關聯性檢定 公共管理與政治學研究方法研討班 2019/5/9
59
政治信任等變數間的關聯性檢定 研究假設: 統計虛無假設 統計對立假設 公共管理與政治學研究方法研討班 2019/5/9
60
政治信任等變數間的描述 統計描述: 從表二中我們發現:經過統計檢定,四項政治信任指標之間具有顯著關聯性,彼此之間為正相關。 論文描述:
表二中我們檢視民眾在「做事正確」、「浪費稅金」、「考量民利」與「官員可信」等四個面向之間的相關程度達到統計上的顯著水準。彼此之間為正相關,…單挑兩兩比較 公共管理與政治學研究方法研討班 2019/5/9
61
SPSS的等比變數間的關聯性檢定 四個新變數 Analyze Correlate Bivariate… 放入四個變數
Correlation coefficient選擇正確 公共管理與政治學研究方法研討班 2019/5/9
62
政治信任與政黨喜愛間的關聯性檢定 研究假設: 統計虛無假設 統計對立假設 公共管理與政治學研究方法研討班 2019/5/9
63
SPSS的等比變數間的關聯性檢定 公共管理與政治學研究方法研討班 2019/5/9
64
政治信任與政黨喜愛間的關聯性檢定 統計描述:
從表三中我們發現:經過統計檢定,政治信任指標與政黨喜好程度之間之間具有顯著關聯性。其中,政治信任與對國民黨喜好之間為正相關,但與民進黨喜好之間為負相關。 論文描述: 表三中我們檢視民眾在政治信任指標與主要政黨偏好間的相關程度達到統計上的顯著水準。其中,政治信任與國民黨喜好程度為正相關,顯示在政黨輪替之後,民眾的政治信任反映了對於執政黨的喜好程度。…… 公共管理與政治學研究方法研討班 2019/5/9
Similar presentations