Download presentation
Presentation is loading. Please wait.
1
Chi Square 謝寶煖 台灣大學圖書資訊學系 2007年10月13日
2
自變數、依變數均屬類別變數時,運用X2- test來檢驗其差異顯著性
3
Outline Overview Bivariate Tabular Analysis
Generalizing from Samples to Populations Chi Square Requirements Collapsing Values Computing Chi Square Interpreting the Chi Square Value Measures of Association SPSS procedure
4
Overview Chi square是雙變項交叉表的無母數統計檢定方法。
適切地執行統計顯著性檢定,讓我們知道有多大的信心(degree of confidence)接受或拒絕(accepting or rejecting)一項假設(hypothesis)。 一般而言, chi square 的假設檢定(hypothesis test)是檢定兩個不同的樣本(人數、關鍵詞出現次數等)的特定屬性或面向的差異是否夠大到可以從樣本一般化到母群體。 無母數統計檢定, chi square,是一種粗估計,可以接受較不正確的資料做為input;相較於t-tests和ANOVA等的母數檢定
5
Chi square最常用來檢定雙變項交叉表(bivariate tables )的統計顯著性,通常在詮釋結果時,交叉表要與卡方檢定整合
6
雙變項交叉分析 Bivariate Tabular Analysis 雙變項交叉表是用來描述自變項和依變項之間是否存在任何關係
例如想要知道台大學生中,男生女生對手機的偏好是否有任何關係。 儘可能隨機地找50位男生和50位女生,問他們喜愛的手機 自變項是性別 依變項是手機品牌 自變項是可以經由抽樣控制的,是假設的特性或屬性用來預測或解釋其他的屬性或特性(依變項) 控制自變項,衡量依變項,檢定假設,以知自變與依變項是否有關係存在
7
雙變項交叉分析 雙變項交叉分析可用以回答下列問題 兩個變項是否有某種關係(relationship)存在?
由資料中顯示出兩變項的關係有多強(strong )? 關係的方向(direction)或樣態(shape) 為何? 該關係是否係其他變項所造成? intervening variable(s)
8
B A 男生 女生 Nokia Motorola Ben Q Other 男生 女生 Nokia Motorola Ben Q
Alcatel Other 男生 女生 男生 女生 Nokia Motorola Ben Q Alcatel Other
9
雙變項交叉分析表 自變項:Y軸,垂直軸(SPSS:列) 依變項:X軸,水平軸(SPSS:直行) 方便讀者閱讀,由自變項到結果(依變項)
怎麼組織交叉分析表是取決於研究問題或研究假設 例如:自變項是由小到大排列,依變項的值是由左到右,由小到大,則將呈現由左到右的正相關 (請注意:相關,並不等於因果關係)
10
雙變項交叉分析表 Nokia Motorola Ben Q Alcatel Other 男生 6 17 13 9 5 女生 7 16
11
分析>描述性統計>交叉表
15
資料呈現 交叉分析,不必要顯示所有的橫行百分比、直行百分比及總百分比;很多時候,可能僅需要顯示橫行百分比,和每一橫行之總次數,即可。
16
交叉分析 主要功能是探討多個變項的關聯分佈,並以表格的型式呈現 卡方檢定,檢定變數間的獨立性
每一格可以顯示次數、期望次數、總百分比、列百分比等 由次數分佈狀況,可以知道某變數在其他變數內的分配狀況,可知變數間的關係。 卡方檢定,檢定變數間的獨立性
18
交叉分析 卡方統計量(Chi-square) 相關(correlations) 根據變數性質,選擇適當之統計量
當2X2表格內的觀察值數目少於20時,可以方格內的次數值計算Fisher的準確測量值 其他的2X2表格,則以Yates修正後的卡方檢定量計算 相關(correlations) 計算Pearson相關係數 根據變數性質,選擇適當之統計量 名義:如果表格中的橫列和直行都含有名義變數 次序:如果表格中的橫列和直行都含有次序變數 名義對等距:當一個變數為類別,而另一個為等距數值時,請選取「Eta 值」 Kappa 統計量數:如果表格中的直行類別與橫列相同時 (例如測量兩位評估者之間的一致性),請選取「Cohen Kappa值」。
19
Pearson卡方檢定統計量的值為14. 027 ,P值小於0. 007. 在顯著水準為0
2=14.027, df=4, p<0.01
20
* p< .05 ** p< .01 ***p< .001 不太於0的數值,小數點前的零應省略。(APA Style)
22
卡方檢定 虛無假設H0:兩個變數X與Y是獨立的 表示變數X與變數Y,沒有關聯
23
Pearson卡方檢定統計量的值為12. 844 ,P值小於0. 0001. 在顯著水準為0
24
檢視交又表可知,男生已選修或正在選修資訊素養課程之比例,明顯高於女生
25
個案二 有沒有修過課是否會影響其對課程區隔因素之看法?
27
但是因為期望個數少於5的方格數超過10%,使得卡方檢定有不準確之虞,因此,前述顯著性之結論可能不成立。
Pearson卡方檢定統計量的值為10.122,P值小於0.038,在顯著水準為0.05時,(推翻兩變數為統計獨立之虛無假設)顯示是否修過課對課程區隔因素之看法,達到統計上之顯著。 經卡方檢定,在0.05下達到顯著(2(4)=10.122, p=0.038) 但是因為期望個數少於5的方格數超過10%,使得卡方檢定有不準確之虞,因此,前述顯著性之結論可能不成立。
28
Web Chi Square Calculator
29
用Word打公式 插入>功能變數>Eq > 方程式編輯器
30
Thank You! Q & A
Similar presentations