Chi Square 謝寶煖 台灣大學圖書資訊學系 2007年10月13日
自變數、依變數均屬類別變數時,運用X2- test來檢驗其差異顯著性
Outline Overview Bivariate Tabular Analysis Generalizing from Samples to Populations Chi Square Requirements Collapsing Values Computing Chi Square Interpreting the Chi Square Value Measures of Association SPSS procedure
Overview Chi square是雙變項交叉表的無母數統計檢定方法。 適切地執行統計顯著性檢定,讓我們知道有多大的信心(degree of confidence)接受或拒絕(accepting or rejecting)一項假設(hypothesis)。 一般而言, chi square 的假設檢定(hypothesis test)是檢定兩個不同的樣本(人數、關鍵詞出現次數等)的特定屬性或面向的差異是否夠大到可以從樣本一般化到母群體。 無母數統計檢定, chi square,是一種粗估計,可以接受較不正確的資料做為input;相較於t-tests和ANOVA等的母數檢定
Chi square最常用來檢定雙變項交叉表(bivariate tables )的統計顯著性,通常在詮釋結果時,交叉表要與卡方檢定整合
雙變項交叉分析 Bivariate Tabular Analysis 雙變項交叉表是用來描述自變項和依變項之間是否存在任何關係 例如想要知道台大學生中,男生女生對手機的偏好是否有任何關係。 儘可能隨機地找50位男生和50位女生,問他們喜愛的手機 自變項是性別 依變項是手機品牌 自變項是可以經由抽樣控制的,是假設的特性或屬性用來預測或解釋其他的屬性或特性(依變項) 控制自變項,衡量依變項,檢定假設,以知自變與依變項是否有關係存在
雙變項交叉分析 雙變項交叉分析可用以回答下列問題 兩個變項是否有某種關係(relationship)存在? 由資料中顯示出兩變項的關係有多強(strong )? 關係的方向(direction)或樣態(shape) 為何? 該關係是否係其他變項所造成? intervening variable(s)
B A 男生 女生 Nokia Motorola Ben Q Other 男生 女生 Nokia Motorola Ben Q Alcatel Other 男生 女生 男生 女生 Nokia Motorola Ben Q Alcatel Other
雙變項交叉分析表 自變項:Y軸,垂直軸(SPSS:列) 依變項:X軸,水平軸(SPSS:直行) 方便讀者閱讀,由自變項到結果(依變項) 怎麼組織交叉分析表是取決於研究問題或研究假設 例如:自變項是由小到大排列,依變項的值是由左到右,由小到大,則將呈現由左到右的正相關 (請注意:相關,並不等於因果關係)
雙變項交叉分析表 Nokia Motorola Ben Q Alcatel Other 男生 6 17 13 9 5 女生 7 16
分析>描述性統計>交叉表
資料呈現 交叉分析,不必要顯示所有的橫行百分比、直行百分比及總百分比;很多時候,可能僅需要顯示橫行百分比,和每一橫行之總次數,即可。
交叉分析 主要功能是探討多個變項的關聯分佈,並以表格的型式呈現 卡方檢定,檢定變數間的獨立性 每一格可以顯示次數、期望次數、總百分比、列百分比等 由次數分佈狀況,可以知道某變數在其他變數內的分配狀況,可知變數間的關係。 卡方檢定,檢定變數間的獨立性
交叉分析 卡方統計量(Chi-square) 相關(correlations) 根據變數性質,選擇適當之統計量 當2X2表格內的觀察值數目少於20時,可以方格內的次數值計算Fisher的準確測量值 其他的2X2表格,則以Yates修正後的卡方檢定量計算 相關(correlations) 計算Pearson相關係數 根據變數性質,選擇適當之統計量 名義:如果表格中的橫列和直行都含有名義變數 次序:如果表格中的橫列和直行都含有次序變數 名義對等距:當一個變數為類別,而另一個為等距數值時,請選取「Eta 值」 Kappa 統計量數:如果表格中的直行類別與橫列相同時 (例如測量兩位評估者之間的一致性),請選取「Cohen Kappa值」。
Pearson卡方檢定統計量的值為14. 027 ,P值小於0. 007. 在顯著水準為0 2=14.027, df=4, p<0.01
* p< .05 ** p< .01 ***p< .001 不太於0的數值,小數點前的零應省略。(APA Style)
卡方檢定 虛無假設H0:兩個變數X與Y是獨立的 表示變數X與變數Y,沒有關聯
Pearson卡方檢定統計量的值為12. 844 ,P值小於0. 0001. 在顯著水準為0
檢視交又表可知,男生已選修或正在選修資訊素養課程之比例,明顯高於女生
個案二 有沒有修過課是否會影響其對課程區隔因素之看法?
但是因為期望個數少於5的方格數超過10%,使得卡方檢定有不準確之虞,因此,前述顯著性之結論可能不成立。 Pearson卡方檢定統計量的值為10.122,P值小於0.038,在顯著水準為0.05時,(推翻兩變數為統計獨立之虛無假設)顯示是否修過課對課程區隔因素之看法,達到統計上之顯著。 經卡方檢定,在0.05下達到顯著(2(4)=10.122, p=0.038) 但是因為期望個數少於5的方格數超過10%,使得卡方檢定有不準確之虞,因此,前述顯著性之結論可能不成立。
Web Chi Square Calculator http://www.georgetown.edu/faculty/ballc/webtools/web_chi.html
用Word打公式 插入>功能變數>Eq > 方程式編輯器
Thank You! Q & A