第10章 類別資料分析
前言 在社會科學裡面,常會處理類別資料,例如性別、省籍、宗教信仰、居住地區、政黨傾向、投票行為等。 本章介紹類別資料的分析方法,它們是建立在卡方分佈c2上。主要包括四種適用於分析列聯表的卡方檢定:適合度檢定、獨立性檢定、同質性檢定、改變的檢定。
第一節 適合度檢定(1) 當硬幣是公平,丟硬幣100次,出現正反面的次數約在50次左右。現在正反面出現的次數分別為45和55,那麼硬幣是否公平呢? 10年前的社會調查裡,發現女性婚後和公婆同住的意願分別為:願意(5成)、不願意(4成)、非常不願意(1成)。10年後的今天重複這項調查,抽樣1000位女性,發現:願意(4成)、不願意(5成)、非常不願意(1成)。這與10年的調查是否一致?
第一節 適合度檢定(2) 以上這些問題都在回答觀察的分佈是否與期望的分佈一致。例如觀察了硬幣出現的次數分佈,是否符合硬幣公平的期望。觀察女性的意願分佈是否與10年前的分佈相同。 這都是在檢定觀察分佈與期望分佈的適合度,所以稱為適合度檢定。
第一節 適合度檢定(3) Karl Pearson提出他的看法,令Oj表示第j個觀察次數,Ej表示其期望次數,J表示類別數。則 在虛無假設為真(觀察分佈與期望分佈一致)的情況下,且樣本數很大時,X2會近似自由度為J-1的卡方分佈。X2越大就越表示觀察次數與期望次數越不一致。卡方檢定屬於單尾檢定,也就是只有當X2非常大時,才會拒絕虛無假設。
第一節 適合度檢定(4) 例子1 10年前調查女性對與婚後公婆同住的意願,發現:願意(5成)、不願意(4成)、非常不願意(1成)。10年後的今天重複這項調查,抽樣1000位女性,發現:願意(4成)、不願意(5成)、非常不願意(1成)。這與10年的調查是否一致?
第一節 適合度檢定(5) 作法 X2為45,在0.05顯著水準,自由度為2的卡方分佈臨界值為5.99,故拒絕虛無假設。
第一節 適合度檢定(6) 例子2 承上題,如果只是抽樣100人,而不是1000人,結果如表2,是否可以拒絕虛無假設? X2為4.5,小於臨界值5.99, 故無法拒絕。
第二節 獨立性檢定(1) 在上述適合度檢定中,只關心女性的態度。可是有的時候我們可能同時關心男性與女性,例如性別與對婚後與男方父母同住的態度是否有關。本節裡的獨立性檢定(test of independence)就可用於這類的問題。 假設母體有著兩種分類方式,如性別和政黨傾向。透過卡方的獨立性檢定以瞭解這兩種分類是否獨立。首先從這個母體中隨機抽取大小為N的樣本,然後依照性別和政黨傾向加以分類,並分至行和列的細格中,計算各細格的人數。
第二節 獨立性檢定(2) 令Oij表示第i列第j行的觀察值,Eij表示第i列第j行的期望值,Ni+表示第i列的總和,N+j表示第j行的總和,N是樣本數。
第二節 獨立性檢定(3) 基於虛無假設:行和列無關成立的情況下,Eij就是按比例分佈, 即 令O表示觀察值,E表示期望值, 會近似c2分佈,其自由度是(I-1)(J-1)。
第二節 獨立性檢定(4) 例子3 某研究者想瞭解性別和政黨傾向是否有關,隨機抽樣50人,詢問其政黨傾向,性別和政黨傾向有關嗎?
第二節 獨立性檢定(5) X2 = 1.67小於臨界值5.99,因此無法拒絕虛無假設。
第三節 同質性檢定 (1) 獨立性的檢定在探討兩種分類方式是否獨立。同質性檢定在於探討兩個獨立的樣本是否來自同一個母體。這兩種分析方式,在統計處理上完全一樣,抽樣的方法上略有不同。 在獨立性檢定中,只抽取一個樣本。但在同質性檢定中,則是抽取多個樣本。 在實際資料分析上,兩者並無區別。性別若和政黨傾向無關,表示男女在政黨傾向並無不同。
第三節 同質性檢定 (2) 例子4 不同居住地區在「政府施政是否重北輕南」的感受是否不同?
第三節 同質性檢定 (3) X2 = 大於臨界值5.99,因此拒絕虛無假設。
第四節 改變的方向性檢定(1) 廣告商會很想知道他們的廣告是否可以改變消費者的購買行為,教育工作人員也會想知道某種實驗或教學方式是否會改變學生的學習行為,候選人也會想知道某場電視辯論後,選民對他的態度是否變好或變壞。 諸如這些問題,可以用卡方分佈來探討改變的方向性檢定。
第四節 改變的方向性檢定(2) 改變態度的只有B + C人,如果這個實驗對正向改變和負向改變的影響是一樣,在B + C人中應有一半的人產生正向改變,另一半的人產生負向改變。正負向改變的期望值均為(B + C) / 2。
第四節 改變的方向性檢定(3) X2可和自由度為1的卡方分佈來作檢定,如果達顯著水準,就說正向改變和負向不一樣。
第四節 改變的方向性檢定(4) 例子5 隨機抽取100位消費者,調查其購買某品的意願,接著提供該產品試用,最後再詢問其購買意願,讓消費者使用試用產品是有效的策略嗎?
第四節 改變的方向性檢定(5) 作法 試用前後購買態度改變的共30人,其中由會變為不會者5人,由不會變為會的25人。 大於自由度1的卡方分佈於0.05顯著水準的臨界值3.84,因此拒絕虛無假設,宣稱試用產品的策略會改變消費者的購買意願。
第五節 標準化殘差(1) 如果X2很大,就會拒絕虛無假設。可進行事後比較,以便發現哪些細格造成X2變得很大。 檢定每個細格 是否過大的第一種方法是將該值與自由度為1的卡方分佈相比較。 第二種方法就是將 開根號,即 和Z分佈比較。Zij稱為標準化殘差。
第五節 標準化殘差(2) 例子6 某民意調查機構抽樣電話訪問了899位成人,詢問其將會選2位候選人中的哪一個。
第五節 標準化殘差(3) 每格細格的 進行事後比較,在自由度為1,0.05的顯著水準下,卡方分佈的臨界值為3.84。因此只有「外省/1號」的細格不吻合虛無假設(省籍與支持度無關)。
第五節 標準化殘差(4) 每個細格的標準化殘差 Z分佈的臨界值為1.96,只有「外省/1號」的細格不吻合虛無假設。由於殘差是負的,表示觀察次數小於期望次數。換句話說,外省籍的人士明顯的不支持1號候選人。
第六節 期望值的大小(1) 本章所述的卡方檢定建立在利用多變項常態分佈代替多項式分佈的基礎上每個細格的期望次數也應很大,才能以卡方分佈進行檢定。 如果是適合度檢定,每個細格期望次數要大於10。如果是獨立性檢定或同質性檢定,每個細格期望次數要大於5。如果有四分之一以上的細格期望次數小於5,那就不適用卡方檢定。
第六節 期望值的大小(2) 解決期望值太小的方法 1. 再抽樣調查以補足資料 2. 去掉期望值小於5的類別 3. 將類別加以合併
第七節 關連強度的測量(1) 一旦發現了行與列有關連,接下來要回答的問題就是:關連強度有多大。通常可用下列幾種指標:列聯係數、f 相關係數、fC 相關係數、Kappa係數。
第七節 關連強度的測量(2) 列聯係數 其中X2為計算的卡方值,n為樣本數。C的最小值為0,但最大值為 ,其中K是列數I和行數J中的較小者。
第七節 關連強度的測量(3) f 相關 對於22的列聯表而言: 若調查性別(男、女)與省籍(本省、外省)的關係。然後將性別定義為X變項,省籍為Y變項。X和Y變項都是二元變項,計算積差相關會等於f。可以用積差相關的觀念來解釋f。 fC相關 對於不是22的列聯表而言:
第七節 關連強度的測量(4) 例子7 承例子6,省籍與投票傾向的關連強度有多大? 作法 X2 = 13.56,列聯係數 f 相關為
第七節 關連強度的測量(5) Kappa(k) 兩位評審的一致程度有多大?
第七節 關連強度的測量(6) 對角線的次數就是這兩位評審看法一致的件數。在100件作品裡,共有80件作品的看法一致。因此這兩位評審的一致性高達0.8(= 80 / 100)。 事實上,即便兩位評審的看法完全無關,因為機率的原因,對角線也會存在某些次數。因此在計算兩位評審的一致性,應該扣除這些次數。
第七節 關連強度的測量(7)