第一章
第十三章 卡方檢定
本章綜覽 介紹檢定母體參數以外母體特性的方法。 配適度檢定:檢定母體是否為某一分配。 獨立性檢定:檢定兩種隨機變數之間是否互相獨立。 同質性檢定:檢定兩組或多個母體是否具有相同的 分配。
配適度檢定 藉著比較樣本觀察值的次數分配和假設的母體分配是否「接近」或「相似」,來判斷資料是否來自假設的分配。 相關的檢定方法稱為配適度檢定 (goodness-of-fit test)。 檢定的虛無假設為母體屬於某種分配。 例如:H0:母體為常態分配。
配適度檢定 先將 N 個觀察值的樣本分成 K 組後,求出各組的樣本個數。令 ni 表示樣本觀察值屬於第 i 組的次數,pi= ni / N 代表第 i 組的相對次數,πi 代表某特定分配所對應的各組的母體機率。 在虛無假設之下,當 N 很大時,
配適度檢定-- 例 13.1 檢定下表中學生的偏好是否為均等分配。 在虛無假設之下,學生選擇八位老師中任何一位的機率均為 πi =1/8,故理論上對應於每一位老師均應有 Nπi =10 位同學。此時, 不拒絕虛無假設,因此推論這些學生對老師並無特殊偏好。
配適度檢定-- 例 13.2 若是虛無假設中的機率分配需要我們估計參數值,則每多估計一個參數值,虛無分配就少一個自由度。 檢定下表的資料是否來自波氏分配?
配適度檢定-- 例 13.2 由於波氏分配的參數λ未知,故需要先用樣本平均數估計λ ,得到 。 計算出上表中的理論次數欄。 檢定統計量為 由於波氏分配的參數λ未知,故需要先用樣本平均數估計λ ,得到 。 計算出上表中的理論次數欄。 檢定統計量為 不拒絕虛無假設,從而推論國人赴歐觀光次數為波氏分配。
獨立性檢定 設有 X , Y 兩種隨機變數,共有 N 個實現值。而 X 共可分為 r 類;Y 共可分為 c 類,總結如右表。 類別 獨立性檢定 (independent test):檢定兩種隨機變數之間是否互相獨立的方法。 假 設有 X , Y 兩種隨機變數,共有 N 個實現值。而 X 共可分為 r 類;Y 共可分為 c 類,總結如右表。 類別 Y 1 2 … c X n11 n12 n1c n21 n22 n2c r nr1 nr2 nrc
獨立性檢定 不論 Y 的實現值為何,X 的實現值屬於其分類中第 i 類的個數為: 所以
獨立性檢定 相對次數為 檢定統計量為 在 H0 成立下,預期實際觀察到的 pij 應該和 pi.× p.j 之間相當接近。換言之,可以利用 N pij = nij 和 N pi.p.j = (ni.×n.j)/N 之差距來檢定 H0。
獨立性檢定-- 例 13.3 檢定教育程度是否和性別無關。 首先要求出六筆調查結果的理論值,如下頁所示 。
獨立性檢定-- 例 13.3 六筆調查結果的理論值如下:
獨立性檢定-- 例 13.3 根據以上數字計算檢定統計量: 拒絕虛無假設,並推論性別與教育程度之間並非互相獨立。
同質性檢定 同質性檢定 (homogeneity test):檢查兩個 (或多個) 母體是否具有相同的分配,或是兩組 (或多組) 隨機樣本是否取自相同的分配。 此方法是檢定分配是否相同,而非檢定分配的類型。 同質性檢定的統計檢定量:
同質性檢定 同質性檢定的統計檢定量和獨立性檢定一樣,只是樣本選取的方式不同。 同質性檢定: 先抽取隨機樣本,再觀察在各種分類之下的次數。 同質性檢定: 先抽取隨機樣本,再觀察在各種分類之下的次數。 獨立性檢定: 在不同母體中抽取隨機樣本。
同質性檢定-- 例13.4 檢定兩直轄市的施政滿意度是否一樣? 六筆調查結果的理論值如下:
同質性檢定-- 例13.4 檢定統計量為: 拒絕虛無假設,並推論台北市和高雄市民眾對總統施政滿意度的分配不盡相同。