Presentation is loading. Please wait.

Presentation is loading. Please wait.

卡方檢定 11.1 基本概念 11.2 多項式母體比例的檢定 11.3 齊一性檢定與獨立性檢定 11.4 適合度檢定

Similar presentations


Presentation on theme: "卡方檢定 11.1 基本概念 11.2 多項式母體比例的檢定 11.3 齊一性檢定與獨立性檢定 11.4 適合度檢定"— Presentation transcript:

1

2 卡方檢定 11.1 基本概念 11.2 多項式母體比例的檢定 11.3 齊一性檢定與獨立性檢定 11.4 適合度檢定
11.1 基本概念 11.2 多項式母體比例的檢定 11.3 齊一性檢定與獨立性檢定 11.4 適合度檢定 11.5 常態母體的檢驗 11.6 電腦軟體操作說明 統計學導論 Chapter 11 卡方檢定

3 11.1 基本概念 例題 11.1 將一樣本觀察值區分成若干類別
11.1 基本概念 例題 11.1 將一樣本觀察值區分成若干類別 在一項市場調查分析中,研究某一產品之市場佔有率的情形。根據過去資料顯示,A、B、C三家公司之市場佔有率比值為1:2:1。今調查100位購買該產品的顧客,結果發現購自三家公司的人數如表11.1所示,請問這些資料是否顯示三家公司之市場佔有率已有改變? 表 購買三家公司之產品的顧客人數 統計學導論 Chapter 11 卡方檢定

4 H0:兩種品牌奶粉對嬰兒健康的效果並無差異
例題 /4 獨立樣本之分類   欲比較兩種品牌之奶粉A、B對嬰兒健康的影響效果,茲調查150個嬰兒,並自其中隨機抽出80位餵食A牌奶粉,另70位則以B牌奶粉餵食。經過一段時間,檢查每一位嬰兒的健康情況;假設將嬰兒的健康情況分為三類:優良、正常與不良,各類之嬰兒人數列於表11.2。於是,我們所欲檢定的虛無假設為: H0:兩種品牌奶粉對嬰兒健康的效果並無差異 統計學導論 Chapter 11 卡方檢定

5 例題 /4 表11.2中兩列數據來自獨立樣本,惟由於總數(150)為固定,且餵食A或B奶粉事前即已確定,因此不適合做各列相對次數的比較,故將之轉換為表11.2(a)。此外,若將母體之有關比例或機率列示於表11.2(b),則結合11.2(a)與11.2(b),將可更清楚地描述虛無假設。 表 以A、B品牌奶粉餵食嬰兒的健康情形 統計學導論 Chapter 11 卡方檢定

6 例題 11.2 3/4 表 11.2 (a) 表11.2之相對次數 表 11.2 (b)母體比例或機率
統計學導論 Chapter 11 卡方檢定

7 例題 11.2 4/4 上述虛無假設「奶粉A、B對健康效果無差異」,乃意指每一種健康情形之類別下,食用奶粉A與B之機率均相同,亦即:
注意:本例中每一行之機率值的和並不具任何意義。 統計學導論 Chapter 11 卡方檢定

8 例題 /2 根據兩種特徵分類 一組500人之隨機樣本,每一人均被詢及是否支持租稅改革方案,根據實際調查結果,將觀察次數列於表11.3。本例所欲檢定的問題是:這些資料是否足以說明,兩地區居民對改革方案之意見相同? 表 兩地區居民對租稅改革方案之意見 統計學導論 Chapter 11 卡方檢定

9 例題 /2 與例題11.2不同的是,本例只有一個單一隨機樣本,但樣本內被抽出的個體則可分為二類:A地區與B地區居民。就此而言,本例中虛無假設「無差異」乃指此兩個不同地區居民表示之意見為「獨立的」。換句話說,每一居民對改革方案的態度與該居民住哪一地區並不相關(亦即獨立)。 統計學導論 Chapter 11 卡方檢定

10 11.2 多項式母體比例的檢定 1/2 表 多項式母體比例檢定的資料結構 統計學導論 Chapter 11 卡方檢定

11 多項式母體比例的檢定 2/2 多項式母體比例卡方檢定(大樣本) 虛無假設:H0:p1=p10, p2=p20, …, pk+pk0
拒絕域:   ,其中 為df=k1之χ2分配中尾面積(機率)為α的χ2值。 統計學導論 Chapter 11 卡方檢定

12 例題 11.4 以表11.1之資料來討論多項式母體比例檢定的問題。假定虛無假設如同例題11.1所示: 試在α=0.05下做此檢定。
統計學導論 Chapter 11 卡方檢定

13 解: 表11.5 χ2統計量之計算 統計學導論 Chapter 11 卡方檢定

14 11.3 齊一性檢定與獨立性檢定 齊一性檢定 例題 /9 在例題11.2中,已建立「齊一性」(homogeneity)或「兩種品牌奶粉之效果無差異」的虛無假設,即: 為討論方便,再將表11.2重繪如表11.6。如同前述,表中各列的總計分別為80與70,乃是事先設定的樣本大小。若以p1、p2、p3代表在H0下兩個不同母體(兩種品牌奶粉)之共同機率(common probability) 統計學導論 Chapter 11 卡方檢定

15 例題 /9 ,則每一列各方格(cell)之期望次數應等於這些機率值分別乘以每一列的樣本大小,亦即第一列各方格之期望次數分別為80p1、80p2、80p3,而第二列則為70p1、70p2、70p3。然而,H0並未設定p1、p2、p3之值,因此需先估計這些參數。 表 例題11.2中的 2×3列聯表 統計學導論 Chapter 11 卡方檢定

16 例題 11.5 3/9 由表11.6知,各行總和分別為54、57、39,而總樣本大小為150。因此,在H0下各個機率之估計值為:
根據這些估計的機率值,第一列各方格的期望次數分別為: 統計學導論 Chapter 11 卡方檢定

17 例題 11.5 4/9 相同地,第二列各方格之期望次數亦可依相同方式求得。由此,我們可歸納出計算各方格之期望次數的法則如下:
茲將依(11-3)式所計算出來的各方格期望次數列示於表11.7,表11.7中各方格之數據包括觀察次數fi(未括弧者)與期望次ei(括弧者)。然後計算各方格之「觀察次數」與「期望次數」的差異: (11-3) 統計學導論 Chapter 11 卡方檢定

18 例題 11.5 5/9 並將結果列示於表11.8。最後,將表11.8每一方格之數據加總,可得χ2統計量之值:
表 觀察次數fi與期望次數ei 統計學導論 Chapter 11 卡方檢定

19 例題 11.5 6/9 接著,計算χ2分配的自由度。有關列聯表之自由度的計算,其公式如下: (11-4)
表 (fi-ei)2/ei之值 (11-4) 統計學導論 Chapter 11 卡方檢定

20 例題 /9 (11-4)式的觀念可參考表11.9。由於r×c列聯表共有rc個方格(觀察資料),故有自由度rc,然每一列及每一行的總數在抽樣完後,其為固定值,因此每一列及每一行皆將失去一個自由度(如表11.9中劃×者),故共失去(r+c)個自由度;但是其中有一自由度乃重複計算者(如表11.9中劃××者),故最後再加上一個自由度,亦即: 列聯表之自由度=總方格數(rc)列數(r) 行數(c)+1 統計學導論 Chapter 11 卡方檢定

21 例題 /9 表 11.9 列聯表之自由度的計算 統計學導論 Chapter 11 卡方檢定

22 例題 /9 本例中,由於包含r=2列、c=3行,故自由度為df=(2-1)(3-1)=2。在df=2, α=5%下,查表得知   (2)=5.99,此值小於觀察所得之χ2統計量值8.224,故虛無假設在α=0.05水準下將被拒絕。換句話說,表11.6所列資料顯示以兩種品牌奶粉餵食嬰兒對其健康效果有顯著的差異。 上面既已檢定得知具有顯著差異,接著可從表11.7與11.8找出顯著差異的原因。由表11.7與11.8可發現,如此大的χ2值可歸因於「優良」那一類,因為該類別中,奶粉A的相對次數為37/80或46%,而奶粉B的相對次數則為17/70或24%。僅就此而言,即足以顯示奶粉A對健康效果較有幫助。 統計學導論 Chapter 11 卡方檢定

23 列聯表之齊一性χ2檢定 虛無假設:H0:某一理論分配所得出之現象(各類別出現之機率) 檢定統計量: fi:觀察次數
ei:期望次數= (11-3)式 自由度df=(列數-1)‧(行數-1) 拒絕域: 統計學導論 Chapter 11 卡方檢定

24 例題 11.6 一項對各行業職員酒精中毒的研究,調查對象包括牧師、教育界人士、行政部門與商人,實際觀察之資料列示於表11.10。試檢定此4種行業職員酒精中毒之比率是否相同? 表 酒精中毒與行業別之列聯表 統計學導論 Chapter 11 卡方檢定

25 解: 表 表11.10之(fi-ei)2/ei的值 統計學導論 Chapter 11 卡方檢定

26 例題 11.7 欲探討某一化學處理對於種子發芽比例的可能效果。茲栽種100顆經過化學處理的種子,以及150顆未經過處理的種子。觀察種子發芽情形如表11.12所示;根據此組資料,是否足以證明經過處理與未經處理的種子,其發芽比例不同? 表 例題11.7之觀察次數fi與期望次數ei 統計學導論 Chapter 11 卡方檢定

27 獨立性檢定 例題 /9 參考例題11.3,茲再將表11.3繪製如表11.14,此時500人的單一隨機樣本分類為6個方格(cell)。 表 兩地區居民對租稅改革方案之意見的列聯表 統計學導論 Chapter 11 卡方檢定

28 例題 /9 將每一方格的次數除以樣本大小500,即為其相對次數,如表11.14(a)所示。此時列邊際總計為0.570與0.430,分別代表A地區與B地區之居民的樣本比例。同理,行邊際總計亦分別代表三種態度類別的樣本比例。 表 (a)每一方格觀察值的比例 統計學導論 Chapter 11 卡方檢定

29 例題 /9 假定整個母體皆已分類,則未知的母體比例(即方格機率)可用表11.14(b)中的元素代表,其中下標A與B代表A地區與B地區,而1、2與3則代表「贊同」、「無意見」與「反對」的類別。 表 (b) 方格之機率結構 統計學導論 Chapter 11 卡方檢定

30 例題 11.8 4/9 表11.14(b)與表11.14(a)來自類似母體,其所代表的意義如下: 方格機率pA1=p(A地區且贊同)
    行邊際機率p1=p(贊同) 我們所要探討的是,檢定二種分類互為獨立的虛無假設。根據事件獨立的機率性質,可知若態度類別與地區類別互為獨立(亦即人們對租稅改革方案的意見與其來自A或B地區無關),則pA1=pA×p1, pA2=pA×p2…餘此類推。於是,有關獨立性檢定,其虛無假設可界定為: H0:每一方格機率=相對應的列與行邊際機率的乘積 統計學導論 Chapter 11 卡方檢定

31 例題 11.8 5/9 進行χ2檢定時,我們仍然先求出在H0下,每一方格的期望次數:
這些期望次數均含有未知的邊際機率,故應先由觀察資料求出邊際機率的估計值(參考表11.14): 統計學導論 Chapter 11 卡方檢定

32 例題 11.8 6/9 於是可求出各方格的期望次數,例如第一個方格的期望次數為: 由此可知,各方格的期望次數之計算公式如下:
統計學導論 Chapter 11 卡方檢定

33 例題 /9 此與齊一性檢定相同。表11.14(c)列示各方格的觀察次數fi與期望次數ei,後者列於括弧內。另外,「觀察次數」與「期望次數」之差異的衡量仍同於一般χ2檢定的觀念,即    。表11.14(d)列出各方格的差異值,並算出所有差異值的總和。 表 (C) 觀察次數與期望次數 統計學導論 Chapter 11 卡方檢定

34 例題 /9 此時χ2分配的自由度亦與前述齊一性檢定的問題相同,亦即df=(r1)(c1)=(21)(31)=2。在顯著水準α=0.05下,查表得知 。由於觀察的χ2統計量值為22.153遠大於 ,故在α=0.05水準下,拒絕獨立性的虛無假設。換句話說,民眾所表示的意見與其來自的地區有關。 表 (d) 之值 統計學導論 Chapter 11 卡方檢定

35 例題 /9 若詳細觀察表11.14(d),可發現χ2值大部分歸諸於邊角的方格(亦即這些方格的差異值(fi-ei)2/ei較大)。此外,比較表11.14(c)之觀察次數與期望次數,亦可發現支持此項改革方案的A地區居民遠多於B地區居民。 統計學導論 Chapter 11 卡方檢定

36 例題 11.9 某公司想瞭解員工對現行的獎勵制度是否滿意,於是調查210名員工,所得資料依性別與滿意度繪示如表11.16所示。請在α=0.05水準下,檢定性別與滿意度無關。 表 ×2列聯表 統計學導論 Chapter 11 卡方檢定

37 11.4 適合度檢定 例題 11.10 調查100戶家庭,發現其所擁有的小孩人數之資料分布如表11.17所示。試檢定此組資料是否屬於p=0.4的二項分配(α=0.2)? 表 戶家庭所擁有的小孩人數 統計學導論 Chapter 11 卡方檢定

38 解: 表11.17(a) 期望次數之計算 表11.17(b) χ2統計量的計算 統計學導論 Chapter 11 卡方檢定

39 例題 11.11 設某公司過去50週來,每週所銷售的高科技設備套數如下表所示:
試以α=0.1,檢定上述資料是否來自poisson分配的母體。 統計學導論 Chapter 11 卡方檢定

40 解: 表 期望次數、觀察次數及   值 統計學導論 Chapter 11 卡方檢定

41 11.5 常態母體的檢驗 常態機率紙檢驗 圖11.1 常態機率圖的轉換觀念 統計學導論 Chapter 11 卡方檢定

42 圖11.2 常態機率紙:證明當X的分配為N(μ, σ2)時,P(X≤x)的圖形
常態機率紙檢驗 2/2 圖11.2 常態機率紙:證明當X的分配為N(μ, σ2)時,P(X≤x)的圖形 統計學導論 Chapter 11 卡方檢定

43 建構常態機率圖的步驟 (1)將n個觀測值依大小次序排列。 (2)選擇一個適當的橫軸尺度,以便安置所有的觀測值。
(3)在縱座標上描繪出對應於橫座標上第i個觀測值的修正累積相對次數,即 (4)檢驗所描繪圖形與一直線偏離的情況;若呈系統性的偏離,則表示缺乏常態性。 統計學導論 Chapter 11 卡方檢定

44 繪圖於常態機率紙 圖11.3 繪圖於常態機率紙 統計學導論 Chapter 11 卡方檢定

45 例題 11.12 隨機抽查某工廠生產的50個零件,測量其長度(cm)如下: 請問,能否認為該工廠生產的零件長度服從常態分配?
統計學導論 Chapter 11 卡方檢定

46 解: 統計學導論 Chapter 11 卡方檢定

47 解: 圖 例題 的常態機率圖 統計學導論 Chapter 11 卡方檢定

48 適合度檢定之檢驗 例題 11.13 設抽自一母體的隨機樣本(n=106),其觀察值的次數分配如下表所示。試在α=0.01的水準下,檢定此母體是否為常態分配: 統計學導論 Chapter 11 卡方檢定

49 解: 圖 標準常態各區域的面積(機率) 統計學導論 Chapter 11 卡方檢定

50 解: 表 期望次數、觀察次數與(fi-ei)2/ei之值 統計學導論 Chapter 11 卡方檢定

51 例題 11.14 某公司招募職員,設有50 位應徵者,其性向測驗成 績如下表所示,試以α= 0.10檢定此組資料是否為 常態分配。
統計學導論 Chapter 11 卡方檢定

52 解: 圖11.6 N(68.64, 10.41)分為10個等機率的區間 統計學導論 Chapter 11 卡方檢定

53 解: 表 期望次數、觀察次數及(fiei)2/ei之值 統計學導論 Chapter 11 卡方檢定

54 例題 11.15 以適合度檢定法,重做例題11.12 (α=0.05)。 統計學導論 Chapter 11 卡方檢定

55 解: 統計學導論 Chapter 11 卡方檢定


Download ppt "卡方檢定 11.1 基本概念 11.2 多項式母體比例的檢定 11.3 齊一性檢定與獨立性檢定 11.4 適合度檢定"

Similar presentations


Ads by Google