第 12 章 適合度與獨立性的檢定
統計實例 聯合基金會 (United Way of Greater Rochester) 是一個非營 利性的組織。該組織藉由滿足 社區居民最重要的生活照顧需 求,改善其所服務 7 個郡居民 的生活品質。 聯合基金會決定進行一項調查,以進一步瞭解社區居民對慈善活動的感受。 從蒐集到的資料中,可以得到許多描述性的統計,包括次數分配與交叉表格等。 本章中,你將學到如何進行如上述的獨立性統計檢定。 第12章 適合度與獨立性的檢定 第448頁
第12章 適合度與獨立性的檢定 12.1 適合度檢定:多項母體 12.2 獨立性檢定 12.3 適合度檢定:卜瓦松分配與常態分配 第12章 適合度與獨立性的檢定 12.1 適合度檢定:多項母體 12.2 獨立性檢定 12.3 適合度檢定:卜瓦松分配與常態分配 第12章 適合度與獨立性的檢定 第447頁
無母數統計方法 傳統估計與檢定都要求母體分配已知,或為常態分配,若母體分配不合乎基本假設時,則傳統統計方法將會失效 「無母數統計方法」通常不管母體分配而將資料依大小順序排列來進行統計推論 「無母數統計方法」所推論的是適合度、獨立性、隨機性等,與傳統方法所推論的分配中的未知母數不同
適合度檢定 在傳統統計方法中常假設母體之分配形式,然後再進行推估與檢定的工作,適合度檢定就是用來檢驗對母體分配所建立的假設是否存在的統計方法
12.1 適合度檢定:多項母體 多項母體 多項母體的假設 12.1 適合度檢定:多項母體 多項母體 一母體中的每一個體都可歸類到數個等級或類別的其中之一(且是唯一),此種母體稱為多項母體(multinomial population) 二項分配為其特例 多項母體的假設 每一試驗只有一種結果(且是唯一)發生 每一次試驗皆為相互獨立 每一次試驗之結果發生的機率都相同,如p1=0.3; p2=0.5 ; p3=0.2
適合度檢定:多項母體(實例) 以某市場調查公司進行的一項市場佔有率的研究為例,某產業在過去一年之間,各廠商的市場佔有率可說十分穩定,其中 A、B、C 三家公司的佔有率分別為 30% 、50% 與 20%。 但最近 C 公司發展出一種「新的改良性」產品,其將取代該公司目前在市場上所推出的產品。該公司請市場調查公司協助判斷此一新產品是否會使三家廠商的佔有率改變。 第12章 適合度與獨立性的檢定 第449頁
適合度檢定:多項母體(實例) 我們所關心的母體就是一個多項母體,其中每個顧客會被歸類為是向 A 公司 、B 公司或 C 公司購買。因此,此一多項母體共包含了三種結果,我們使用下列的符號: pA = A 公司的市場佔有率 pB = B 公司的市場佔有率 pC = C 公司的市場佔有率 第12章 適合度與獨立性的檢定 第449頁
適合度檢定:多項母體(實例) 市場調查公司將進行一項抽樣調查,以計算顧客偏愛每家公司產品的比例,並進行一假設檢定以判斷該產品是否已導致市場佔有率的改變
12.1 適合度檢定:多項母體 列出虛無假設與對立假設。 選取一組隨機樣本,記錄每一類別的觀察次數 fi。 12.1 適合度檢定:多項母體 列出虛無假設與對立假設。 選取一組隨機樣本,記錄每一類別的觀察次數 fi。 假設虛無假設為真,將樣本大小乘以每一類別的機率,求得每一類別的期望次數 ei。 第12章 適合度與獨立性的檢定 第451頁
適合度檢定:多項母體 計算檢定統計量的值: 其中: fi =類別 i 的觀察次數 ei =類別 i 的期望次數 k =類別的個數 自由度為 k-p-1,其中 k 為類別個數,p 為從樣本資料中估計的母體參數個數 注意:此檢定統計量服從自由度為 k-1 的卡方分配, 其中每個類別的期望次數皆須大於或等於 5。 第12章 適合度與獨立性的檢定 第451頁
適合度檢定:多項母體 拒絕法則: p 值法: 臨界值法: 若 p 值 ≤ α,則拒絕 H0 若 ,則拒絕 H0 其中 α 為顯著水準,自由度為 k-1。 第12章 適合度與獨立性的檢定 第452頁
適合度檢定:多項母體(實例) 在 C 公司的新產品不會改變市場佔有率的假設下,虛無及對立假設可表示如下: 如果樣本結果導致我們拒絕 H0,該市調公司即有充分證據認為該新產品的推出將會對各公司的佔有率造成影響。 第12章 適合度與獨立性的檢定 第449頁
適合度檢定:多項母體(實例) 假設該市調公司選取 200 位顧客為一組樣本,在 A 公司、B 公司的既有產品及 C 公司的新產品三者中,請每位顧客指出比較偏愛的產品,樣本結果如下所示。 在 pA=0.30, pB=0.50 且 pC=0.20 的假設下,計算 200 位顧客的期望購買偏好,其計算如下。 第12章 適合度與獨立性的檢定 第449-450頁
適合度檢定:多項母體(實例) 令顯著水準 α=0.05,利用觀察次數與期望次數計算檢定統計量的值。由於所有的期望次數都等於或大於 5,卡方檢定統計量的計算如表 12.1 所示,即χ2 =7.34。 第12章 適合度與獨立性的檢定 第450-451頁
觀察次數與期望次數的差異夠大時,我們將拒絕虛無假設。此差異愈大會導致檢定統計量的值愈大,因此適合度的檢定為一右尾的檢定,在檢定統計量的右尾區域計算 p 值,並據以決定是否拒絕虛無假設。
適合度檢定:多項母體(實例) 由於檢定統計量 χ2 =7.34,介於 5.991 與 7.378 之間,因此,其對應的右尾區域的 p 值會在 0.05 與 0.025 之間。因為 p 值 ≤ α =0.05,我們的結論為拒絕 H0,亦即 C 公司藉由新產品的導入,將會改變目前市場佔有率的結構。 第12章 適合度與獨立性的檢定 第451頁
適合度檢定:多項母體(實例) 除了 p 值的方法外,我們也可以使用臨界值的方法得到相同的結果。當 α = 0.05 且自由度為 2 時,檢定統計量的臨界值為 =5.991,右尾的拒絕法則為 若 χ2 ≥ 5.991,則拒絕 H0 由於7.34>5.991,因此拒絕 H0。p 值和臨界值兩種方法都會有一致的檢定結果。 第12章 適合度與獨立性的檢定 第451頁
12.3 適合度檢定:卜瓦松分配 列出虛無及對立假設。 12.3 適合度檢定:卜瓦松分配 列出虛無及對立假設。 H0:母體為卜瓦松分配 Ha:母體並非為卜瓦松分配 選取一組隨機樣本,且 a.就卜瓦松隨機變數的每個可能值,記錄其觀察次數 fi 。 b.計算平均發生次數 μ。 就卜瓦松隨機變數的每個可能值,計算其期望 次數ei。 第12章 適合度與獨立性的檢定 第463頁
適合度檢定:卜瓦松分配 計算檢定統計量的值 其中: fi =類別 i 的觀察次數 ei =類別 i 的期望次數 k =類別的個數 第12章 適合度與獨立性的檢定 第464頁
適合度檢定:卜瓦松分配 拒絕法則: p 值法: 臨界值法: 若 p 值 ≤a,則拒絕 H0 若 ,則拒絕 H0 其中 α 為顯著水準,自由度為 k-2。 第12章 適合度與獨立性的檢定 第464頁
適合度檢定:卜瓦松分配(實例) 考慮位於佛羅里達州塔拉哈西市的 Dubek's 食品市場,其顧客到達的例子。 由於最近的人事問題,該公司的管理者要求當地的一家顧問公司,協助規劃櫃台中店員配置的問題。 審視櫃台作業之後,該顧問公司建議了一套店員配置的程序。這套程序係以等候線的數學分析為基礎,其只有在一限定的時間內顧客到達的人數服從卜瓦松分配才適用。 因此,在這套程序被付諸實行之前,必須先蒐集顧客到達的資料並進行統計檢定,以決定顧客到達的人數服從卜瓦松分配的假設是否合理。 第12章 適合度與獨立性的檢定 第461頁
Ha:在 5 分鐘時段內進入店內的顧客人數並非 適合度檢定:卜瓦松分配(實例) 我們將到達定義為在 5 分鐘時段內進入店內的顧客人數。 因此虛無及對立假設為 H0:在 5 分鐘時段內進入店內的顧客人數 服從卜瓦松分配 Ha:在 5 分鐘時段內進入店內的顧客人數並非 如果顧客到達的樣本結果顯示 H0 不能被拒絕,該公司將著手實行顧問公司所建議的配置程序;反之,如果樣本結果導致 H0 被拒絕,卜瓦松分配的假設不能成立,則該公司將考慮其他的配置程序。 第12章 適合度與獨立性的檢定 第461頁
適合度檢定:卜瓦松分配(實例) 為了檢定非假日早晨時段顧客到達的人數為卜瓦松分配的假設,店中某位員工在 3 週之內,於非假日的早晨時段隨機抽取一組大小為 128 個的 5 分鐘時段的樣本。在樣本中的每個5分鐘時段內,該員工記錄顧客到達的人數,進而將 128 個資料彙整成沒有顧客、只有一位顧客、2 位顧客……等等的 5 分鐘時段的人數分類,結果如表 12.6 所示。 第12章 適合度與獨立性的檢定 第461頁
適合度檢定:卜瓦松分配(實例) 表 12.6 中有 10 個類別的觀察次數,現在我們以適合度檢定來判斷前述 128 個時段的樣本是否支持卜瓦松分配的假設。 欲進行適合度檢定,我們還需要計算當顧客到達人數為卜瓦松分配的假設為真時,這 10 個類別的期望次數。也就是說,我們需計算當顧客到達人數為卜瓦松分配時,沒有顧客、只有 1 位顧客、只有 2 位顧客等等的時段之期望個數。 第12章 適合度與獨立性的檢定 第461頁
適合度檢定:卜瓦松分配(實例) 卜瓦松分配,其機率函數為 在此函數中,μ代表每 5 分鐘內顧客到達人數的平均數或期望人數,x 為一隨機變數,意指在某一 5 分鐘時段內顧客到達的人數。最後,f(x)表示在某一 5 分鐘時段內將到達 x 位顧客的機率。 Dubek's 食品市場的卜瓦松機率函數的估計式如下 第12章 適合度與獨立性的檢定 第461頁
適合度檢定:卜瓦松分配(實例) 假設該μ=5 的卜瓦松分配適合描述 Dubek’s 公司顧客到達人數,則可將前述的機率函數代入不同的 x 值,而求得每一類到達人數的機率,如表 12.7 所示,這些機率也可以在附錄 B 的表 7 中查到。 例如,在 5 分鐘內沒有顧客到達的機率是f (0)=0.0067,5 分鐘內只有 1 位顧客到達的機率為 f (1)=0.0337 等等。如 12.1 節所述,每個類別的期望次數等於機率乘以樣本大小;例如,沒有顧客到達的期望時段個數為 (0.0067)(128)=0.86,只有 1 位顧客到達的期望時段個數為 (0.0337)(128)=4.31 等等 第12章 適合度與獨立性的檢定 第461-462頁
適合度檢定:卜瓦松分配(實例) 第12章 適合度與獨立性的檢定 第462頁 表12.7
適合度檢定:卜瓦松分配(實例) 我們將合併 0 與 1 為一類,合併 9 與「10 或以上」為一類,而達到每一類別的期望次數至少為 5 的要求。表 12.8 為合併後觀察與期望次數的結果。 適合度檢定是針對觀察與期望次數之差 fi-ei來進行。我們可利用表 12.8 的資料來計算卡方檢定統計量: 計算卡方檢定統計量的過程列於表 12.9,檢定統計量的值χ2=10.96。 第12章 適合度與獨立性的檢定 第462-463頁
適合度檢定:卜瓦松分配(實例) 第12章 適合度與獨立性的檢定 第462頁 表12.8
適合度檢定:卜瓦松分配(實例) 一般來說,適合度檢定的卡方分配其自由度為 k-p-1,其中 k 為類別個數,p 為從樣本資料中估計的母體參數個數。就本例的卜瓦松分配適合度檢定而言,表12.9 中有 k=9 個類別;又由於我們使用樣本資料估計了卜瓦松分配的平均數,因此 p=1。所以,自由度為 k-p-1=k-2=9-2=7。 第12章 適合度與獨立性的檢定 第463頁
適合度檢定:卜瓦松分配(實例) 假定我們是以 0.05 的顯著水準來檢定顧客到達的機率分配為卜瓦松分配的虛無假設。為了檢定這個假設,我們需藉由自由度為 7 的卡方分配其右尾區域來算出檢定統計量χ2 =10.96 的 p 值。查附錄 B 的表 3,當χ2 =10.96,右尾區域的 p 值會大於 0.10。 也就是說,非假日早晨時段的顧客到達人數服從卜瓦松分配的假設不應被拒絕。所以 Dubek’s 公司的管理者應著手實行由顧問公司所建議的非假日早晨的員工配置方案。 第12章 適合度與獨立性的檢定 第463頁
適合度檢定:常態分配 列出虛無與對立假設。 選取一組隨機樣本,且 a. 計算樣本平均數與標準差。 b. 定義數值的區間,使得每個區間的期望次數至少 為5。使用等機率區間是一個可行的方法。 c. 記錄每個區間的觀察次數 fi。 計算 2(b) 所定義的每個區間的期望次數 ei。樣本數乘以常態隨機變數在該區間的機率。 第12章 適合度與獨立性的檢定 第467頁
適合度檢定:常態分配 計算檢定統計量的值: 拒絕法則: p 值法:若 p 值 ≤ ,則拒絕H0 其中 α 為顯著水準,且自由度為 k-3。 第12章 適合度與獨立性的檢定 第467頁
適合度檢定:常態分配(實例) Chemline 公司每年都為旗下四家位於美國的工廠僱用 400 名新進員工,人事主管想瞭解測驗成績的母體是否呈常態分配,因為果真如此的話,公司便能更迅速判定任何特定測驗成績的良窳,例如某份成績名列前 20%、後 40% 等等。 因此,我們要檢定的虛無假設是測驗成績的母體為常態分配。 第12章 適合度與獨立性的檢定 第464頁
適合度檢定:常態分配(實例) 以表 12.10 Chemline 公司應徵者的測驗資料,來說明常態分配的適合度檢定。 第12章 適合度與獨立性的檢定 第464頁 表12.10
Ha:測驗成績的母體並非呈平均數 68.42 及標準差 10.41 的常態分配 適合度檢定:常態分配(實例) 利用表 12.10 的資料,計算虛無假設中常態分配的平均數與標準差之估計值。我們以樣本平均數 與樣本標準差s,作為該常態分配的平均數與標準差的點估計量,其計算如下: 根據上面的值,提出如下的假設 H0:測驗成績的母體呈平均數 68.42 及標準差 10.41 的常態分配 Ha:測驗成績的母體並非呈平均數 68.42 及標準差 10.41 的常態分配 第12章 適合度與獨立性的檢定 第464頁
適合度檢定:常態分配(實例) 第12章 適合度與獨立性的檢定 第465頁 圖12.2
適合度檢定:常態分配(實例) 現在我們來考慮在常態分配下,適合度檢定定義類別的方法。 定義測驗成績的類別時,必須使每一區間或類別的期望次數至少為 5。 樣本數為 50,可將常態分配分割為 10 個有相同機率的區間,每個區間或類別的期望次數均為 5。 第12章 適合度與獨立性的檢定 第464-465頁
適合度檢定:常態分配(實例) 第12章 適合度與獨立性的檢定 第465頁
適合度檢定:常態分配(實例) 由於我們是將母體假定為常態分配,因此可使用標準常態機率表來決定這些界限。首先考慮後 10% 測驗成績的上限。從附錄 B 的表 1 可查出此一上限的 z 值為 −1.28,換算成測驗成績為 x =68.42-1.28(10.41)=55.10。如果算的是後 20% 測驗成績的上限,則 z =−0.84,因此 x =68.42-0.84(10.41)=59.68。根據此種方式,可計算得到下列測驗成績之值。 第12章 適合度與獨立性的檢定 第465頁
適合度檢定:常態分配(實例) 第12章 適合度與獨立性的檢定 第466頁 表12.11
適合度檢定:常態分配(實例) 第12章 適合度與獨立性的檢定 第466頁 表12.12
適合度檢定:常態分配(實例) 為了決定所計算的χ2 值 7.2 是否大到可以拒絕 H0,我們需要參考適當的卡方分配表。根據計算適合度檢定自由度的法則,自由度為 k-p-1=10-2-1=7,其中有 k=10 個類別及有 p=2 個參數 (平均數與標準差) 必須從樣本資料中估計。 第12章 適合度與獨立性的檢定 第466頁
適合度檢定:常態分配(實例) 假定我們是以 0.10 的顯著水準,檢定測驗成績為一常態分配的虛無假設,為了檢定這個假設,我們必須藉由自由度為 7 的卡方分配其右尾區域,以算出檢定統計量χ2 =7.2 的 p 值。 查附錄 B 表 3,當χ2 =7.2,右尾區域的 p 值會大於 0.10。 因此,Chemline 公司應徵者的測驗成績為常態分配的假設不應被拒絕;也就是說,常態分配可以拿來輔助測驗成績的解釋。下列為常態分配的適合度檢定的總結。 第12章 適合度與獨立性的檢定 第466頁
12.2 獨立性檢定 若母體與樣本係依照兩個或兩個以上的標準而分類時(名目尺度),可利用卡方分配來檢定這些分類標準間是否相互獨立 12.2 獨立性檢定 若母體與樣本係依照兩個或兩個以上的標準而分類時(名目尺度),可利用卡方分配來檢定這些分類標準間是否相互獨立 如「啤酒的偏好」與「飲用者的性別」是否相互獨立 獨立性檢定的資料通常是利用「聯立表」或「列聯表」(contingency table)來表現,因此也可稱為聯立表檢定
12.2 獨立性檢定 列出虛無及對立假設。 選取一組隨機樣本,記錄列聯表中每一方格的觀察次數 fij。 計算每一方格的期望次數 eij 。 12.2 獨立性檢定 列出虛無及對立假設。 選取一組隨機樣本,記錄列聯表中每一方格的觀察次數 fij。 計算每一方格的期望次數 eij 。 第12章 適合度與獨立性的檢定 第455.457頁
獨立性檢定 計算檢定統計量的值 拒絕法則: 若 p 值 ≤ a 或 ,拒絕 H0 其中 α 為顯著水準,在 n 列、m 行的情況下 自由度為(n-1)(m-1) 第12章 適合度與獨立性的檢定 第456.457頁
獨立性檢定(實例) 以下以亞利桑那州土桑市的 Alber's 酒廠所進行的研究,來說明獨立性檢定。 該公司主要是製造與配銷三種啤酒:淡啤酒、一般啤酒與黑啤酒。在一項對這三種啤酒市場區隔的分析中,該公司的市場研究小組提出一個問題,即男性與女性的啤酒飲用者對這三種啤酒的偏好是否不同。 如果性別與對啤酒的偏好相互獨立,則該公司將對其所有啤酒展開同一種廣告活動;反之,如果對啤酒的偏好與性別有關,該公司將針對不同的目標市場採行不同的促銷活動。 第12章 適合度與獨立性的檢定 第454頁
獨立性檢定(實例) 針對啤酒偏好 (淡啤酒、一般啤酒及黑啤酒) 是否與啤酒飲用者的性別 (男性或女性) 相互獨立的問題,進行一項獨立性檢定,其假設為 H0:對啤酒的偏好與啤酒飲用者的性別相互獨立 Ha:對啤酒的偏好與啤酒飲用者的性別並非相互獨立 表 12.2 可用來描述此一研究的狀況。我們將母體定義為所有的男性與女性啤酒飲用者,從其中取出一組樣本,請每人說出他或她對三種 Alber‘s 啤酒的偏好,如此一來,樣本中的每個人都將被歸類到表中的 6 個方格之一。 第12章 適合度與獨立性的檢定 第454頁
獨立性檢定(實例) 表12.2 可稱為列聯表 (contingency table)。獨立性檢定即是以列聯表的方式為之,因此其亦稱為列聯表檢定 (contingency table test)。 第12章 適合度與獨立性的檢定 第454頁 表12.2
獨立性檢定(實例) 表 12.3 中的資料,乃每一個組別或類別的觀察次數。如果可決定在啤酒偏好與性別相互獨立的假設下,每個組別或類別的期望次數,我們即可使用卡方分配來判斷觀察次數與期望次數之間是否有顯著的差異。 第12章 適合度與獨立性的檢定 第454-455頁 表12.3
獨立性檢定(實例) 假定啤酒偏好與性別間相互獨立的虛無假設為真,其次,我們注意到,在 150 位啤酒飲用者的樣本中,有 50 位偏愛淡啤酒,70 位偏愛一般啤酒,至於偏愛黑啤酒者則有 30 位。此意指這三種啤酒的偏好比率依序為 50/150=1/3, 70/150=7/15,以及 30/150= 1/5。 如果獨立性的假設成立,則這些比率不論就男性或女性飲用者而言,均可一體適用。 因此,在獨立性的假定之下,我們可以預期在樣本中的 80 位男性中,有 (1/3)80=26.67 位偏好淡啤酒,(7/15)80=37.33 位偏愛一般啤酒,(1/5)80=16 位偏愛黑啤酒。我們同樣可將這些比率用來計算樣本中 70 位女性的期望次數,如表 12.4 所示。 第12章 適合度與獨立性的檢定 第455頁
獨立性檢定(實例) 令 eij 表示列聯表中第 i 列與第 j 行類別的期望次數。例如,e12 即代表男性 (第 1列) 且偏愛一般啤酒 (第 2 行) 的期望次數,根據前述期望次數的計算方式,可表達為 e12=(7/15)80=37.33 也可表達為 其中,80 為男性總人數 (第 1 列總和),70 為偏愛一般啤酒的總人數 (第 2 行總和),而 150 則是樣本的總人數。因此 第12章 適合度與獨立性的檢定 第455頁
獨立性檢定(實例) 使用此一公式可計算男性、偏愛黑啤酒的期望次數 e13=(80)(30)/150=16.00,其餘的期望次數如表 12.4 所示。 第12章 適合度與獨立性的檢定 第455.456頁 表12.4
獨立性檢定(實例) 審視表 12.4,可看出所有類別的期望次數均等於或大於 5,因此,可以進一步計算卡方檢定統計量,表 12.5 是判斷啤酒偏好與啤酒飲用者的性別是否獨立的卡方檢定統計量之計算,其檢定統計量的值為χ2=6.12。 此一卡方分配的自由度,乃將列數減 1 乘以行數減 1。本例中,列數為 2,行數為 3,自由度為 (2-1)(3-1)=2。 如同適合度檢定,當觀察次數與期望次數的差異獲致大的檢定統計量的值時,我們才會拒絕獨立性檢定中的 H0。 第12章 適合度與獨立性的檢定 第456頁
獨立性檢定(實例) 獨立性的檢定也是右尾檢定。 查卡方分配表 (附錄 B 表 3),當χ2=6.12 時,右尾區域或 p 值會介於 0.025 與 0.05 之間,運用 Excel 可以算出 p 值為 0.0468。 若令顯著水準為 0.05,則 p 值 ≤ α =0.05,因此,我們拒絕獨立性的虛無假設,且下結論為啤酒偏好並非與啤酒飲用者的性別相互獨立。 第12章 適合度與獨立性的檢定 第456頁
例子 下列假設進行 適合度檢定。 一組樣本大小為100的樣本中,30個為A類,60個為B類,10個為C類。利用α=0.01檢定這些樣本比例是否與 所述相符。 a.請計算樣本卡方值? b.請查表在α=0.01且v下之卡方值? c.結論為何?
作業 3、8、12、14、23、24、34、39
End of Chapter 12