11.1單一母體變異數的推論 前幾章中,我們以樣本變異數 母體變異數σ2的點估計量。如果要以樣本變異數為基礎來進行母體變異數的統計推論,則(n-1)s2/σ2的抽樣分配十分好用,此一抽樣分配表達如下。 (n-1)s2 n-1 (11.1) S2=
(n-1)s2/σ2的抽樣分配 只要一樣本數為n的簡單隨機樣本是選取自一常態母體,則 的抽樣分配乃一自由度為n-1的卡方分配。 卡方分配即可用來進行單一母體變異數的區間估計與假設檢定。 (n-1)s2 σ2 (11.2)
圖11.1 (n-1)s2/σ2抽樣分配(卡方分配)的例子 自由度為2 自由度為5 自由度為10 (n-1)s2 σ2
區間估計 以X2α代表卡方方配的某個值,在此值的右邊面積或機率為α。 圖11.2中,自由度為19的卡方方配其 X20.025=32.852,表示有2.5%的卡方值會落在32.852的右邊;同理X20.975=8.907,表示有97.5%的卡方值會落在8.907的右邊。 對照表11.1中自由度為19的卡方值可查得這些數字。
區間估計 由圖11.2可得知有95%的卡方值,會落在X20.975與X20.025之間;也就是說,我們有95%的機會抽到一個X2值,且 用(n-1)s2/σ2取代上式中的X2 對式11.3移項左半邊移項 X20.975 ≤ X2 ≤ X20.025 (n-1)s2 σ2 X20.975 ≤ ≤ X20.025 (11.3) (n-1)s2 σ2 ≤ X20.975 (11.4)
圖11.2 自由度為19的卡方分配 0.025 0.95的可能x2值 0.025 x2 0 8.907 32.852 X20.975 X20.025
表11.1 卡方分配表的摘錄值 面積或機率 X2α 自由度 .99 .975 .95 .90 .10 .05 .025 .01 表11.1 卡方分配表的摘錄值 面積或機率 X2α 自由度 .99 .975 .95 .90 .10 .05 .025 .01 18 7.015 8.231 9.390 10.865 25.989 28.869 31.526 34.805 19 7.633 8.907 10.117 11.651 27.204 30.144 32.852 36.191 20 8.260 9.591 10.851 12.443 28.412 31.410 34.170 37.566 21 8.897 10.283 11.591 13.240 29.615 32.671 35.479 38.932 22 9.542 10.982 12.338 14.041 30.813 33.924 36.781 40.289 23 10.196 11.689 13.091 14.848 32.007 35.172 38.076 41.638
區間估計 對式11.3右半邊移項 將式11.4式11.5合併 (n-1)s2 σ2 ≤ (11.5) X20.025 (n-1)s2 ≤ σ2 (11.6) ≤ X20.025 X20.975
區間估計 例子:一容器的平均裝填量為16盎司,選取20容器為一樣本,其樣本變異數為s2= 0.0025,樣本數為20,因此自由度為 19 。 取這些值的平方根,可得到母體標準差的95%信賴區間如下。 因為使用了X20.025和X20.975,因此該區間估計值的信賴係數為0.95。 (19)(0.0025) 32.852 (19)(0.0025) 8.907 ≤ σ2 ≤ 0.038≤ σ ≤0.073
單一母體變異數的假設檢定 其中X2值是基於自由度為n-1的卡方分配,且信賴係數為1-α。 假設檢定 令σ 代表母體變異數的假設值,則三種對單一母體變異數的假設檢定模式可表示如下: (n-1)s2 (n-1)s2 ≤ σ2 (11. 7) ≤ X2α/2 X2 α/2 2 2 2 2 H0: σ2≥σ H0: σ2≤σ H0: σ2=σ Ha: σ2<σ Ha: σ2>σ Ha: σ2≠σ 2 2 2
母體變異數假設檢定之檢定統計量 其中X2值是基於自由度為n-1的卡方分配。 計算出X2檢定統計量後,我們可以採用p值檢定法 (n-1)s2 X2= 2 (11. 8) σ 其中X2值是基於自由度為n-1的卡方分配。 計算出X2檢定統計量後,我們可以採用p值檢定法 或臨界值法來判斷是否可拒絕虛無假設。
範例:聖路易市Metro Bus公司希望各站到達時間的變異數必須在四分鐘以內。 假設檢定 若假設H0為真,則假定到達時間的母體變異數均符合公司規定。若樣本證據顯示母體變異數超過標準,則拒絕H0,此情況下公司應採取進一步行動以降低母體標準差。我們將以α=0.05的顯著水準進假設檢定。 H0: σ2≤4 Ha: σ2>4
p值檢定法:自由度為23的卡方分配如圖11.3所示。因此為右尾檢定,故位於檢定統計量X2=28.18右邊區域的值即為本檢定的p值。 範例:假定觀察隨機樣本24輛公車公車到達時間之樣本變異數為s2=4.9,如果到站時間的母體為近似常態分配,則 p值檢定法:自由度為23的卡方分配如圖11.3所示。因此為右尾檢定,故位於檢定統計量X2=28.18右邊區域的值即為本檢定的p值。 (n-1)s2 (24-1)(4.9) 4 X2= = =28.18 2 σ
圖11.3 聖路易市Metro Bus公司範例之卡方分配 (n-1)s2 X2= 2 σ P值 X2 28.18 右尾面積 0.10 0.05 0.025 0.01 X2值(自由度23) 32.007 35.172 38.076 41.638 X2=28.18
如同t分配表,卡方分配表無足夠資訊使我們求出正確的p值,但可由此找到p值的範圍。 因為X2=28.18小於32.007,故右尾面積(p值)將大於0.10。因為p值>α=0.05,故我們不能拒絕虛無假設。此樣本並不支持到站時間的母體變異數超過標準的說法。
臨界值法:當α=0. 05時, X20. 05值即為右尾檢定的臨界值,使用表11. 1,查得自由度為23之X20. 05=35 實務上,有關單一母體變異數的檢定最常用到的是右尾檢定。當拒絕虛無假設時,即表示有母體變異數過大的問題,此時我們應採取改善行動。 若X2≥35.172,則拒絕H0
範例:車輛監理站目前設計出一份新測驗卷,主管希望考駕者成績的變異數仍維持既有水準。根據記錄,考駕者成績的變異數為σ2=100。 雙尾檢定 使用α=0.05的顯著水準進行檢定,並抽取30位申請駕照者為樣本,給予新測驗卷作答。 2 H0: σ2= σ Ha: σ2≠σ 2
此30份測驗成績的樣本顯示,其樣本變異數為s2=162,卡方檢定統計量之值為: 現在再計算p值。利用卡方分配表與自由度29,可求得: (n-1)s2 (30-1)162 100 X2= = =46.98 2 σ 右尾面積 0.10 0.05 0.025 0.01 X2值(自由度29) 39.087 42.557 45.722 49.588 X2=46.98
所以X2=46. 98之檢定統計量代表在卡方分配右尾介於0. 025與0. 01的區域,加倍這個值後顯示出雙尾檢定的p值介於0. 05與0 因為p值≤α= 0.05,所以拒絕H0,並得知新測驗分數的母體變異數,與既有的變異數σ2=100間有差異。 表11.2為單一母體變異數之假設檢定。
表11.2單一母體變異數之假設檢定摘要 左尾檢定 右尾檢定 雙尾檢定 假設 檢定統計量 拒絕法則: p值法 若p值≤α ,則拒絕H0 2 2 H0: σ2≥σ H0: σ2≤σ H0: σ2=σ 假設 Ha: σ2<σ Ha: σ2>σ Ha: σ2≠σ 2 2 2 (n-1)s2 (n-1)s2 (n-1)s2 檢定統計量 X2= X2= X2= 2 2 2 σ σ σ 拒絕法則: p值法 若p值≤α ,則拒絕H0 若p值≤α ,則拒絕H0 若p值≤α ,則拒絕H0 拒絕法則: 臨界值法 若X2≤X2(1-α) ,則拒絕H0 若X2≥X2α ,則拒絕H0 若X2≤X2(1-α/2) 或X2≥X2α/2 ,則拒絕H0
11.2兩母體變異數的推論 進行兩母體間變異數比較時,我們將使用從兩獨立隨機母體蒐集得來的資料,其中一個樣本取自母體1,另一個取自母體2。 在進行兩母體變異數σ 與σ 的推論時,主要是以兩個樣本變異數s 與s 為基礎。 只要兩個母體變異數相等,兩個樣本變異數的比率s /s 的抽樣分配即呈現以下特性。 2 1 2 2 1 2 2 1 2
當σ =σ ,s /s 的抽樣分配 只要樣本數分別為n1與n2的兩獨立簡單隨機樣本,乃選自兩個變異數相等的常態母體,則 的抽樣分配乃分子自由度為n1-1,分母自由度為n2-1的F分配。其中s 是取自母體1樣本數為n1的隨機樣本的變異數,s 是取自母體2樣本數為n2的隨機樣本的變異數。 s 2 1 (11.2) 2 2 1 2
當σ =σ ,s /s 的抽樣分配 2 1 2 2 1 2 圖11.4為分子與分母自由度均為20的F分配圖形。由圖可知, F分配是一種不對稱的分配,且F值不可能是負值。 任何F分配的形狀,端視其分子與分母的自由度而定。 以Fα代表某個分配右尾的面積或機率為α的F值。例如,在圖11.4中的F0.05代表右尾面積為0.05,則F0.05 =2.12。
圖11.4分子與分母自由度均為20的F分配 0.05 F 2.12 F0.05
表11.3 F分配的摘錄值 10 Fα 面積或機率 2.12 分子自由度 分母自由度 15 20 右尾面積 0.1 0.05 0.025 分子自由度 分母自由度 15 20 右尾面積 0.1 0.05 0.025 0.01 10 15 20 25 30 2.06 1.97 1.92 1.89 1.87 2.54 2.40 2.33 2.28 2.25 3.06 2.86 2.76 2.69 2.64 3.80 3.52 3.37 3.28 3.21 1.94 1.84 1.79 1.76 1.74 2.35 2.20 2.12 2.07 2.04 2.77 2.57 2.46 2.40 2.35 3.37 3.09 2.94 2.84 2.78
當σ =σ ,s /s 的抽樣分配 利用F分配進行兩母體間變異數的假設檢定。首先進行兩母體變異數相等之檢定,其假設說明如下: 2 1 2 2 1 2 利用F分配進行兩母體間變異數的假設檢定。首先進行兩母體變異數相等之檢定,其假設說明如下: 我們假設此兩個母體的變異數相等,若H0被拒絕,則獲得母體變異數不相等的結論。 H0: σ = σ Ha: σ ≠σ 2 1 2 2 1 2
當σ =σ ,s /s 的抽樣分配 在進行假設檢定時,我們需要兩個獨立隨機樣本,每一個樣本各來自不同的母體,然後再計算出兩個樣本變異數。 2 1 2 2 1 2 在進行假設檢定時,我們需要兩個獨立隨機樣本,每一個樣本各來自不同的母體,然後再計算出兩個樣本變異數。 通常將較大樣本的母體稱為母體1,所以母體1的樣本大小為n1且其樣本變異數為s ;母體2的樣本大小為n2且其樣本變異數為s 。 由於兩個母體均假設為常態分配,故樣本變異數的比率即為下列之F檢定統計量。 2 1 2
當σ =σ ,母體變異數的假設檢定之檢定統計量 當σ =σ ,母體變異數的假設檢定之檢定統計量 2 1 2 因較大的樣本變異數為母體1,故檢定統計量具有分子為n1-1個自由度且分母為n2-1個自由度之F分配。 因為F檢定統計量之分子為較大的樣本變異數s ,故該值會位於F分配之右尾。 s 2 1 F= 2 (11.10) 2 1
範例 Dullus Counry學校要從Milbank與Gulf兩家公車業者之間擇一來訂立校車服務契約,以校車到達或接送時間的變異數作為品質指標。如果兩到達時間變異數相等,則選擇收費較低廉之公司;若有顯著差異,則選擇到達時間變異數較小者。
範例 若H0被拒絕,我們將認定這兩家公司品質不相等,樣本變異數較小者將被青睞。我們將以α=0.1的顯著水準進行檢定。 Ha: σ ≠σ 2 1 2 2 1 2 若H0被拒絕,我們將認定這兩家公司品質不相等,樣本變異數較小者將被青睞。我們將以α=0.1的顯著水準進行檢定。 抽樣26個Milbank公司到達時間的樣本之樣本變異數為48,抽樣16個Gulf公司到達時間的樣本之樣本變異數為20。 Milbank的樣本有較大的樣本變異數,故視其為母體1。
範例 使用式(11.10),則檢定統計量為 相對之F分配的分子自由度為n1-1=26-1=25,分母自由度為n2-1=16-1=15。 s 48 20 F= = = 2.4 2
範例 可採用p值法或臨界值法求出假設檢定的結論。表11.3中顯示分子自由度為25及分母自由度為15的F分配之右尾面積F值。 F=2.4 右尾面積 0.1 0.05 0.025 0.01 F值(分子自由度為25, 1.89 2.28 2.69 3.28 分母自由度為15) F=2.4
範例 因為F=2.4介於2.28與2.69之間,故此分配之右尾面積亦介於0.05與0.025。因為此為雙尾檢定,故我們加倍右尾面積,得p值介於0.1與0.05之間。 在此檢定中,因α=0.1, p值< α=0.1, 所以拒絕虛無假設。 這項結論說明此兩家公司在接送時間的變異數確有差異,因此,Dullus Counry學校主管應選擇Gulf公司。
範例 亦可使用Minitab或Excel軟體找出檢定統計量F=2.4的雙尾p值=0.0811。因為0.0811<α=0.1, 所以拒絕虛無假設。 在α=0.1的顯著水準下,運用臨界值法進行雙尾檢定時,需令在分配的各個尾部面積為α/2=0.1/2=0.05。因為式(11.10)計算出的檢定統計量通常位於右尾,故我們僅須考量右尾之臨界值即可。
範例 由表11.3可知F0.05 =2.28,故雖然我們進行雙尾檢定,但其拒絕法則仍為: 若F ≥ 2.28 ,則拒絕H0
兩母體變異數亦可進行單尾檢定。在此情形下,我們利用F分配判斷某一母體的變異數是否顯著大於另一母體。兩母體變異數的單尾檢定通常均寫成右尾檢定: 此種形式的假設檢定可將p值與臨界值置於F分配的右尾,所以僅需右尾F值即可,此可簡化計算工作與F分配表。 H0: σ ≤ σ Ha: σ >σ 2 1 2 2 1 2
範例:民調 抽取31位男士及41位女士為兩樣本,以研究民眾對環保議題的看法。研究人員想檢定的是,此樣本資料是否顯示女性對環保議題態度的變異數高於男性。 如果H0被拒絕,該研究人員將有充分統計證據支持女性對環保議題態度的變異數較高。 H0: σ ≤ σ Ha: σ >σ 2 女性 2 男性 2 女性 2 男性
範例:民調 F分配的分子自由度為n1-1=41-1=40,分母自由度為n2-1=31-1=30。 我們將用α=0.05的顯著水準進行假設檢定。 調查結果顯示女性的樣本變異數為s =120,男性的樣本變異數為s =80,且檢定統計量為 s 2 1 120 80 F= = = 1.5 2
範例:民調 參考F分配表,分子自由度為40,分母自由度為30之F分配的F0.10 =1.57 。 因為檢定統計量F =1.5小於1.57,右尾面積必大於0.1,所以我們確信p值大於0.1。 利用Minitab或Excel軟體可找出p值=0.1256。因為p值>α=0.05, 所以不能拒絕虛無假設。 該樣本結果並不支持女性對環保議題態度的變異數高於男性的結論。 表11.4提供兩母體變異數之假設檢定摘要。
表11.4 兩母體變異數之假設檢定摘要 右尾檢定 雙尾檢定 假設 s s 檢定統計量 若p值≤α ,則拒絕H0 若p值≤α ,則拒絕H0 表11.4 兩母體變異數之假設檢定摘要 右尾檢定 雙尾檢定 2 1 2 2 1 2 H0: σ ≤σ H0: σ =σ 假設 Ha: σ >σ Ha: σ ≠σ 2 1 2 2 1 2 注意:母體1具有 較大之樣本變異數 s 2 1 s 2 1 F= F= 檢定統計量 2 2 若p值≤α ,則拒絕H0 若p值≤α ,則拒絕H0 拒絕法則:p值法 若F ≥ Fα ,則拒絕H0 若F ≥ Fα/2 ,則拒絕H0 拒絕法則:臨界值法