第 10 章 兩母體平均數與比例的 統計推論
統計實例 在被政府嚴格規範的製藥產業中, 統計學扮演著極重要的角色。其中 ,在進行臨床前測試時,業者通常 會使用兩母體或三母體的統計分析 研究,來決定新藥品是否要進行後 續長期使用和安全計畫的測試。 大部分的研究中,統計方法主要是進行新藥品及標準藥品母體平均數之差異的假設檢定。若與標準藥品相比較,缺乏效力或產生不良效果,則新藥品將被放棄,而不用進行後續測試。 在本章中,你將學到在兩母體的情況下,如何進行關於平均數與比例的區間估計與假設檢定。 第10章 兩母體平均數與比例的統計推論 第386頁
第八章與第九章主要在討論單一母體平均數(比例)為主的估計與檢定 有些情況需要處理兩組資料的問題 兩種教學方式對於學生的學習效果 兩種不同藥物對於某疾病的治療效果 本章將利用之前所學的統計概念,推廣至兩母體的狀況
第10章 兩母體平均數與比例的統計推論 10.1 兩母體平均數之差的推論:已知 σ1 與 σ2 10.1 兩母體平均數之差的推論:已知 σ1 與 σ2 10.2 兩母體平均數之差的推論:σ1 與 σ2 未知 10.3 兩母體平均數之差的推論:配對樣本 10.4 兩母體比例之差的推論 第10章 兩母體平均數與比例的統計推論 第385頁
10.1 兩母體平均數之差的推論: 已知 σ1與 σ2 μ1 –μ2之區間估計 兩母體平均數之差μ1 – μ2的點估計量 10.1 兩母體平均數之差的推論: 已知 σ1與 σ2 μ1 –μ2之區間估計 兩母體平均數之差μ1 – μ2的點估計量 兩母體平均數之差μ1 – μ2的區間估計:已知σ1與 σ2 μ1 – μ2 之假設檢定的檢定統計量: σ1與 σ2已知 第10章 兩母體平均數與比例的統計推論 第387-389頁
的抽樣分配 兩母體的平均數為 μ1與 μ2與; 標準差為1 與2 ;自此兩母體分別隨機抽取樣本n1 與n2 與個獨立樣本,則樣本平均數差之分配為 的抽樣分配
的抽樣分配 期望值 標準差(標準誤) 其中: 1 = 母體 1 的標準差 2 = 母體 2 的標準差 n1 = 母體 1 的樣本數 其中: 1 = 母體 1 的標準差 2 = 母體 2 的標準差 n1 = 母體 1 的樣本數 n2 = 母體 2 的樣本數 第10章 兩母體平均數與比例的統計推論 第388頁
兩母體平均數之差的推論: 已知 σ1與 σ2 知道 為平均數(μ1-μ2 )與標準差為 知道 為平均數(μ1-μ2 )與標準差為 的抽樣分配後,則母體平均數(μ1-μ2 )之區間估計為 其中: 1 - 為信賴係數 第10章 兩母體平均數與比例的統計推論 第388頁
兩母體平均數之差的推論: 已知 σ1與 σ2 (實例) Greystone 百貨公司在紐約州水牛城有兩家分店:一家在市區,另一家位於郊區購物中心。該公司的區經理發現,在其中一家分店賣得很好的產品,常常在另一家賣不好。該區經理相信,這可能是因這兩個區域的人口統計特徵有別,例如,顧客之年齡、教育程度、所得等等的差異。現在假定這位區經理請我們替他分析這兩個地點的顧客平均年齡是否確有差異。 將市區分店的顧客視為母體 1,而郊區分店的顧客為母體 2。 第10章 兩母體平均數與比例的統計推論 第387頁
兩母體平均數之差的推論: 已知 σ1與 σ2 第10章 兩母體平均數與比例的統計推論 第388頁 圖10.1
兩母體平均數之差的推論: 已知 σ1與 σ2 (實例) 依據前述之顧客人數作為統計研究的資料,兩個母體標準差已知為 σ1=9 歲與 σ2=10 歲。由Greystone 顧客中蒐集到的兩個獨立簡單隨機樣本的資料如下: 試求 95% 信賴水準下之信賴區間? 第10章 兩母體平均數與比例的統計推論 第388頁
兩母體平均數之差的推論: 已知 σ1與 σ2 (實例) 兩母體平均年齡之差的點估計值為 =40-35=5 歲。由此可估計市區分店顧客的平均年齡,比郊區分店顧客的平均年齡大 5 歲。 若使用 95% 信賴水準,且 z/2=z0.025=1.96,我們可得 因此,邊際誤差為 4.06 歲,並且兩母體平均數之差的 95% 信賴區間估計量為 5-4.06=0.94 歲至 5+4.06=9.06 歲。 第10章 兩母體平均數與比例的統計推論 第389頁
μ1 - μ2之假設檢定: σ1與 σ2 已知 假設檢定 檢定統計量 左尾檢定 右尾檢定 雙尾檢定 第10章 兩母體平均數與比例的統計推論 第389頁
μ1 - μ2之假設檢定: σ1與 σ2 已知 (實例) 為瞭解兩家訓練中心的教育品質是否有差別,而讓在這兩訓練中心受訓的所有人員均接受同標準化的測驗,並以測驗成績作為評估兩訓練中心教育品質異同的主要依據。兩訓練中心之母體的平均數如下: μ1 = 在 A 中心受訓人員的母體的平均測驗成績 μ2 = 在 B 中心受訓人員的母體的平均測驗成績 我們先暫時假設這兩家中心的訓練品質並無差異,因此,就平均測驗成績而言,其虛無假設為μ1-μ2=0。 第10章 兩母體平均數與比例的統計推論 第389-390頁
μ1 - μ2之假設檢定: σ1與 σ2 已知 (實例) 有關雙尾檢定的虛無假設與對立假設可表達為 H0:μ1- μ2=0 Ha:μ1- μ2 ≠ 0 若以往在不同測驗下之標準化成績均顯示測驗成績的標準差大約為 10 分,則我們可利用此資訊假設母體之標準差均為已知,即 σ1=10 與 σ2=10。本研究採 α=0.05 之顯著水準。 第10章 兩母體平均數與比例的統計推論 第390頁
μ1 - μ2之假設檢定: σ1與 σ2 已知 (實例) 獨立簡單隨機樣本中,n1=30 人為來自 A 訓練中心,n2=40 人則來自 B 訓練中心,兩者各別之樣本平均數分別為 =82 與 =78。這些資料是否能建議兩個訓練中心之母體平均數有顯著差異呢?為協助回答此問題,我們利用式 (10.5) 計算出檢定統計量。 第10章 兩母體平均數與比例的統計推論 第390頁
μ1 - μ2之假設檢定: σ1與 σ2 已知 (實例) p 值法 z=1.66,平均數與 z=1.66 之間的面積為 0.4515。 位於分配右尾之面積為 0.5000-0.4515=0.0485。 由於此為雙尾檢定,我們必須加倍尾面積:p 值=2 (0.0485)=0.0970。 因為 p 值為 0.0970,故在 0.05 顯著水準下,我們不拒絕 H0,即此抽樣結果無法提供足夠的證據證明兩訓練中心在品質上有差異。 第10章 兩母體平均數與比例的統計推論 第390頁
μ1 - μ2之假設檢定: σ1與 σ2 已知 (實例) 臨界值法 α=0.05 與 z/2=z0.025=1.96,故若 z ≤ -1.96或 z ≥ 1.96 時,即拒絕 H0。 本例中 z=1.66,故我們仍得到不拒絕 H0的同樣結論。 第10章 兩母體平均數與比例的統計推論 第390頁
10.2 兩母體平均數之差的推論: σ1與 σ2未知 m 1 – m 2之區間估計 第10章 兩母體平均數與比例的統計推論 第394頁
兩母體平均數之差的推論: σ1與 σ2未知 當σ1 與σ2未知時,我們將使用樣本標準差 s1 與 s2 來估計σ1 與σ2,並以 tα/2 取代zα/2。結果兩母體平均數之差的區間估計公式如下: 第10章 兩母體平均數與比例的統計推論 第394頁
兩母體平均數之差的推論: σ1與 σ2未知 區間估計 ta/2 的自由度為 第10章 兩母體平均數與比例的統計推論 第394頁
兩母體平均數之差的推論: σ1與 σ2未知 (實例) Clearwater 國家銀行正進行一項在其兩家分行的顧客支票帳戶之平均差異的調查。C 分行中簡單隨機抽樣 28 個支票帳戶,B 分行亦獨立簡單隨機抽樣 22 個支票帳戶。每一個支票帳戶的目前支票帳戶平均餘額均加以記錄。帳戶平均餘額之摘要如下: 第10章 兩母體平均數與比例的統計推論 第393頁
兩母體平均數之差的推論: σ1與 σ2未知 (實例) Clearwater 國家銀行欲估計 C 分行與B分行的 顧客母體支票帳戶平均數之差異的 95% 信賴區間估計。 Cherry Grove 分行樣本資料顯示 n1=28, =$1,025與 s1=$150,而 Beechmont 分行則為 n2=22, =$910, s2=$125。t/2 之自由度計算如下: 第10章 兩母體平均數與比例的統計推論 第394頁
兩母體平均數之差的推論: σ1與 σ2未知 (實例) 將非整數之自由度向下圓整為 47,以獲得較大的 t 值及較為保守的區間估計。使用 t 分配表與自由度 47,可求得 t0.025=2.012。使用式 (10.6) ,我們可以建立兩母體平均數之差的 95% 信賴區間如下: 此兩分行的母體平均支票帳戶餘額之差的點估計值為 $115,邊際誤差為 $78,且兩母體平均數之差的 95% 信賴區間估計值為 115-78=$37 至 115+78=$193。 第10章 兩母體平均數與比例的統計推論 第394頁
兩母體平均數之差的推論: σ1與 σ2未知 假設檢定 檢定統計量 左尾檢定 右尾檢定 雙尾檢定 第10章 兩母體平均數與比例的統計推論 第395頁
兩母體平均數之差的推論: σ1與 σ2未知 (實例) 某家公司剛開發出一種新的電腦套裝軟體,其可協助系統分析師減少設計、發展,以及執行一資訊系統所需的時間。 為了評估此一軟體的好處,該公司選取了 24 位系統分析師為一隨機樣本,每位分析師均須完成一指定規格的假想資訊系統,其中 12 位須以現有的技術來完成,另 12 位則訓練他們使用此新軟體來完成。 本研究中包含兩個母體:一個是使用現有技術的系統分析師的母體,另一個是使用新套裝軟體者的分析師之母體。 第10章 兩母體平均數與比例的統計推論 第395頁
兩母體平均數之差的推論: σ1與 σ2未知 (實例) 以完成此一資訊系統設計計畫所需的時間而言,其母體平均數為 μ1= 使用現有技術的系統分析師完成計畫 所需的平均時間 μ2= 使用新軟體技術的系統分析師完成計畫 負責此一新軟體評估計畫的研究人員,希望能證明新套裝軟體確可縮短計畫完成的平均時間 第10章 兩母體平均數與比例的統計推論 第395頁
兩母體平均數之差的推論: σ1與 σ2未知 (實例) 研究人員提出的 μ1- μ2>0 假設,應視之為對立假設。所以,本假設檢定即為 H0:μ1- μ2 ≤ 0 Ha:μ1- μ2 > 0 我們將以 α=0.05為顯著水準。 第10章 兩母體平均數與比例的統計推論 第395頁
兩母體平均數之差的推論: σ1與 σ2未知 (實例) 第10章 兩母體平均數與比例的統計推論 第396頁 表10.1
兩母體平均數之差的推論: σ1與 σ2未知 (實例) 假設此 24 位分析師完成計畫的結果如表 10.1。使用式 (10.8) 中之檢定統計量,我們可得: 採用式 (10.7) 計算自由度,我們可得: 第10章 兩母體平均數與比例的統計推論 第395-396頁
兩母體平均數之差的推論: σ1與 σ2未知 (實例) 向下圓整後,我們採用自由度為 21 之 t 分配。t 分配表中該列之數據如下: 採用右尾檢定,p 值為 t =2.27 的右尾面積。 p 值介於 0.025 與 0.01 之間, p 值小於 α =0.05,故拒絕 H0。 此抽樣結果可使研究人員得到 μ1- μ2 > 0或 μ1 > μ2 的結論。由此,研究計畫支持新套裝軟體提供較小的母體平均完成時間的結論。 第10章 兩母體平均數與比例的統計推論 第396頁
10.3 兩母體平均數之差的推論: 配對樣本 在設計適當的抽樣程序,以蒐集生產時間的資料並對上述假設進行檢定時,有兩種方法可供選擇: 10.3 兩母體平均數之差的推論: 配對樣本 在設計適當的抽樣程序,以蒐集生產時間的資料並對上述假設進行檢定時,有兩種方法可供選擇: 獨立樣本 (independent samples) 指受測者被隨機地分為二群,其中一群使用方法1,而另外一群使用方法2。觀察此兩種方法的反應結果,所得出的觀察值彼此不相關,因為它們來自不同且不相關的受測者(母體不同)。因此可利用10.1~10.2的程序,來檢定母體平均數的差異。 配對樣本 (matched samples) (相同實驗個體) 指受測者以成對抽樣,因而每對中的各元素性質相近(相同作業員),而不同對的資料間性質不同。每對的其中一個元素使用方法1,而另一個則使用方法2 第10章 兩母體平均數與比例的統計推論 第402頁
「獨立樣本」設計與「成對樣本」設計 假設製造某項產品有兩種方式,今欲瞭解何種方法得出較高的產量,對12名員工進行實驗 獨立樣本 成對樣本 隨機抽取一組員工樣本使用方法1,再抽取另一組隨機員工使用方法2,兩組員工樣本的產量資料是彼此獨立的 成對樣本 隨機抽取一組員工樣本(n=6),這些員工有些先使用方法1,再使用方法2;有些則相反進行。所以每位員工會提供一組資料 也可以先將12名員工進行成對配置,配對時依其智力、技術能力等。配對完成後,隨機地自每對中選出一位員工使用方法1,另一個使用方法2,而可得到6對資料。
配對樣本設計的優點 可控制影響結果的因素,儘量使實驗結果不受其他外在因素的干擾 所導致的抽樣誤差通常較獨立樣本設計來得小
兩母體平均數之差的推論: 配對樣本 (實例) 假定某製造商欲生產某一特定產品可以採用兩種不同的方法。為了使產出最大,該公司想知道哪一種方法其完成一單位產品的平均時間最短 令 μ1 及μ2 分別代表生產方法 1 及生產方法 2 的母體平均數完成時間,由於事先並不知道哪一種方法較好,我們先假定這兩種方法的平均完成時間相等。 因此,虛無假設為 H0:μ1 -μ2 =0。 如果此一假設被拒絕,即顯示其母體平均數完成時間確有差異。而在本案例中,平均完成時間較短的方法將被公司所採用。 第10章 兩母體平均數與比例的統計推論 第401-402頁
兩母體平均數之差的推論: 配對樣本 (實例) 此時,虛無及對立假設可表示如下。 H0:μ1- μ2=0 Ha:μ1- μ2 ≠ 0 使用配對樣本設計來檢定兩生產方法間差異的方式,說明其分析方法。假定 6 位作業員(相同實驗個體)被選取為一隨機樣本,其完成產品所用的時間如表 10.2 所示。 必須注意的是,這些作業員每位均提供了一對觀測值,每種生產方法各有一個值,而最後一行乃每位作業員使用兩種方法所需時間之差 di。 第10章 兩母體平均數與比例的統計推論 第402頁
兩母體平均數之差的推論: 配對樣本 (實例) 第10章 兩母體平均數與比例的統計推論 第402頁 表10.2
兩母體平均數之差的推論: 配對樣本 (實例) 配對樣本設計分析法的關鍵在於,我們只須考慮含有差異數字的那一行即可。也就是說,分析兩生產方法的母體平均數之差時,只須用 6 個數字 (0.6, -0.2, 0.5, 0.3, 0.0, 0.6) 將兩母體平均數差的問題,變成處理單一母體平均數的問題 令μd =表作業員母體間平均數之差,此時前述虛無與對立假設可重新表達為 H0:μd = 0 Ha:μd 0 第10章 兩母體平均數與比例的統計推論 第402-403頁
兩母體平均數之差的推論: 配對樣本 (實例) 符號 d 提醒了我們,配對樣本提供的是有關差異的資料。由表 10.2 中的 6 個差異值可計算出樣本平均數及樣本標準差如下。 第10章 兩母體平均數與比例的統計推論 第403頁
兩母體平均數之差的推論: 配對樣本 (實例) 因小樣本數 n=6 位作業員,我們需假設母體之差異為常態分配。這是必要的假設,故我們可使用 t 分配於假設檢定與區間估計過程。 基於此假設,具有 n-1 個自由度的 t 分配之檢定統計值如下。 第10章 兩母體平均數與比例的統計推論 第403頁
兩母體平均數之差的推論: 配對樣本 (實例) 此雙尾檢定之 p 值計算如下,因 t =2.20 > 0,故檢定估計值位於 t 分配之右尾。在右尾 t =2.2 至右方之檢定統計量,可由 t 分配表與自由度=n-1=6-1=5 決定之。 t 分配表中自由度為 5 之數列資料如下: 第10章 兩母體平均數與比例的統計推論 第403頁
兩母體平均數之差的推論: 配對樣本 (實例) 因此,該區域位於右尾 0.05 與 0.025 之間。因此為雙尾檢定,故此值被加倍而使 p 值為介於 0.10 與 0.05 間。此 p 值大於 α =0.05,故不拒絕虛無假設 H0:μd = 0。使用 Minitab 與表 10.2 中資料,我們可發現 p 值=0.080。 第10章 兩母體平均數與比例的統計推論 第403頁
兩母體平均數之差的推論: 配對樣本 (實例) 此外,也可根據此一樣本的資料,藉由第 8章所介紹的單一母體方法,估計出兩母體平均數之差的 95% 信賴區間,其計算過程如下: 因此,邊際誤差為 0.35,此兩生產方法母體平均數之差的 95% 信賴區間為-0.05 分鐘至 0.65 分鐘。 第10章 兩母體平均數與比例的統計推論 第403頁
10.4 兩母體比例之差的推論 p1 - p2 之區間估計 第10章 兩母體平均數與比例的統計推論 第408頁
的抽樣分配 抽樣分配之平均值 p1 – p2 標準差(標準誤) 第10章 兩母體平均數與比例的統計推論 第407-408頁
的抽樣分配 若樣本數目足夠大,且n1p1、n2(1 - p2)、n2p2與n2(1 - p2) 均大於或等於 5,則 的抽樣分配將趨近於常態分配。 第10章 兩母體平均數與比例的統計推論 第408頁
p1 - p2 之區間估計 區間估計 第10章 兩母體平均數與比例的統計推論 第408頁
p1 - p2 之區間估計(實例) 某稅務代理公司想比較旗下兩家地區辦事處的工作品質,遂從各辦事處代理過的退稅案件中,隨機抽取若干為一樣本,審查其正確性,以估計各辦事處退稅錯誤案件所佔的比例。該公司特別想知道的是這兩個比例有否差異。令 p1= 母體 1 (辦事處 1) 的退稅錯誤比例 p2= 母體 2 (辦事處 2) 的退稅錯誤比例 = 母體 1 所抽取之簡單隨機樣本的樣本比例 = 母體 2 所抽取之簡單隨機樣本的樣本比例 第10章 兩母體平均數與比例的統計推論 第407頁
p1 - p2 之區間估計(實例) 兩間辦事處的獨立簡單隨機樣本資料如下 此兩辦事處的樣本比例分別為: 試求兩間辦事處錯誤比例差之90% 信賴區間? 第10章 兩母體平均數與比例的統計推論 第408頁
p1 - p2 之區間估計(實例) 兩母體間退稅錯誤案件比例之差的點估計值為 =0.14- 0.09=0.05。故我們可以估計辦事處1 的錯誤比率較辦事處 2 多了 0.05 或 5%。 在 90% 信賴區間下,z/2= z0.025=1.645,則 所以,邊際誤差為 0.045,且 90% 信賴區間為 0.005 至 0.095。 第10章 兩母體平均數與比例的統計推論 第408-409頁
p1 - p2 之假設檢定 假設檢定 我們欲專注於兩母體比例間無差異的檢定。 (亦即 p1 = p2 ) 左尾檢定 右尾檢定 雙尾檢定 第10章 兩母體平均數與比例的統計推論 第409頁
p1 - p2 之假設檢定 之標準誤的混合估計量 其中: 第10章 兩母體平均數與比例的統計推論 第409頁
p1 - p2 之假設檢定 檢定統計量 第10章 兩母體平均數與比例的統計推論 第409頁
p1 - p2 之假設檢定(實例) 回到稅務代理公司的範例,並假設該公司想確定兩家辦事處的出錯比例是否有差異。故雙尾檢定之虛無與對立假設如下: H0:p1- p2 =0 Ha:p1- p2 ≠ 0 若 H0 被拒絕,則該公司可獲致兩辦事處的錯誤比例不同。我們將採用 α =0.10 的顯著水準進行檢定。 第10章 兩母體平均數與比例的統計推論 第410頁
p1 - p2 之假設檢定(實例) p 的混合估計量可計算如下: 使用混合估計值與兩樣本比例之差,則檢定統計量之值即為: 第10章 兩母體平均數與比例的統計推論 第410頁
p1 - p2 之假設檢定(實例) 以下計算此雙尾檢定的 p 值,我們發現 z=1.85 位於標準常態分配的右尾。使用 z=1.85 與標準常態分配表,其右尾對應的區域為 0.5000-0.4678=0.0322。雙尾之 p 值即為 2(0.0322) =0.0644,因其小於α=0.10,故在 0.10 顯著水準下,拒絕 H0。 該公司可獲得兩家辦事處的退稅錯誤比例不同。這項假設檢定的結論,與前述以區間估計所得到的兩辦事處母體錯誤率之差的區間估計值為 0.005 至 0.095,與辦事處 1 有較高的錯誤率相吻合。 第10章 兩母體平均數與比例的統計推論 第410頁
作業 4、12、19、21、29、37、41、46
End of Chapter 10