第 10 章 兩母體平均數與 比例的推論
本章內容 10.1 兩母體平均數之差的推論:σ1 與 σ2 已知 10.2 兩母體平均數之差的推論:σ1 與 σ2 未知 10.1 兩母體平均數之差的推論:σ1 與 σ2 已知 10.2 兩母體平均數之差的推論:σ1 與 σ2 未知 10.3 兩母體平均數之差的推論:配對樣本 10.4 兩母體比例之差的推論 第10章 兩母體平均數與比例的推論 第373-404頁
10.1 兩母體平均數之差的推論: σ1 與 σ2 已知 μ1 – μ2 之區間估計 兩母體平均數之差的點估計量 10.1 兩母體平均數之差的推論: σ1 與 σ2 已知 μ1 – μ2 之區間估計 兩母體平均數之差的點估計量 兩母體平均數之差的區間估計:σ1 與 σ2 已知 μ1 – μ2 之假設檢定的檢定統計量:σ1 與 σ2 已知 第10章 兩母體平均數與比例的推論 第375.376頁
兩母體平均數之差的推論 令 μ1= 母體 1 的平均數 (即市區分店所有顧客的平均年齡) μ1= 母體 1 的平均數 (即市區分店所有顧客的平均年齡) μ2= 母體 2 的平均數 (即郊區分店所有顧客的平均年齡) 兩母體間平均數之差即為 μ1 − μ2 欲估計 μ1 − μ2,我們必須從母體 1 中抽取包含 n1 個顧客的 簡單隨機樣本,且從母體 2 中抽取包含 n2 個顧客的簡單隨 機樣本。我們再計算出兩個樣本平均數。 = n1 個市區顧客所形成樣本的平均年齡 = n2 個郊區顧客所形成樣本的平均年齡 此兩個母體平均數之差的點估計量即為兩樣本平均數之差 。 第10章 兩母體平均數與比例的推論 第375頁
的抽樣分配 期望值 標準差 (標準誤) 其中 1 = 母體 1 的標準差 2 = 母體 2 的標準差 n1 = 母體 1 的樣本數 1 = 母體 1 的標準差 2 = 母體 2 的標準差 n1 = 母體 1 的樣本數 n2 = 母體 2 的樣本數 第10章 兩母體平均數與比例的推論 第376頁
兩母體平均數之差的推論: σ1 與 σ2 已知 區間估計 其中 1 − α 為信賴係數 第10章 兩母體平均數與比例的推論 第376頁
兩母體平均數之差的推論: σ1 與 σ2已知 第10章 兩母體平均數與比例的推論 第376頁
兩母體平均數之差的推論: σ1 與 σ2 已知實例 Greystone 百貨公司在紐約州水牛城有兩家分店: 一家在市區,另一家則位於郊區購物中心。該公司 的區經理發現,在其中一家分店賣得很好的產品, 常常在另一家分店賣不好。該區經理相信,這可能 是因這兩區域顧客的年齡、教育程度、所得等人口 統計特徵的差異所致。現在假設這位區經理請我們 替他分析這兩個地點的顧客平均年齡是否確有差異 。 將市區分店的顧客視為母體 1,而郊區分店的顧客 為母體 2。 第10章 兩母體平均數與比例的推論 第375頁
兩母體平均數之差的推論: σ1 與 σ2 已知實例 依據前述之顧客人數作為統計研究的資料,兩個母 體標準差已知為 σ1=9 歲與 σ2=10 歲。由顧客中蒐 集到的兩個獨立簡單隨機樣本的資料如下。 第10章 兩母體平均數與比例的推論 第376-377頁
兩母體平均數之差的推論: σ1 與 σ2 已知實例 兩母體平均年齡之差的點估計值為 =40-35=5 歲。 由此可估計市區分店顧客的平均年齡,比郊區分店顧客的 平均年齡大 5 歲。 若使用 95% 信賴水準,且 z/2=z0.025=1.96,我們可得 因此,邊際誤差為 4.06 歲,並且兩母體平均數之差的 95% 信賴區間估計量為 5 − 4.06=0.94 歲至 5+4.06=9.06 歲。 第10章 兩母體平均數與比例的推論 第377頁
μ1 – μ2 之假設檢定:σ1 與 σ2 已知 假設檢定 檢定統計量 左尾檢定 右尾檢定 雙尾檢定 H0: μ1 – μ2 > D0 Ha: μ1 – μ2 < D0 Ha: μ1 – μ2 > D0 Ha: μ1 – μ2 ≠ D0 左尾檢定 右尾檢定 雙尾檢定 第10章 兩母體平均數與比例的推論 第377頁
μ1 – μ2 之假設檢定: σ1 與 σ2 已知實例 為了瞭解兩家訓練中心的教育品質是否有差別,而 讓在這兩家訓練中心受訓的所有人員均接受同樣標 準化的測驗,並以平均測驗成績的差異,評估兩訓 練中心教育品質之異同。兩訓練中心之母體的平均 數如下: μ1 = 在 A 中心受訓人員的母體的平均測驗成績 μ2 = 在 B 中心受訓人員的母體的平均測驗成績 我們先暫時假設這兩家中心的訓練品質並無差異, 因此就平均測驗成績而言,其虛無假設為 μ1-μ2= 0。 第10章 兩母體平均數與比例的推論 第377-378頁
μ1 – μ2 之假設檢定: σ1 與 σ2 已知實例 有關雙尾檢定的虛無假設與對立假設可表達為 H0:μ1- μ2=0 Ha:μ1- μ2 ≠ 0 若以往在不同測驗下之標準化成績均顯示測驗成績 的標準差大約為 10 分,則我們可利用此資訊,假 設母體之標準差均為已知,即 σ1=10 與 σ2=10。 本研究採 α=0.05 之顯著水準。 第10章 兩母體平均數與比例的推論 第378頁
μ1 – μ2 之假設檢定: σ1 與 σ2 已知實例 獨立簡單隨機樣本中,n1=30 人為來自訓練中心 A ,n2=40 人則來自訓練中心 B,個別之樣本平均數 分別為 =82 與 =78。這些資料是否能建議兩 個訓練中心之母體平均數有顯著差異呢?為了協助 回答此問題,我們利用式 (10.5) 計算出檢定統計量 。 第10章 兩母體平均數與比例的推論 第378頁
μ1 – μ2 之假設檢定: σ1 與 σ2 已知實例 p 值法 z=1.66,平均數與 z=1.66 之間的面積為 0.9515。因此位 於分配右尾之面積為 1.0000 − 0.9515=0.0485。 由於此為雙尾檢定,我們必須加倍尾部面積:p 值= 2 (0.0485)=0.0970。 因為 p 值為 0.0970,故在 0.05 顯著水準下,我們不拒絕 H0,即此抽樣結果無法提供足夠的證據證明兩訓練中心在 品質上有差異。 第10章 兩母體平均數與比例的推論 第378頁
μ1 – μ2 之假設檢定: σ1 與 σ2 已知實例 臨界值法 α=0.05 與 z/2=z0.025=1.96,若 z ≤ −1.96或 z ≥ 1.96 時, 即拒絕 H0。 本例中 z=1.66,故我們仍得到不拒絕 H0的同樣結論。 第10章 兩母體平均數與比例的推論 第378頁
10.2 兩母體平均數之差的推論: σ1 與 σ2 未知 m 1 – m 2之區間估計 第10章 兩母體平均數與比例的推論 第382頁
兩母體平均數之差的推論: σ1 與 σ2 未知 當 σ1 與 σ2 未知時,我們將使用樣本標準差 s1 與 s2 來估計 σ1 與 σ2,並以 tα/2 取代 zα/2。結果兩母體平 均數之差的區間估計公式如下: 其中1 - α 為信賴係數。 第10章 兩母體平均數與比例的推論 第382頁
兩母體平均數之差的推論: σ1 與 σ2 未知 區間估計 ta/2 的自由度為 第10章 兩母體平均數與比例的推論 第382頁
兩母體平均數之差的推論: σ1 與 σ2 未知實例 Clearwater 國家銀行正進行一項在其兩家分行的顧 客支票帳戶之平均差異的調查。Cherry Grove 分行 中簡單隨機抽樣 28 個支票帳戶,Beechmont 分行 亦獨立簡單隨機抽樣 22 個支票帳戶。每一個支票 帳戶的目前支票帳戶平均餘額均加以記錄。帳戶平 均餘額之摘要如下: 第10章 兩母體平均數與比例的推論 第381-382頁
兩母體平均數之差的推論: σ1 與 σ2 未知實例 Clearwater 國家銀行欲估計 Cherry Grove 與 Beechmont 顧客母體支票帳戶平均數的差異。 Cherry Grove 分行樣本資料顯示 n1=28、 = $1025 與 s1=$150,而 Beechmont 分行則為 n2=22 、 =$910、s2=$125。t/2 之自由度計算如下: 第10章 兩母體平均數與比例的推論 第382頁
兩母體平均數之差的推論: σ1 與 σ2 未知實例 我們將非整數之自由度向下圓整為 47,以獲得較大的 t 值 及較為保守的區間估計。使用 t 分配表與自由度 47,可求 得 t0.025=2.012。使用式 (10.6) ,我們可以建立兩母體平均 數之差的 95% 信賴區間如下: 此兩分行的母體平均支票帳戶餘額之差的點估計值為 $115 ,邊際誤差為 $78,且兩母體平均數之差的 95% 信賴區間 估計值為 115-78=$37 至 115+78=$193。 第10章 兩母體平均數與比例的推論 第382-383頁
兩母體平均數之差的推論: σ1 與 σ2 已知 假設檢定 檢定統計量 左尾檢定 右尾檢定 雙尾檢定 H0: μ1 – μ2 > D0 Ha: μ1 – μ2 < D0 Ha: μ1 – μ2 > D0 Ha: μ1 – μ2 ≠ D0 左尾檢定 右尾檢定 雙尾檢定 第10章 兩母體平均數與比例的推論 第383頁
兩母體平均數之差的推論: σ1 與 σ2 未知實例 某家公司剛開發出一種新的電腦套裝軟體,其可協 助系統分析師減少設計、發展,以及執行資訊系統 所需的時間。為了評估此新套裝軟體的好處,該公 司選取 24 位系統分析師為一隨機樣本,每位分析 師均必須完成一指定規格的假想資訊系統,其中 12 位須以現有的技術來完成,另外 12 位則訓練他 們使用此新套裝軟體來完成。 本研究中包含兩個母體:一個是使用現有技術的系 統分析師的母體,另一個則是使用新套裝軟體者的 系統分析師的母體。 第10章 兩母體平均數與比例的推論 第383頁
兩母體平均數之差的推論: σ1 與 σ2 未知實例 以完成此一資訊系統設計計畫所需的時間而言,其母體平 均數為 μ1= 使用現有技術的系統分析師完成計畫所需的平均時間 μ2= 使用新套裝軟體技術的系統分析師完成計畫所需的平 均時間 負責此一新軟體評估計畫的研究人員,希望能證明新套裝 軟體確可縮短計畫完成的平均時間,故研究人員希望找到 證據證明 μ2 小於 μ1;在此情形下,兩母體平均數之差,μ1 − μ2 ,將會大於零。 第10章 兩母體平均數與比例的推論 第383-384頁
兩母體平均數之差的推論: σ1 與 σ2 未知實例 研究人員提出的 μ1 − μ2>0 假設,應視為對立假設 。所以,本假設檢定即為 H0:μ1- μ2 ≤ 0 Ha:μ1- μ2 < 0 我們將以 α=0.05 為顯著水準。 第10章 兩母體平均數與比例的推論 第384頁
表10.1 第10章 兩母體平均數與比例的推論 第384頁
兩母體平均數之差的推論: σ1 與 σ2 未知實例 假設此 24 位分析師完成計畫的結果如表 10.1。使用式 (10.8) 中之檢定統計量,我們可得: 採用式 (10.7) 計算自由度,我們可得: 第10章 兩母體平均數與比例的推論 第384頁
兩母體平均數之差的推論: σ1 與 σ2 未知實例 向下圓整後,我們採用自由度為 21 之 t 分配。t 分配表中該 列之數據如下: 採用右尾檢定,p 值為 t =2.27 的右尾面積。 p 值介於 0.025 與 0.01 之間, p 值小於 α =0.05,故拒絕 H0。 此抽樣結果可使研究人員得到 μ1 − μ2 > 0或 μ1 > μ2 的結論。 由此,研究計畫支持新套裝軟體提供較小的母體平均完成 時間的結論。 第10章 兩母體平均數與比例的推論 第384-385頁
評註 另一種當 σ1 與 σ2 未知時,兩母體平均數之差的推 論係基於兩母體具有相同標準差 (σ1 = σ2 = σ )的假 定。在此假定下,兩樣本標準差結合成下列混合樣 本變異數: 此時 t 檢定統計量則變成 第10章 兩母體平均數與比例的推論 第385頁
評註 且具有 n1 + n2 - 2 個自由度。此時,p 值的計算 與抽樣結果的解釋與本節前述討論之程序相同。 本節介紹的 t 程序並不需要母體標準差相同之假定 ,且無論母體變異是否相同均可運用,故其為較普 遍之程序,亦被多方運用。 第10章 兩母體平均數與比例的推論 第385頁
10.3 兩母體平均數之差的推論: 配對樣本 在設計適當的抽樣程序,以蒐集生產時間的資料並 對上述假設進行檢定時,有兩種方法:獨立樣本 (independent samples) 及配對樣本 (matched samples) 可供選擇。 由於在配對樣本設計中,這兩種生產方法是在類似 的條件下被測試的,因此這種設計方式所導致的抽 樣誤差通常較獨立樣本設計來得小。 第10章 兩母體平均數與比例的推論 第389頁
兩母體平均數之差的推論: 配對樣本實例 假定某製造商可以採用兩種不同的方法生產某一特 定產品。為了使產出最大,該公司想知道哪一種方 法其完成一單位產品的平均時間最短。 令 μ1 及 μ2 分別代表生產方法 1 及生產方法 2 的母 體平均數完成時間,由於事先並不知道哪一種方法 較好,我們先假定這兩種方法的平均完成時間相等 。因此,虛無假設為 H0:μ1 -μ2=0。 如果此一假設被拒絕,即顯示其母體平均數完成時 間確有差異。而在本案例中,平均完成時間較短的 方法將被公司所採用。 第10章 兩母體平均數與比例的推論 第389頁
兩母體平均數之差的推論: 配對樣本實例 此時,虛無及對立假設可表示如下。 H0:μ1- μ2=0 Ha:μ1- μ2 ≠ 0 使用配對樣本設計來檢定兩生產方法間差異的方式 ,說明其分析方法。假定 6 位作業員被選取為一隨 機樣本,其完成產品所用的時間如表 10.2 所示。 必須注意的是,這些作業員每位均提供了一對觀測 值,每種生產方法各有一個值,而最後一行乃每位 作業員使用兩種方法所需時間之差 di。 第10章 兩母體平均數與比例的統計推論 第389頁
表10.2 第10章 兩母體平均數與比例的推論 第390頁
兩母體平均數之差的推論: 配對樣本實例 配對樣本設計分析法的關鍵在於,我們只須考慮含 有差異數字的那一行即可。也就是說,分析兩生產 方法的母體平均數之差時,只須用六個數字 (0.6、 −0.2、0.5、0.3、0.0 及 0.6)。 令μd=作業員母體間平均數之差,此時前述虛無與 對立假設可重新表達為 H0:μd = 0 Ha:μd 0 如果H0被拒絕,我們即可下結論說,母體平均數完 成時間確有差異。 第10章 兩母體平均數與比例的推論 第390-391頁
兩母體平均數之差的推論: 配對樣本實例 符號 d 提醒我們,配對樣本提供的是有關差異的資 料。由表 10.2 中的六個差異值可計算出樣本平均 數及樣本標準差如下。 第10章 兩母體平均數與比例的推論 第390頁
兩母體平均數之差的推論: 配對樣本實例 因小樣本數 n=6 位作業員,我們需假設母體之差 異為常態分配。這是必要的假設,故我們可使用 t 分配於假設檢定與區間估計過程。 基於此假設,具有 n-1 個自由度的 t 分配之檢定 統計量如下。 第10章 兩母體平均數與比例的推論 第390頁
兩母體平均數之差的推論: 配對樣本實例 此雙尾檢定之 p 值計算如下,因 t =2.20 > 0,故 檢定估計值位於 t 分配之右尾。在右尾 t =2.20 至 右方之檢定統計量,可由 t 分配表與自由度= n- 1=6 − 1=5 決定之。 t 分配表中自由度為 5 之數列 資料如下: 第10章 兩母體平均數與比例的推論 第390頁
兩母體平均數之差的推論: 配對樣本實例 因此,該區域位於右尾 0.05 與 0.025 之間。由於是 雙尾檢定,故此值被加倍,而使 p 值為介於 0.10 與 0.05 之間。此 p 值大於 α =0.05,故不拒絕虛無 假設 H0:μd = 0。使用 Excel 與表 10.2 中資料,我 們可發現 p 值=0.080。 第10章 兩母體平均數與比例的推論 第391頁
兩母體平均數之差的推論: 配對樣本實例 此外,也可根據此一樣本的資料,藉由第 8 章所介 紹的單一母體方法,估計出兩母體平均數之差的 95% 信賴區間,其計算過程如下: 因此,邊際誤差為 0.35,此兩生產方法母體平均數 之差的 95% 信賴區間為 −0.05 分鐘至 0.65 分鐘。 第10章 兩母體平均數與比例的推論 第391頁
10.4 兩母體比例之差的推論 p1 − p2 之區間估計 第10章 兩母體平均數與比例的推論 第395頁
的抽樣分配 期望值 標準差(標準誤) 其中 n1 = 母體 1 的樣本數 n2 = 母體 2 的樣本數 第10章 兩母體平均數與比例的推論 第395頁
的抽樣分配 若樣本數目足夠大,則 的抽樣分配將趨近於 常態分配。 若符合以下條件,則樣本數目足夠大 n1 p1 > 5 若樣本數目足夠大,則 的抽樣分配將趨近於 常態分配。 若符合以下條件,則樣本數目足夠大 n1 p1 > 5 n1(1 − p1) > 5 n2 p2 > 5 n2(1 − p2) > 5 第10章 兩母體平均數與比例的推論 第395頁
p1 - p2 之區間估計 區間估計 第10章 兩母體平均數與比例的推論 第395頁
p1 - p2 之區間估計實例 某稅務代理公司想比較旗下兩家地區辦事處的工作 品質,遂從各辦事處代理過的退稅案件中,隨機抽 取若干為一樣本,審查其正確性,以估計各辦事處 退稅錯誤案件所占的比例。該公司特別想知道的是 這兩個比例有否差異。令 p1= 母體 1 (辦事處 1) 的退稅錯誤比例 p2= 母體 2 (辦事處 2) 的退稅錯誤比例 = 母體 1 所抽取之簡單隨機樣本的樣本比例 = 母體 2 所抽取之簡單隨機樣本的樣本比例 第10章 兩母體平均數與比例的統計推論 第394-395頁
p1 - p2 之區間估計實例 兩間辦事處的獨立簡單隨機樣本資料如下 此兩辦事處的樣本比例分別為: 第10章 兩母體平均數與比例的推論 第395-396頁
p1 - p2 之區間估計實例 兩母體間退稅錯誤案件比例之差的點估計值為 = 0.14 − 0.09=0.05。故我們可以估計辦事處 1 的錯誤比率較 辦事處 2 多了 0.05 或 5%。 在 90% 信賴區間下,z/2= z0.05=1.645,則 所以,邊際誤差為 0.045,且 90% 信賴區間為 0.005 至 0.095。 第10章 兩母體平均數與比例的推論 第396頁
p1 - p2 之假設檢定 假設檢定 我們欲專注於兩母體比例間無差異的檢定。 (亦即 p1 = p2) 左尾檢定 右尾檢定 雙尾檢定 第10章 兩母體平均數與比例的統計推論 第396頁
p1 − p2 之假設檢定 當 p1 = p2 = p 時之 之標準誤 當 p1 = p2 = p 時之 p 的混合估計量 第10章 兩母體平均數與比例的推論 第396-397頁
p1 - p2 之假設檢定 檢定統計量 第10章 兩母體平均數與比例的推論 第397頁
p1 - p2 之假設檢定實例 回到稅務代理公司的範例,並假設該公司想確定兩 家辦事處的錯誤比例是否有差異。故雙尾檢定之虛 無與對立假設如下: H0:p1 − p2 =0 Ha:p1 − p2 ≠ 0 若 H0 被拒絕,則該公司可獲致兩辦事處的錯誤比 例不同。我們將採用 α =0.10 的顯著水準進行檢定 。 第10章 兩母體平均數與比例的推論 第397頁
p1 - p2 之假設檢定實例 p 的混合估計量可計算如下: 使用混合估計值與兩樣本比例之差,則檢定統計量 之值即為: 第10章 兩母體平均數與比例的推論 第397頁
p1 - p2 之假設檢定實例 以下計算此雙尾檢定的 p 值,我們發現 z=1.85 位 於標準常態分配的右尾。使用 z=1.85 與標準常態 分配表,其右尾對應的區域為 1.0000 − 0.9678= 0.0322。雙尾之 p 值即為 2(0.0322) =0.0644,因其 小於 α=0.10,故在 0.10 顯著水準下,拒絕 H0。 該公司可獲得兩家辦事處的退稅錯誤比例不同。這 項假設檢定的結論,與前述以區間估計所得到的兩 辦事處母體錯誤率之差的區間估計值為 0.005 至 0.095,與辦事處 1 有較高的錯誤率相吻合。 第10章 兩母體平均數與比例的推論 第397頁
End of Chapter 10