第11章 兩母體的統計估計和 假設檢定
第一節 兩母體平均數差在獨立 大樣本下的統計推論 第一節 兩母體平均數差在獨立 大樣本下的統計推論 的抽樣分配性質可獲得結論如下: (1) (2) (3)當nX≥30且nY≥ 30時,依中央極限定理,不論兩母體的原分 配是否為常態, 的分配型態趨近於常態分配:
第一節 兩母體平均數差在獨立 大樣本下的統計推論 第一節 兩母體平均數差在獨立 大樣本下的統計推論 (4) 標準化之後成Z值,其分配變為標準常態分配: 若 和 未知,在大樣本下,分別以 和 取代,Z的分配 依然是標準常態分配:
第一節 兩母體平均數差在獨立 大樣本下的統計推論 第一節 兩母體平均數差在獨立 大樣本下的統計推論 兩母體平均數差 的區間估計公式
第一節 兩母體平均數差在獨立 大樣本下的統計推論 第一節 兩母體平均數差在獨立 大樣本下的統計推論 兩母體平均數差μx -μY的假設檢定 兩母體平均數差μx -μY的假設檢定方法,有Z值檢定、t值檢定、 P值檢定及區間估計法等多種,以下將介紹Z值檢定和t值檢定 兩種方法。 事實上,「μx -μY的假設檢定」原理和過程與「單一母體的假 設檢定」是大同小異的,請仔細研讀例8和例9來瞭解其檢定 原理和過程。
第二節 兩母體平均數差在獨立 小樣本下的統計推論 第二節 兩母體平均數差在獨立 小樣本下的統計推論 小樣本下 的抽樣分配 從兩個獨立的X常態母體和Y常態母體中,分別隨機抽取nX≤30, nY≤30(小樣本)的兩組獨立樣本,其平均數差 的抽樣分 配性質為: (1) (2) (3) 的分配型態為常態分配,記作: (4)當進一步把 標準化,則其分配型態,將因 、 是 否已知而異。
第二節 兩母體平均數差在獨立 小樣本下的統計推論 第二節 兩母體平均數差在獨立 小樣本下的統計推論 標準化後的分配性質和 的區間估計 若兩獨立母體為常態分配,分別從其中抽取樣本數nX<30和 nY<30的兩隨機樣本,則樣本平均數差 的抽樣分配是常態 分配,為: 當欲進一步對 標準化時,將因 和 是否已知,而有下列 不同的變化:
第二節 兩母體平均數差在獨立 小樣本下的統計推論 第二節 兩母體平均數差在獨立 小樣本下的統計推論 (1)兩母體為常態分配,其變異數 和 已知時, 標準化之後 成為Z值,呈現標準常態分配,故檢定統計量為:
第二節 兩母體平均數差在獨立 小樣本下的統計推論 第二節 兩母體平均數差在獨立 小樣本下的統計推論 由上式的標準常態分配性質,仿照單元11-13「大樣本下, 的區間估計原理」,可以推導出 的區間估計公式為:
第二節 兩母體平均數差在獨立 小樣本下的統計推論 第二節 兩母體平均數差在獨立 小樣本下的統計推論 (2)若 和 未知,將 標準化時,將因 和 是否相等, 有不同結果: ①常態分配的兩獨立母體, 和 未知,但 = 時, 標準化就形成自由度為( -2)的t分配,其檢定統計量 如下:
第二節 兩母體平均數差在獨立 小樣本下的統計推論 第二節 兩母體平均數差在獨立 小樣本下的統計推論 稱為混合樣本變異數(pooled sample variance),是兩母體變 異數的共同估計值,關於 的形成原理,請讀單元11-25 至單元11-28。 由上述t分配的性質,配合區間估計的推導原理,我們可 以推導出 的區間估計公式為:
第二節 兩母體平均數差在獨立 小樣本下的統計推論 第二節 兩母體平均數差在獨立 小樣本下的統計推論 ②小樣本,兩母體為常態分配, 和 未知,但 時, 標準化形成t分配,其檢定統計量為:
第二節 兩母體平均數差在獨立 小樣本下的統計推論 第二節 兩母體平均數差在獨立 小樣本下的統計推論 由上述t分配性質,可以推導出 的區間估計公式:
第二節 兩母體平均數差在獨立 小樣本下的統計推論 第二節 兩母體平均數差在獨立 小樣本下的統計推論 混合樣本平均數、變異數、比率的形成原理 1.混合樣本平均數(pooled sample average) 兩個樣本平均數,混合併成一個樣本平均數,以作為母體 平均數的估計值。 2.混合樣本變異數(pooled sample variance) 兩個樣本變異數,混合併成一個變異數,以作為母體變異 數的估計值。 3.混合樣本比率(pooled sample proportion) 兩個樣本比率,混合併成一個樣本比率,以作為母體比率 的估計值。
第二節 兩母體平均數差在獨立 小樣本下的統計推論 第二節 兩母體平均數差在獨立 小樣本下的統計推論 混合樣本平均數的形成原理 做法如下: 混合樣本平均數Mp(加權平均數)的公式為:
第二節 兩母體平均數差在獨立 小樣本下的統計推論 第二節 兩母體平均數差在獨立 小樣本下的統計推論 混合樣本變異數的形成原理 已知 = = (共同變異數), 為 的不偏估計值, 為 的不偏估計值。
第二節 兩母體平均數差在獨立 小樣本下的統計推論 第二節 兩母體平均數差在獨立 小樣本下的統計推論 混合樣本變異數 的公式為:
第二節 兩母體平均數差在獨立 小樣本下的統計推論 第二節 兩母體平均數差在獨立 小樣本下的統計推論 混合樣本比率的形成原理 已知 = =p(共同比率), 為 的不偏估計值,為 的不 偏估計值。
第二節 兩母體平均數差在獨立 小樣本下的統計推論 第二節 兩母體平均數差在獨立 小樣本下的統計推論 混合樣本比率 的公式為:
第二節 兩母體平均數差在獨立 小樣本下的統計推論 第二節 兩母體平均數差在獨立 小樣本下的統計推論 獨立小樣本下,兩母體平均數差 的信賴區間 估計公式
第三節 兩成對母體平均數差在 相關樣本下的統計推論 第三節 兩成對母體平均數差在 相關樣本下的統計推論 比較獨立樣本和成對樣本的標準誤 兩樣本平均數差的標準誤公式: 上式中 ,稱為共變數(covariance)。 兩樣本 和 的共變數是它們相關與否的指標。若共變數等於0, 則稱樣本 和 樣本無相關(即獨立);若共變數不等於0,則稱 兩樣本 和 有相關:
第三節 兩成對母體平均數差在 相關樣本下的統計推論 第三節 兩成對母體平均數差在 相關樣本下的統計推論 綜合上述的分析,我們可以得到結論:兩組樣本的相關或獨 立,會影響標準誤 值的變化,進而影響Z值和最後檢定的 結果。
第三節 兩成對母體平均數差在 相關樣本下的統計推論 第三節 兩成對母體平均數差在 相關樣本下的統計推論 根據單元11-38的例子我們可以得知,對於有相關(非獨立) 的兩組樣本,不可使用前述的獨立樣本母體平均數差檢定公 式來檢定,必須改用成對樣本(matching)或集區(blocking)方式 的抽樣和統計處理才適當。 相關樣本的三種成對抽樣方式 1.配對法 以具有相同特質(如年齡)的兩人編成一對,再將其中一 人分派至X組,另一人分派至Y組
第三節 兩成對母體平均數差在 相關樣本下的統計推論 第三節 兩成對母體平均數差在 相關樣本下的統計推論 2.重複量數法 同一個人接受兩種處理和測試,如同前例所示,同一個人 接受降血壓藥物實驗和測試,因為每一對是由同一人擔任, 所以各對內是同質的(包含相同的年齡、血型、基因等), 但各對之間,則有個別差異。 3.同胎法 由於雙胞胎(或三胞胎)有極相似的體質,所以雙胞胎接 受兩種處理或測試,可視為重複量數的特例。
第三節 兩成對母體平均數差在 相關樣本下的統計推論 第三節 兩成對母體平均數差在 相關樣本下的統計推論 成對樣本觀察值的資料結構 分別由母體X和母體Y隨機抽取n個觀察值,依某相同特徵配對 (x1與y1, x2與y2,…,xn與yn),再分派成兩組。最後對兩組進行 實驗處理和測試,即可獲得n對平均差(di),即: 表11-2
第三節 兩成對母體平均數差在 相關樣本下的統計推論 第三節 兩成對母體平均數差在 相關樣本下的統計推論 上面n對差異(d1,d2,…,dn),可視為從平均數 、標準差 的新 母體中,隨機抽出的一組隨機樣本。依該組樣本資料,計算 的樣本平均數差和標準差為:
第三節 兩成對母體平均數差在 相關樣本下的統計推論 第三節 兩成對母體平均數差在 相關樣本下的統計推論 成對樣本平均數 的抽樣分配 其抽樣分配性質為:
第三節 兩成對母體平均數差在 相關樣本下的統計推論 第三節 兩成對母體平均數差在 相關樣本下的統計推論 成對樣本平均數 的分配型態 依單元11-42所示,成對母體平均數差 的區間估計和檢定統 計量如下所述: (1)大樣本(n≥30)下,成對樣本平均數差 的抽樣分配為: ①當 已知,其成對母體平均數差 的(1-α)100%信賴區 間為:
第三節 兩成對母體平均數差在 相關樣本下的統計推論 第三節 兩成對母體平均數差在 相關樣本下的統計推論 當 未知,以 取代之: ②當H0:μD =0, 已知,則檢定統計量為: 當 未知,則以 取代之:
第三節 兩成對母體平均數差在 相關樣本下的統計推論 第三節 兩成對母體平均數差在 相關樣本下的統計推論 (2)小樣本(n<30),母體常態、 未知等條件下,成對樣本平均數 差 的抽樣分配為:(參看單元11-42) ①其成對母體平均數差 的(1-α)100%信賴區間為: ②假設檢定的統計量為:
第四節 兩母體比率差在大樣本 下的統計推論 兩母體比率差的估計 的區間估計公式如下:
第四節 兩母體比率差在大樣本 下的統計推論 兩母體比率 和 的假設檢定 1.假設之設立 兩母體比率差檢定的假設形式有三種: 雙尾檢定: 第四節 兩母體比率差在大樣本 下的統計推論 兩母體比率 和 的假設檢定 1.假設之設立 兩母體比率差檢定的假設形式有三種: 雙尾檢定: 左尾檢定: 右尾檢定:
第四節 兩母體比率差在大樣本 下的統計推論 圖11-10 pA和pB構成三種統計假設
第四節 兩母體比率差在大樣本 下的統計推論 2. 的抽樣分配 (1) (2) (註:兩母體互為獨立) (3) 在大樣本下, 趨近於常態分配:
第四節 兩母體比率差在大樣本 下的統計推論 3.檢定統計量 依上一單元 抽樣分配性質得知,當H0為真時,檢定統 計量為: 第四節 兩母體比率差在大樣本 下的統計推論 3.檢定統計量 依上一單元 抽樣分配性質得知,當H0為真時,檢定統 計量為: (1)若p0≠0時,即:
第四節 兩母體比率差在大樣本 下的統計推論 當以 和 分別作為 和 的估計值時,則公式改為: (2)若p0≠0時,即: 共同比率的公式為: 第四節 兩母體比率差在大樣本 下的統計推論 當以 和 分別作為 和 的估計值時,則公式改為: (2)若p0≠0時,即: 共同比率的公式為: 代入 公式得:
第五節 兩母體變異數比 的統計推論 F分配的性質 1.F分配的平均數和變異數 2.F機率分配中的F值為正值 第五節 兩母體變異數比 的統計推論 F分配的性質 1.F分配的平均數和變異數 2.F機率分配中的F值為正值 亦即F≥0,F值的範圍是由0至∞。
第五節 兩母體變異數比 的統計推論 3.F分配的形狀因自由度而異 第五節 兩母體變異數比 的統計推論 3.F分配的形狀因自由度而異 基本上,F分配是屬右偏形態,但隨自由度變大,偏態漸緩,最終 以常態分配為其極限。 4.令F機率分配曲線的總面積為1 如同t分配和 分配一樣,從曲線的橫軸(F)上任兩點所構成的面積, 求其機率值。 圖11-12 F分配曲線
第五節 兩母體變異數比 的統計推論 查表求F機率值 1.機率值 表的上方繪有F分配機率圖,在圖右尾斜線部分的面積,即 表示機率值α。 第五節 兩母體變異數比 的統計推論 查表求F機率值 1.機率值 表的上方繪有F分配機率圖,在圖右尾斜線部分的面積,即 表示機率值α。 2.自由度df1和df2 自由度df1在表的第一橫列上,自由度df2在表的第一縱行上。 3.F值 在表的內部數值,代表滿足P(F>Fα)=α時的F軸上特定值。Fα 位在曲線右尾端斜線部分的左邊端點。
第五節 兩母體變異數比 的統計推論 讓我們練習應用F分配機率表,求 : 第五節 兩母體變異數比 的統計推論 讓我們練習應用F分配機率表,求 : α=0.05,df1=10,df2=12。查F分配機率表,找出上述三數值的交 會處,恰是2.75。所以F10,12,0.05=2.75的意義是:「在F10,12的機 率分配中,大於F軸上點2.75的曲線面積(機率值)為0.05, 換言之,P(F>2.75)=0.05」。
第五節 兩母體變異數比 的統計推論 一般F機率表未列出曲線圖左尾部分的機率,所以必須再應用 下列轉換式計算求得。轉換公式為: 第五節 兩母體變異數比 的統計推論 一般F機率表未列出曲線圖左尾部分的機率,所以必須再應用 下列轉換式計算求得。轉換公式為: 圖11-13 F10,12是指整個曲線圖;F10,12,0.05是指橫軸上一個點
第五節 兩母體變異數比 的統計推論 (查表,α=0.05, df1=12,df2=10三點交會處) 圖11-14 F10,12,0.95
第五節 兩母體變異數比 的統計推論 比的區間估計公式
第五節 兩母體變異數比 的統計推論 兩母體變異數比值 的假設檢定 1.如何建立假設 第五節 兩母體變異數比 的統計推論 兩母體變異數比值 的假設檢定 1.如何建立假設 比較兩母體 和 的大小,須採用其比值 來表示,其假設寫 法為: (1)雙尾檢定: 圖11-12 F分配的雙尾檢定
第五節 兩母體變異數比 的統計推論 (2)左尾檢定: 圖11-17 F分配的左尾檢定
第五節 兩母體變異數比 的統計推論 (3)右尾檢定: 圖11-17 F分配的右尾檢定
第五節 兩母體變異數比 的統計推論 2.檢定統計量 兩樣本變異數比 經轉化成F分配的隨機變數,就成 為兩母體變異數比 的檢定統計量: 第五節 兩母體變異數比 的統計推論 2.檢定統計量 兩樣本變異數比 經轉化成F分配的隨機變數,就成 為兩母體變異數比 的檢定統計量: 當虛無假設H0(兩母體變異數比 等於1)為真的條 件下,上面的F統計量可以改變成:
第五節 兩母體變異數比 的統計推論 透過上述可獲得結論:
第六節 應用SPSS求 兩樣本平均數差的假設檢定 例22 從某校高一學生中,隨機抽取10名男生和10名女生,測其數 學成績如表11-7,試在α=0.05檢定該校男女生的成績是否相等。 表11-7
第六節 應用SPSS求 兩樣本平均數差的假設檢定 解 1.擬定統計假設 2.SPSS操作步驟 STEP1:界定變數屬性 (1)開啟SPSS,進入「變數檢視」工作表,然後界定變數score和 group的屬性。 (2)依表11-7資料,定義變數屬性如下(參看圖11-20):
第六節 應用SPSS求 兩樣本平均數差的假設檢定 ①在第二橫列:「名稱」格,輸入「score」;「標記」 格,輸入「數學成績」;其餘格,採系統「內定值」 (圖11-20)。 ②在第三橫列:「名稱」格,輸入「group」;「類型」 格,選擇「字串」;「標記」格,輸入「組別」;在 「數值」格(圖11-20),先點按一下,打開「數值標 記」對話盒(圖11-21),輸入「1=男」、「2=女」,然 後按「確定」,即完成設定;其他儲存格,不輸入任何 值,即自動採用系統「內定值」(圖11-20)。 ③點選左下角切換標籤(圖11-20),轉換到「資料檢 視」工作表(圖11-22)。
第六節 應用SPSS求 兩樣本平均數差的假設檢定 圖11-20 界定變數屬性
第六節 應用SPSS求 兩樣本平均數差的假設檢定 STEP2:輸入數值資料 (1)在「資料檢視」工作表內(圖11-22),依例22之數值資料, 鍵入各儲存格內,如圖11-22所示。 (2)在變數group欄的儲存格,如輸入「1」會顯示「男」,輸入 「2」會顯示「女」(圖11-22第二欄)。 圖11-21 設定數值標記
第六節 應用SPSS求 兩樣本平均數差的假設檢定 圖11-22 輸入數值資料
第六節 應用SPSS求 兩樣本平均數差的假設檢定 STEP3:選擇分析法:獨立樣本T檢定 (1)如圖11-23所示,在功能表列上,按「分析」→「比較平均數 法」→「獨立樣本T檢定」。 (2)開啟主對話盒:「獨立樣本T檢定」(圖11-24)。
第六節 應用SPSS求 兩樣本平均數差的假設檢定 圖11-23 選擇分析法——獨立樣本T檢定
第六節 應用SPSS求 兩樣本平均數差的假設檢定 STEP4 (1)在「獨立樣本T檢定」主對話盒,把左側清單框內的變數 「數學成績」(圖11-24),移入右側「檢定變數」框內(圖 11-10);把「組別group」變數,移入「分組變數」框內(圖 11-25)。 (2)按「定義組別」鈕(圖11-25),打開「定義組別」次對話 盒(圖11-26),然後輸入「1」到「組別1」框,輸入「2」到 「組別2」框,最後按「繼續」鈕,回到主對話盒(圖11-27)。 (3)當主對話盒的「分組變數」框內,顯示「group (1, 2)」(圖 11-27),即表示已完成組別的設定了。已設定了第1組及第2 組。 (4)按「選項」鈕(圖11-27),開啟次對話盒:「獨立樣本T 檢定:選項」(圖11-28)。
第六節 應用SPSS求 兩樣本平均數差的假設檢定 圖11-24 主對話盒(一):獨立樣本T檢定
第六節 應用SPSS求 兩樣本平均數差的假設檢定 圖11-25 主對話盒(二):獨立樣本T檢定
第六節 應用SPSS求 兩樣本平均數差的假設檢定 圖11-26 次對話盒:定義組別 圖11-27 完成分組變數的設定
第六節 應用SPSS求 兩樣本平均數差的假設檢定 STEP5 (1)在次對話盒「獨立樣本T檢定:選項」內(圖11-28),在「信 賴區間」的長框內,輸入「95」(表示α=0.05)。 (2)按「依分析排除觀察值」圓鈕。 (3)然後,按「繼續」鈕,回到主對話盒(圖11-27)。 圖11-28 次對話盒:選項
第六節 應用SPSS求 兩樣本平均數差的假設檢定 STEP6 (1)在主對話盒「獨立樣本T檢定」內(圖11-27),核對已 完成所有操作之後,按「確定」命令鈕(圖11-27)。 (2)SPSS立即執行計算,匯出報表。 3.解釋報表 (1)依圖11-29,得到該校男生的數學成績平均為78.30,女生 數學成績平均為79.40。 (2)依圖11-30,男生和女生兩組成績的變異數考驗結果, F=2.045,P值=0.170,大於α=0.05,因此,推論男、女兩組 母體的變異數相等。
第六節 應用SPSS求 兩樣本平均數差的假設檢定 (3)進而選用圖11-30「假設變異數相等」的橫列。在該列中 顯示t值=-0.322,自由度18,其P值=0.751(雙尾),大於預 定的α=0.05,所以接受虛無假設「H0:μ男=μ女」。換言之, 男生和女生的數學成績相等的假設,在α=0.05顯著水準下, 得到支持。 圖11-29 組別統計量 圖11-30 獨立樣本檢定
第六節 應用SPSS求 兩樣本平均數差的假設檢定 例23 從某校高二學生中,隨機抽取10名學生,他們第一次月考和 第二次月考的數學成績如表11-8。試在a=0.05之下,檢定該校 學生第一次月考和第二次月考的數學成績是否有差異。 表11-8
第六節 應用SPSS求 兩樣本平均數差的假設檢定 解 1.擬定統計假設 2.SPSS操作步驟 STEP1:界定變數屬性 (1)開啟SPSS,進入「變數檢視」工作表(圖11-31),然後依表 11-8 之資料,定義變數(第一次月考數學成績和第二次月考數 學成績)的屬性。 (2)在第二橫列中:「名稱」格,輸入「score_1」;「標記」格, 輸入「第一次月考數學成績」;其餘格,採「內定值」(圖11- 31)。
第六節 應用SPSS求 兩樣本平均數差的假設檢定 (3)在第三橫列中:「名稱」格,輸入「score_2」;「標記」 格,輸入「第二次月考數學成績」;其餘格採「內定值」。 (4)點選左下角的切換標籤(圖11-31),至「資料檢視」 工作表畫面(圖11-32)。
第六節 應用SPSS求 兩樣本平均數差的假設檢定 表11-31 界定變數的屬性
第六節 應用SPSS求 兩樣本平均數差的假設檢定 STEP2:輸入數值資料 在「資料檢視」工作表內(圖11-32),把例23的資料分別 輸入各儲存格內。 表11-32 輸入數值資料
第六節 應用SPSS求 兩樣本平均數差的假設檢定 STEP3:選擇分析法:成對樣本T檢定 (1)依圖11-33所示,點選「分析」→「比較平均數法」→「成對 樣本T檢定」。 (2)打開主對話盒:「成對樣本T檢定」(圖11-34)。
第六節 應用SPSS求 兩樣本平均數差的假設檢定 表11-33 選擇分析法:成對樣本T檢定
第六節 應用SPSS求 兩樣本平均數差的假設檢定 STEP4:主對話盒 (1)在「成對樣本T檢定」主對話盒(圖11-34)內,把左側 清單框內之「score_1」和「score_2」兩變數,移入「配對 變數」清單框內(圖11-20)。 (2)點選「選項」鈕(圖11-34),開啟次對話盒:「成對 樣本T檢定:選項」(圖11-35)。 表11-34 主對話盒:成對樣本T檢定
第六節 應用SPSS求 兩樣本平均數差的假設檢定 STEP5 (1)於「成對樣本T檢定:選項」次對話盒內(圖11-35), 在「信賴區間」框內,輸入「95」(即α=0.05)。 (2)點選「依分析排除觀察值」鈕。 (3)按「繼續」鈕,回到主對話盒(圖11-34)。 表11-35 次對話盒:選項
第六節 應用SPSS求 兩樣本平均數差的假設檢定 STEP6 (1)在「成對樣本T檢定」主對話盒內(圖11-34),核對已完成所 有操作之後,點選「確定」命令鈕(圖11-34)。 (2)SPSS立即進行計算,匯出報表。 3.解釋報表 (1)由圖11-36,得到數學第一次月考的平均數為78.30;第二次月 考的平均數為79.40。 (2)由圖11-37,得到兩次月考成績的相關係數r=-0.473,其P值 =0.167,大於α=0.05,未達顯著水準,表示高三學生,兩次月考 成績沒有相關。 (3)由圖11-38,得到成對樣本檢定結果,t值=-0.270,其P值=0.794, 大於α=0.05,未達顯著水準,表示高三學生兩次月考數學成績沒 有差異。
第六節 應用SPSS求 兩樣本平均數差的假設檢定 圖11-36 成對樣本統計量 圖11-37 成對樣本相關
第六節 應用SPSS求 兩樣本平均數差的假設檢定 圖11-38 成對樣本檢定