卡方檢定 11.1 基本概念 11.2 多項式母體比例的檢定 11.3 齊一性檢定與獨立性檢定 11.4 適合度檢定

Slides:



Advertisements
Similar presentations
工職數學 第四冊 第一章 導 數 1 - 1 函數的極限與連續 1 - 2 導數及其基本性質 1 - 3 微分公式 1 - 4 高階導函數.
Advertisements

©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
不定積分 不定積分的概念 不定積分的定義 16 不定積分的概念 16.1 不定積分的概念 以下是一些常用的積分公式。
變數與函數 大綱 : 對應關係 函數 函數值 顧震宇 台灣數位學習科技股份有限公司. 對應關係 蛋餅飯糰土司漢堡咖啡奶茶 25 元 30 元 25 元 35 元 25 元 20 元 顧震宇 老師 台灣數位學習科技股份有限公司 變數與函數 下表是早餐店價格表的一部分: 蛋餅 飯糰 土司 漢堡 咖啡 奶茶.
第十章 分 配 理 論 INDEX 第一節 所得分配的基本概念 第二節 生產要素的需求 第三節 分配的邊際生產力理論
單元九:單因子變異數分析.
實驗規劃--實驗因子設定, 效標選定與受測者選定
第10章 類別資料分析.
樞紐分析與資料庫 蕭世斌 Nov 20, 2010.
卡方分配Chi-square.
期望值 變異數 共變異數與相關係數 變異數與共變異數之性質 柴比雪夫不等氏 動差與動差生成函數
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
行銷研究 單元二 行銷研究的程序.
假設檢定之基本概念 單一母體平均數之假設檢定 假設檢定與信賴區間之相關性 兩母體平均數之假設檢定  
17 類別資料的分析  學習目的.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
陳維魁 博士 儒林圖書公司 第九章 資料抽象化 陳維魁 博士 儒林圖書公司.
兩個或多個類別資料檢定 Tests for Two or More Samples with Categorical Data
5.1 自然對數函數:微分 5.2 自然對數函數:積分 5.3 反函數 5.4 指數函數:微分與積分 5.5 一般底數的指數函數和應用 5.6 反三角函數:微分 5.7 反三角函數:積分 5.8 雙曲函數.
迴歸分析 主講人:童超塵 實驗室網址 永久: 實驗室網址 永久: 目前:
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
實驗計畫資料分析作業解答 何正斌 國立屏東科技大學工業管理系.
第3章 資料的整理與表現- 統計表與統計圖.
第六章 平均數比較 6-1 平均數比較(各種 T Test 的應用) 6-2 Means 平均數分析 6-3 單一樣本 T 檢定
本章大綱 9.1 Sequence數列 9.2 Infinite Series無窮級數
計數值抽樣檢驗計劃 (MIL-STD-105E)
Chapter 17 投資決策經濟分析.
Keller: Stats for Mgmt & Econ, 7th Ed 卡方檢定
The Runs Test : A Test for Randomness
11.1單一母體變異數的推論 前幾章中,我們以樣本變異數
Chap3 Linked List 鏈結串列.
指導老師: 蘇明俊 老師 組長:潘翠娥 組員:張惠雅 葉麗華
第一章 直角坐標系 1-1 數系的發展.
第二章 機率概論 2.1 相對次數與機率 樣本空間、事件與隨機變數 抽樣與樣本空間 22
第二次電腦實習課 說明者:吳東陽 2003/10/07.
第十四章 單因子變異數分析 14.1 前言 14.2 單因子變異數分析理論 14.3 功能視窗 14.4 範例
統計學 指導老師: 郭燿禎 Date: 2/14/12.
第十章 順序資料之假設檢定 10.1 順序資料檢定概論 10.2 符號檢定 10.3 符號秩檢定(成對樣本檢定)
信心水準與信賴區間的解讀.
第 19 章 XML記憶體執行模式.
第十章補充 允收抽樣.
15.5 最大值和最小值 的問題 附加例題 9 附加例題 10 © 文達出版 (香港 )有限公司.
本章學習目標 學習極座標繪圖與對數繪圖 學習雙y軸繪圖 學習向量場繪圖 學習統計繪圖 在Matlab的環境裡製作動畫
第 7 章 推論方法.
估計與假設檢定.
國立台灣體育學院 體育學系暨體育研究所 高明峰
Definition of Trace Function
學習內容 概說 損失函數 雜音:造成品質變異的原因 訊號雜音比 直交表 回應表與回應圖 田口方法.
7-2 抽樣分配(sampling distribution)
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
Ogive plot example 說明者:吳東陽 2003/10/10.
小学5.
1-1 隨機的意義– P.1.
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
二項分配-Binomial 伯努利試驗(Bernoulli Trial) 每一次試驗皆僅有兩種可能結果,不是成功(S),就是失敗(F)。
第十四章名義資料的數字 描述:關連測量 © Copyright 版權所有:學富文化事業有限公司。本光碟內容僅提供教師於教學上使用,非經本公司許可,禁止複製 (給學生)。感謝老師的配合。
第一章 貨幣的時間價值.
例題 1. 多項式的排列 1-2 多項式及其加減法 將多項式 按下列方式排列: (1) 降冪排列:______________________ (2) 升冪排列:______________________ 排列 降冪:次數由高至低 升冪;次數由低至高.
1-1 二元一次式運算.
參考書籍:林惠玲與陳正倉(2002),《應用統計學第二版》。台北:雙葉書廊有限公司。
第一章 直角坐標系 1-3 函數及其圖形.
4-1 變數與函數 第4章 一次函數及其圖形.
第四組 停車場搜尋系統 第四組 溫允中 陳欣暉 蕭積遠 李雅俐.
第十四章:工作抽查 工作抽查:係在隨機時間進行大量觀測以分析工作的方法;其結果可用來有效訂定各操作的適當寬放、衡量機器和人員的操作情形及建立生產的標準時間;其數據的準確性,視觀測次數及隨機觀測所涵蓋的期間而定。 工作抽查的優點:p524。 工作抽查的理論:係依據機率的基本法則;公式如p 及例題14-1。。
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
第三章 比與比例式 3-1 比例式 3-2 連比例 3-3 正比與反比.
Presentation transcript:

卡方檢定 11.1 基本概念 11.2 多項式母體比例的檢定 11.3 齊一性檢定與獨立性檢定 11.4 適合度檢定 11.1 基本概念 11.2 多項式母體比例的檢定 11.3 齊一性檢定與獨立性檢定 11.4 適合度檢定 11.5 常態母體的檢驗 11.6 電腦軟體操作說明 統計學導論 Chapter 11 卡方檢定

11.1 基本概念 例題 11.1 將一樣本觀察值區分成若干類別 11.1 基本概念 例題 11.1 將一樣本觀察值區分成若干類別 在一項市場調查分析中,研究某一產品之市場佔有率的情形。根據過去資料顯示,A、B、C三家公司之市場佔有率比值為1:2:1。今調查100位購買該產品的顧客,結果發現購自三家公司的人數如表11.1所示,請問這些資料是否顯示三家公司之市場佔有率已有改變? 表 11.1 購買三家公司之產品的顧客人數 統計學導論 Chapter 11 卡方檢定

H0:兩種品牌奶粉對嬰兒健康的效果並無差異 例題 11.2 1/4 獨立樣本之分類   欲比較兩種品牌之奶粉A、B對嬰兒健康的影響效果,茲調查150個嬰兒,並自其中隨機抽出80位餵食A牌奶粉,另70位則以B牌奶粉餵食。經過一段時間,檢查每一位嬰兒的健康情況;假設將嬰兒的健康情況分為三類:優良、正常與不良,各類之嬰兒人數列於表11.2。於是,我們所欲檢定的虛無假設為: H0:兩種品牌奶粉對嬰兒健康的效果並無差異 統計學導論 Chapter 11 卡方檢定

例題 11.2 2/4 表11.2中兩列數據來自獨立樣本,惟由於總數(150)為固定,且餵食A或B奶粉事前即已確定,因此不適合做各列相對次數的比較,故將之轉換為表11.2(a)。此外,若將母體之有關比例或機率列示於表11.2(b),則結合11.2(a)與11.2(b),將可更清楚地描述虛無假設。 表 11.2 以A、B品牌奶粉餵食嬰兒的健康情形 統計學導論 Chapter 11 卡方檢定

例題 11.2 3/4 表 11.2 (a) 表11.2之相對次數 表 11.2 (b)母體比例或機率 統計學導論 Chapter 11 卡方檢定

例題 11.2 4/4 上述虛無假設「奶粉A、B對健康效果無差異」,乃意指每一種健康情形之類別下,食用奶粉A與B之機率均相同,亦即: 注意:本例中每一行之機率值的和並不具任何意義。 統計學導論 Chapter 11 卡方檢定

例題 11.3 1/2 根據兩種特徵分類 一組500人之隨機樣本,每一人均被詢及是否支持租稅改革方案,根據實際調查結果,將觀察次數列於表11.3。本例所欲檢定的問題是:這些資料是否足以說明,兩地區居民對改革方案之意見相同? 表 11.3 兩地區居民對租稅改革方案之意見 統計學導論 Chapter 11 卡方檢定

例題 11.3 2/2 與例題11.2不同的是,本例只有一個單一隨機樣本,但樣本內被抽出的個體則可分為二類:A地區與B地區居民。就此而言,本例中虛無假設「無差異」乃指此兩個不同地區居民表示之意見為「獨立的」。換句話說,每一居民對改革方案的態度與該居民住哪一地區並不相關(亦即獨立)。 統計學導論 Chapter 11 卡方檢定

11.2 多項式母體比例的檢定 1/2 表 11.4 多項式母體比例檢定的資料結構 統計學導論 Chapter 11 卡方檢定

多項式母體比例的檢定 2/2 多項式母體比例卡方檢定(大樣本) 虛無假設:H0:p1=p10, p2=p20, …, pk+pk0 拒絕域:   ,其中 為df=k1之χ2分配中尾面積(機率)為α的χ2值。 統計學導論 Chapter 11 卡方檢定

例題 11.4 以表11.1之資料來討論多項式母體比例檢定的問題。假定虛無假設如同例題11.1所示: 試在α=0.05下做此檢定。 統計學導論 Chapter 11 卡方檢定

解: 表11.5 χ2統計量之計算 統計學導論 Chapter 11 卡方檢定

11.3 齊一性檢定與獨立性檢定 齊一性檢定 例題 11.5 1/9 在例題11.2中,已建立「齊一性」(homogeneity)或「兩種品牌奶粉之效果無差異」的虛無假設,即: 為討論方便,再將表11.2重繪如表11.6。如同前述,表中各列的總計分別為80與70,乃是事先設定的樣本大小。若以p1、p2、p3代表在H0下兩個不同母體(兩種品牌奶粉)之共同機率(common probability) 統計學導論 Chapter 11 卡方檢定

例題 11.5 2/9 ,則每一列各方格(cell)之期望次數應等於這些機率值分別乘以每一列的樣本大小,亦即第一列各方格之期望次數分別為80p1、80p2、80p3,而第二列則為70p1、70p2、70p3。然而,H0並未設定p1、p2、p3之值,因此需先估計這些參數。 表 11.6 例題11.2中的 2×3列聯表 統計學導論 Chapter 11 卡方檢定

例題 11.5 3/9 由表11.6知,各行總和分別為54、57、39,而總樣本大小為150。因此,在H0下各個機率之估計值為: 根據這些估計的機率值,第一列各方格的期望次數分別為: 統計學導論 Chapter 11 卡方檢定

例題 11.5 4/9 相同地,第二列各方格之期望次數亦可依相同方式求得。由此,我們可歸納出計算各方格之期望次數的法則如下: 茲將依(11-3)式所計算出來的各方格期望次數列示於表11.7,表11.7中各方格之數據包括觀察次數fi(未括弧者)與期望次ei(括弧者)。然後計算各方格之「觀察次數」與「期望次數」的差異: (11-3) 統計學導論 Chapter 11 卡方檢定

例題 11.5 5/9 並將結果列示於表11.8。最後,將表11.8每一方格之數據加總,可得χ2統計量之值: 表 11.7 觀察次數fi與期望次數ei 統計學導論 Chapter 11 卡方檢定

例題 11.5 6/9 接著,計算χ2分配的自由度。有關列聯表之自由度的計算,其公式如下: (11-4) 表 11.8 (fi-ei)2/ei之值 (11-4) 統計學導論 Chapter 11 卡方檢定

例題 11.5 7/9 (11-4)式的觀念可參考表11.9。由於r×c列聯表共有rc個方格(觀察資料),故有自由度rc,然每一列及每一行的總數在抽樣完後,其為固定值,因此每一列及每一行皆將失去一個自由度(如表11.9中劃×者),故共失去(r+c)個自由度;但是其中有一自由度乃重複計算者(如表11.9中劃××者),故最後再加上一個自由度,亦即: 列聯表之自由度=總方格數(rc)列數(r) 行數(c)+1 統計學導論 Chapter 11 卡方檢定

例題 11.5 8/9 表 11.9 列聯表之自由度的計算 統計學導論 Chapter 11 卡方檢定

例題 11.5 9/9 本例中,由於包含r=2列、c=3行,故自由度為df=(2-1)(3-1)=2。在df=2, α=5%下,查表得知   (2)=5.99,此值小於觀察所得之χ2統計量值8.224,故虛無假設在α=0.05水準下將被拒絕。換句話說,表11.6所列資料顯示以兩種品牌奶粉餵食嬰兒對其健康效果有顯著的差異。 上面既已檢定得知具有顯著差異,接著可從表11.7與11.8找出顯著差異的原因。由表11.7與11.8可發現,如此大的χ2值可歸因於「優良」那一類,因為該類別中,奶粉A的相對次數為37/80或46%,而奶粉B的相對次數則為17/70或24%。僅就此而言,即足以顯示奶粉A對健康效果較有幫助。 統計學導論 Chapter 11 卡方檢定

列聯表之齊一性χ2檢定 虛無假設:H0:某一理論分配所得出之現象(各類別出現之機率) 檢定統計量: fi:觀察次數 ei:期望次數= (11-3)式 自由度df=(列數-1)‧(行數-1) 拒絕域: 統計學導論 Chapter 11 卡方檢定

例題 11.6 一項對各行業職員酒精中毒的研究,調查對象包括牧師、教育界人士、行政部門與商人,實際觀察之資料列示於表11.10。試檢定此4種行業職員酒精中毒之比率是否相同? 表 11.10 酒精中毒與行業別之列聯表 統計學導論 Chapter 11 卡方檢定

解: 表11.11 表11.10之(fi-ei)2/ei的值 統計學導論 Chapter 11 卡方檢定

例題 11.7 欲探討某一化學處理對於種子發芽比例的可能效果。茲栽種100顆經過化學處理的種子,以及150顆未經過處理的種子。觀察種子發芽情形如表11.12所示;根據此組資料,是否足以證明經過處理與未經處理的種子,其發芽比例不同? 表 11.12 例題11.7之觀察次數fi與期望次數ei 統計學導論 Chapter 11 卡方檢定

獨立性檢定 例題 11.8 1/9 參考例題11.3,茲再將表11.3繪製如表11.14,此時500人的單一隨機樣本分類為6個方格(cell)。 表 11.14 兩地區居民對租稅改革方案之意見的列聯表 統計學導論 Chapter 11 卡方檢定

例題 11.8 2/9 將每一方格的次數除以樣本大小500,即為其相對次數,如表11.14(a)所示。此時列邊際總計為0.570與0.430,分別代表A地區與B地區之居民的樣本比例。同理,行邊際總計亦分別代表三種態度類別的樣本比例。 表 11.14 (a)每一方格觀察值的比例 統計學導論 Chapter 11 卡方檢定

例題 11.8 3/9 假定整個母體皆已分類,則未知的母體比例(即方格機率)可用表11.14(b)中的元素代表,其中下標A與B代表A地區與B地區,而1、2與3則代表「贊同」、「無意見」與「反對」的類別。 表 11.14 (b) 方格之機率結構 統計學導論 Chapter 11 卡方檢定

例題 11.8 4/9 表11.14(b)與表11.14(a)來自類似母體,其所代表的意義如下: 方格機率pA1=p(A地區且贊同)     行邊際機率p1=p(贊同) 我們所要探討的是,檢定二種分類互為獨立的虛無假設。根據事件獨立的機率性質,可知若態度類別與地區類別互為獨立(亦即人們對租稅改革方案的意見與其來自A或B地區無關),則pA1=pA×p1, pA2=pA×p2…餘此類推。於是,有關獨立性檢定,其虛無假設可界定為: H0:每一方格機率=相對應的列與行邊際機率的乘積 統計學導論 Chapter 11 卡方檢定

例題 11.8 5/9 進行χ2檢定時,我們仍然先求出在H0下,每一方格的期望次數: 這些期望次數均含有未知的邊際機率,故應先由觀察資料求出邊際機率的估計值(參考表11.14): 統計學導論 Chapter 11 卡方檢定

例題 11.8 6/9 於是可求出各方格的期望次數,例如第一個方格的期望次數為: 由此可知,各方格的期望次數之計算公式如下: 統計學導論 Chapter 11 卡方檢定

例題 11.8 7/9 此與齊一性檢定相同。表11.14(c)列示各方格的觀察次數fi與期望次數ei,後者列於括弧內。另外,「觀察次數」與「期望次數」之差異的衡量仍同於一般χ2檢定的觀念,即    。表11.14(d)列出各方格的差異值,並算出所有差異值的總和。 表 11.14 (C) 觀察次數與期望次數 統計學導論 Chapter 11 卡方檢定

例題 11.8 8/9 此時χ2分配的自由度亦與前述齊一性檢定的問題相同,亦即df=(r1)(c1)=(21)(31)=2。在顯著水準α=0.05下,查表得知 。由於觀察的χ2統計量值為22.153遠大於 ,故在α=0.05水準下,拒絕獨立性的虛無假設。換句話說,民眾所表示的意見與其來自的地區有關。 表 11.14 (d) 之值 統計學導論 Chapter 11 卡方檢定

例題 11.8 9/9 若詳細觀察表11.14(d),可發現χ2值大部分歸諸於邊角的方格(亦即這些方格的差異值(fi-ei)2/ei較大)。此外,比較表11.14(c)之觀察次數與期望次數,亦可發現支持此項改革方案的A地區居民遠多於B地區居民。 統計學導論 Chapter 11 卡方檢定

例題 11.9 某公司想瞭解員工對現行的獎勵制度是否滿意,於是調查210名員工,所得資料依性別與滿意度繪示如表11.16所示。請在α=0.05水準下,檢定性別與滿意度無關。 表 11.16 2×2列聯表 統計學導論 Chapter 11 卡方檢定

11.4 適合度檢定 例題 11.10 調查100戶家庭,發現其所擁有的小孩人數之資料分布如表11.17所示。試檢定此組資料是否屬於p=0.4的二項分配(α=0.2)? 表 11.17 100戶家庭所擁有的小孩人數 統計學導論 Chapter 11 卡方檢定

解: 表11.17(a) 期望次數之計算 表11.17(b) χ2統計量的計算 統計學導論 Chapter 11 卡方檢定

例題 11.11 設某公司過去50週來,每週所銷售的高科技設備套數如下表所示: 試以α=0.1,檢定上述資料是否來自poisson分配的母體。 統計學導論 Chapter 11 卡方檢定

解: 表11.18 期望次數、觀察次數及   值 統計學導論 Chapter 11 卡方檢定

11.5 常態母體的檢驗 常態機率紙檢驗 圖11.1 常態機率圖的轉換觀念 統計學導論 Chapter 11 卡方檢定

圖11.2 常態機率紙:證明當X的分配為N(μ, σ2)時,P(X≤x)的圖形 常態機率紙檢驗 2/2 圖11.2 常態機率紙:證明當X的分配為N(μ, σ2)時,P(X≤x)的圖形 統計學導論 Chapter 11 卡方檢定

建構常態機率圖的步驟 (1)將n個觀測值依大小次序排列。 (2)選擇一個適當的橫軸尺度,以便安置所有的觀測值。 (3)在縱座標上描繪出對應於橫座標上第i個觀測值的修正累積相對次數,即 (4)檢驗所描繪圖形與一直線偏離的情況;若呈系統性的偏離,則表示缺乏常態性。 統計學導論 Chapter 11 卡方檢定

繪圖於常態機率紙 圖11.3 繪圖於常態機率紙 統計學導論 Chapter 11 卡方檢定

例題 11.12 隨機抽查某工廠生產的50個零件,測量其長度(cm)如下: 請問,能否認為該工廠生產的零件長度服從常態分配? 統計學導論 Chapter 11 卡方檢定

解: 統計學導論 Chapter 11 卡方檢定

解: 圖 11.4 例題 11.12 的常態機率圖 統計學導論 Chapter 11 卡方檢定

適合度檢定之檢驗 例題 11.13 設抽自一母體的隨機樣本(n=106),其觀察值的次數分配如下表所示。試在α=0.01的水準下,檢定此母體是否為常態分配: 統計學導論 Chapter 11 卡方檢定

解: 圖 11.5 標準常態各區域的面積(機率) 統計學導論 Chapter 11 卡方檢定

解: 表 11.19 期望次數、觀察次數與(fi-ei)2/ei之值 統計學導論 Chapter 11 卡方檢定

例題 11.14 某公司招募職員,設有50 位應徵者,其性向測驗成 績如下表所示,試以α= 0.10檢定此組資料是否為 常態分配。 統計學導論 Chapter 11 卡方檢定

解: 圖11.6 N(68.64, 10.41)分為10個等機率的區間 統計學導論 Chapter 11 卡方檢定

解: 表11.20 期望次數、觀察次數及(fiei)2/ei之值 統計學導論 Chapter 11 卡方檢定

例題 11.15 以適合度檢定法,重做例題11.12 (α=0.05)。 統計學導論 Chapter 11 卡方檢定

解: 統計學導論 Chapter 11 卡方檢定