第 11 章 雙組樣本的假設檢定.

Slides:



Advertisements
Similar presentations
实用农业科技写作 王鹏文. 第一章 导论 第一节 农业科技写作概述 一 、 农业科技写作概念和分类: 科技文献类、科技应用类、 科技普及类、科技新闻类 二、 农业科技写作的意义和重要性: 科技工作的重要组成部分、科学研究的手段、 科技成果的反映和标志、科技交流的工具 三、 农业科技写作的特点 : 功利性与及时性、科学性与先进性、读者的专门性与狭隘性、
Advertisements

新课程引领 实践中前行 —— 蓟县初中信息技术三年课改总结. 自从 2005 年秋季我市进入基础教育新一 轮课程改革实验以来,在市教研室的正 确领导下,我县初中信息技术课改工作 稳步推进。三年来,取得了一些成果, 也有不少体会。现将三年来的信息技术 课改工作总结如下。
河南省基础教育资源网 邓伟鹏 二〇一二年七月 内容大纲 1. 培训平台的目的 2. 培训平台介绍 3. 培训平台功能 4. 培训工作建立流程 5. 培训门户 6. 在线学习 6.1 课程学习 6.2 在线考试 7. 培训考试管理 7.1. 课程管理 7.2 必修学习班建立 7.3 在线考试管理 7.4.
桐乡市地方税务局 2013 年度社会保险费汇算清缴有 关政策及事项说明. 一、政策规定 根据《中华人民共和国社会保险法》、《桐乡市社会保险费征缴管 理办法》(市政府令第 42 号)、《 关于完善社会保险费征缴管理有关问 题的通知》(桐政办发 [2012]152 号)及《关于完善社会保险费征缴管理.
公假系統使用規則. 1. 由校內同仁登入正修訊息網(公假系統權限僅開放全校教職員) 點選學務資訊 → 學務管理系統.
国务院机关事务管理局 资产管理司 二〇一五年一月. 目录 2 总体要求 总体要求 1 1 报表体系和编报流程 报表体系和编报流程 2 2 报表编报说明 报表编报说明 3 3.
什麼是「香草植物」? ◎ 香草植物(HERB)的語源來自拉丁語“綠色 的草”之意。 ◎意義:包含香草、香料及藥草三種。
中国旅游研究院武汉分院成果展示 ——2011年武汉市旅游市场调研成果简报 华中师范大学 中国旅游研究院武汉分院 二〇一一年十二月.
NO.005 職涯 報 實習 徵才 攻讀 國立嘉義大學 學生事務處學生職涯發展中心.
國中教育會考 十二年國教—免試入學 及 意見整理.
第九章 均數檢定.
總 題 屬天的異象 (THE HEAVENLY VISION )
严格标准 规范程序 认真做好党员发展工作.
會計資訊系統 專章A.
第三章 調整與編表.
薪資申報系統操作說明.
商学院 旅游管理专业介绍.
 历史以人类的活动为特定的对象,它思接万载,视通万里,千恣百态,令人销魂,因此它比其他学科更能激发人们的想像力。    
《数学》(华师大.八年级 下册) 第二十一章数据的整理与初步处理 扇形统计图的制作.
怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 (学院、部门适用)
5.1 Excel 概述 Excel的特点 1、表格制作 2、完成复杂运算 3、建立图表 4、数据库管理 5、决策支持.
人工智能Vs人类智能 电脑的优点 人脑的优点 两者的关系 电脑与人脑的本质差别 电脑能否超越人脑 临五四大班 张昕.
99年成語200題庫(21-40).
Excel高级班 学员 焦攀飞 汪晴讲师 Office套餐 学习心得 自主学习最关键 焦攀飞 赖球 49 D 2056
『臺北市營建剩餘資源管理系統』 教育訓練說明 臺北市政府 報告人 王宏正
“三项制度+一个平台”构建 省级高校教学质量监控体系
瓯海职专财经专业组简介.
国有资产清查 数据填报操作规范 2016年3月25日.
劳动统计专业年报培训 社会科 洪惠娟 2009年11月.
全省水产技术推广补助项目 信息员培训 河南省农业厅水产局 2013年11月17日.
增值税发票系统升级版 ——税控发票开票软件(税控盘版).
东南大学 数字迎新的探索 东南大学 网络与信息中心 张月琳.
2015年企业薪酬调查 主要指标解释及填报要求 呼和浩特市人力资源和社会保障局 2015年5月.
簡報大綱 壹、前言 貳、計畫申請 參、申請應備資料及送件地址 肆、注意事項 伍、計畫審查 陸、計畫簽約 柒、計畫管理 捌、其他相關注意事項.
如何撰写教育科研论文 谌 业 锋 四川省凉山州教育科学研究所 欢迎访问 业锋教育在线
第 19 章 規劃求解求算最大利潤 著作權所有 © 旗標出版股份有限公司.
高职《财务报表分析》课程 课堂教学案例交流
上海文会会计师事务所有限公司 中国注册会计师 童幸义
小儿营养不良 第四篇第二章第二节小儿营养不良.
2016年莱芜市乡村医生在岗培训 启动会.
单元 SD 5 菜鸟学飞 附件二 想学飞的职场菜鸟.
关于成绩的数理统计的探讨 望您多多指教!多谢!!.
仓储企业岗位人员招聘 第一组 组员 :陈娇娇 祝婷婷 丁元莉 袁珮 王慧.
玉溪工业财贸学校副校长 示范校建设办公室主任 柏家渭 2014年5月13日
人口与计划生育 统计分析 昌吉市计划生育委员会 二○○六年三月.
第4节 眼睛的缺陷和目视光学仪器的视度调节.
第十章 房地产开发项目的经济评价 §1 房地产开发项目及其前期工作 §2 房地产开发项目经济评价 本章内容.
2014年深圳市学生人身意外伤害保险投保工作介绍 中国人民财产保险股份有限公司深圳市分公司
第 14 章 複迴歸與相關分析.
校外人员酬金申报流程  .
付款作業錯誤態樣【出納組】 錯誤1~核銷文件備具不齊 錯誤2 ~戶名與系統不同 錯誤3 ~未輸發票號碼日期 錯誤4 ~受款人帳號輸錯
办学条件核查 评估秘书组 电力职业技术学院 山西机电职业技术学院 2014年7月9日.
美国经济的发展 第8课.
科 展 說 明.
书包是我们的“家”,小主人用完我们,我们得赶快回家 !
怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 (项目经费适用)
個人申請系統 通過第一階段倍率篩選評估系統.
成本会计学.
聚合型第一種:隱沒帶、島弧 例子:臺灣東方的琉球海溝、南美洲智利海溝. 聚合型第一種:隱沒帶、島弧 例子:臺灣東方的琉球海溝、南美洲智利海溝.
舊生升級編班與新生管理操作說明 全誼資訊股份有限公司 中華民國106年06月05日.
全国食药监检验检测机构 信息直报系统 test.
Excel图表之道 如何制作专业有效的商务图表.
世界无烟日主题班队会.
Excel 2010电子 表格制作案例教程.
第8章 財務循環 第1節 財務循環之管理 第2節 相關文件及檔案 第3節 財務循環之流程 第4節 資訊科技新環境.
第4章 Excel电子表格 Excel操作必须掌握的知识点: 掌握建立、打开、保存和编辑文档的基本操作 ;
新课程理念下如何进行课堂教学 刘志超 2014年2月25日.
第四章 買賣業會計.
创新机制 团结协作 稳步推进 病虫害专业化统防统治
6 分析資料-以統計測量數呈現.
Presentation transcript:

第 11 章 雙組樣本的假設檢定

目標 針對兩組獨立母體平均數之間差距,進行假設檢定。 針對兩組母體比例間差距,進行假設檢定。 針對成對或是相依觀測資料平均數間的差距,進行假設檢定。 解相依與獨立樣本之間的差異。

比較兩組母體 本章將進行兩組樣本的假設檢定,亦即選擇兩組隨機樣本來判斷母體平均數是否相等。 假設兩組樣本平均數抽樣分配皆為常態分配,則兩樣本平均數之間差距的分配也是常態分配。 若兩組樣本均包含超過 30 個觀測資料,則使用 z 分配。

比較兩組母體平均數 不需要假設母體的型態。 從獨立母體抽選樣本。

比較兩組母體平均數 兩組樣本間必須沒有任何關聯,亦即兩組樣本互相獨立。 兩組母體的標準差已知,則兩組樣本平均數的差異的檢定統計量為

比較兩組母體平均數 若兩組母體的標準差未知,則用樣本標準差取代母體標準差,因此計算 z 值的公式為:

範例 經理想要知道傳統收費閘口的平均耗費時間,是否比自行掃描收費閘口的平均耗費時間更長,所以經理蒐集了以下的樣本資料。時間計算是從顧客排隊到將物品放入推車為止,因此時間包括排隊與結帳的時間。請問 p- 值是多少?

範例 continued 步驟 1:建立虛無假設與對立假設 。 虛無假設是這兩組樣本的平均結帳時間沒有差異,亦即傳統收費方式與自行掃描收費方式其平均結帳時間的差距 0.2 分鐘是抽樣誤差所導致;對立假設則是傳統收費方式的平均結帳時間較長。以 μs 代表傳統收費方式之母體的平均結帳時間,而以 μu 為自行掃描收費方式之母體的平均結帳時間。虛無假設與對立假設是:

範例 continued 步驟 2:選擇顯著水準。 我們選擇 0.01 的顯著水準。 步驟 3:判斷檢定統計量。 因為兩組母體標準差已知,使用z分配為檢定統計量。

範例 continued 步驟 4:制定決策法則。 由於對立假設為傳統收費方式的平均結帳時間比自行掃描收費方式的平均結帳時間長,因此拒絕域在標準常態分配的右尾上。為了要計算臨界值,將 0.01 視為右尾的面積,因此在z值與臨界值間的面積是 0.49(由0.5-0.01 = 0.49 得到)。接著,查閱附錄 B.1找出機率值最接近 0.49 的值。得知 z 值是 2.33,因此決策法則是:如果計算出來的檢定統計量大於 2.33,則拒絕 H0。詳見圖 11-1:

範例 continued 在顯著水準 0.01 下,單尾檢定的決策法則

範例 continued 步驟 5:對於 H0 做決策,同時解釋結果。使用公式 [11-2] 計算檢定統計量的值。

範例 continued 所計算出來的值是 3.13,比 2.33 還要大,因此決策是拒絕虛無假設並接受對立假設。而傳統收費方式的平均結帳時間與自行掃描收費方式的平均結帳時間之間的差異 0.2 分鐘,並不是因抽樣誤差所致。所以我們可下結論說,自行掃描的收費方式確實比較快。

範例 continued 這個檢定統計量的 p- 值是多少?p- 值是在虛無假設為真下,檢定統計量大於由樣本所得到的實際檢定值的機率,因此想要求出 p- 值,必須找出 z 值大於 3.13 的機率。在附錄 B.1中,無法找出剛好為 3.13 相對應的機率值,最接近的值是 3.09,而其相對應機率是0.499。所以可以說 p- 值小於 0.5-0.499 = 0.001,亦即虛無假設為真的機率值非常低。

兩組母體比例的假設檢定 在前一節中,進行兩組母體平均數的假設檢定。不過有時候也想了解,從兩組母體抽選出來的兩組樣本比例是否相等。

兩組母體比例的假設檢定 聯合比例:混合兩組樣本的比例估計值,稱為母體比例的估計值,其計算公式如下: 其中 X1: 第一組樣本中試行時,成功的次數。 X2 :第二組樣本中試行時,成功的次數。

兩組母體比例的假設檢定 兩組樣本比例的檢定統計量:

範例 Manelli 香水公司最近開發一種新款香水,計畫將它命名為 Heavenly,並上市銷售。經過多次的市場調查指出,Heavenly 具有非常好市場潛力。Manelli 香水公司的銷售部門特別有興趣了解,喜歡這個新香水產品的年輕女性比例與年長女性比例是否不同。這是兩個獨立母體:一個是年輕女性所組成母體,另外一個是由年長女性所組成的母體。每一位受訪女性都聞過 Heavenly 香水,同時指出是否喜歡這個味道並願意購買。

範例 continued 步驟 1:建立 H0 與 H1。在這個例子中,虛無假設是:「喜歡 Heavenly 香水的年輕女性與年長女性,其比例沒有差異。」,將 1 標示為會購買 Heavenly 香水的年輕女性比例,而 2 為會購買 Heavenly 香水的年長女性比例。對立假設是兩個比例不相等。

範例 continued 步驟 2:選擇顯著水準。在這個範例中,使用0.05 顯著水準。 步驟 3:判斷檢定統計量。如果兩組樣本個數夠大,則檢定統計量服從標準常態分配。可以使用公式 [11-3] 計算檢定統計量的值。

範例 continued 步驟 4:制定決策法則。在第 1 個步驟的對立假設中,並沒有指出一個方向,因此是雙尾檢定。為了要計算臨界值,將信賴水準切分為相等的兩部分,並放在z分配的兩尾內。接下來,計算臨界值,也就是 0.5- 0.025(信賴水準的一半)= 0.475。最後,從附錄B.1 中找出最接近 0.475 之機率值。這個機率值相對應的 z 值是1.96,所以兩邊的臨界值分別是 -1.96 與 +1.96。因此,如果計算的檢定統計量落在 +1.96與-1.96 間,則不能拒絕虛無假設,亦即兩樣本比例間的差異是由於抽樣誤差所導致的。將決策法則整理在圖11-2 中。

範例 continued 圖11-2 Heavenly 香水的決策法則

範例 continued 步驟 5:挑選樣本並做決策。在 100 位年輕女性的樣本中,有 19 位喜歡且願意購買 Heavenly 香水。此外,在 200 位年長女性的樣本中,有 62 位喜歡且願意購買 Heavenly 香水。以 p1 表示年輕女性喜歡Heavenly 香水的樣本比例,p2 表示年紀大女性喜歡Heavenly 香水的樣本比例,則:

範例 continued 計算聯合比例 計算檢定統計量的值

範例 continued 計算出來的檢定統計量是-2.21,落在拒絕域中,也就是它在-1.96 的左邊。因此在 0.05 顯著水準下,拒絕虛無假設。換句話說,拒絕年輕女性喜歡 Heavenly 香水的比例等於年長女性喜歡 Heavenly 香水比例的虛無假設,即兩個樣本比例間的差異不太可能是因為抽樣誤差所導致的。為了要計算 p- 值,必須查閱附錄 B.1 以尋找 z 值小於-2.21 或是大於 2.21 的機率。z 值 2.21 相對應的機率值是 0.4864,因此檢定統計量的值小於-2.21 或是大於 2.21 的機率是 p- 值 = 2(0.5-0.4864) = 2(0.0136) = 0.0272。 p- 值 0.0272 小於顯著水準 0.05,因此拒絕虛無假設。結論是年輕女性與年長女性間喜歡且願意購買Heavenly 香水的比例不同。

小樣本條件下的母體平均數檢定 當樣本個數小於 30,則使用 t 分配。 需要符合的假設為: 抽樣的兩組母體皆須服從常態分配。 從兩組獨立母體中,分別抽選樣本。 兩組母體的標準差相等。

小樣本條件下的母體平均數檢定 計算檢定統計量的值需要兩步驟: 1. 計算樣本聯合變異數。 2. 計算 t 值的公式如下所示:

範例 Owens 公司主要從事製造與組裝除草機。現在有兩種組裝與架設除草機引擎的程序,問題是:使用這兩種啟動引擎的平均時間是否有差異?第一種程序由公司員工Herb Welles 所開發(稱為程序 1),而另一種由公司副總裁 William Atkins 所開發(稱為程序 2)。公司決定進行研究組裝引擎時間的評估比較。 現在抽選 5 位員工為樣本,使用程序 1 來組裝引擎;另外再抽選 6 位員工使用程序 2 來組裝引擎,結果如下表所示(以分鐘為單位),請問組裝引擎的平均時間是否有差異?請使用 0.1 顯著水準。

範例 continued

範例 continued 虛無假設是這兩程序間組裝引擎的平均時間沒有差異;對立假設是兩程序啟動組裝的平均時間有差異。 必須的假設: Welles 樣本中的觀測資料與 Atkins 樣本中的觀測資料必須互相獨立。 兩母體分配必須服從常態分配。 兩母體具有相等的標準差。

範例 continued 使用 Welles 與使用 Atkins 方法的平均組裝時間是否有差異?自由度等於總樣本數量減去樣本組數,即 n1 + n2-2。使用 Welles 方法的有 5 位員工,而使用 Atkins 方法的有 6 位員工,因此自由度為 5 + 6-2 = 9。查附錄 B.2 在自由度df = 9、顯著水準為 0.1 的情況下,可得臨界值為 -1.833 與 1.833,決策法則詳見圖 11-3 所示。如果計算出來的檢定統計量落在-1.833 至1.833 的範圍內,則不能拒絕虛無假設。

範例 continued 圖 11-3 自由度為 9 ,且顯著水準為 0.1 之雙尾檢定的拒絕域

範例 continued 步驟 1:計算樣本標準差。

範例 continued 步驟 2:計算聯合樣本變異數。 步驟 3:計算 t 值。

範例 continued 結論是:不拒絕虛無假設,因為-0.662落在-1.833 至 1.833 的區域間。因此可說這兩種方法架設與組裝引擎的平均時間沒有差異。 亦可以使用附錄 B.2 計算 p- 值。首先,先找出自由度為 9 的那一列,以及雙尾檢定的那一行。在此無須考慮正負號,找到機率值最接近 0.662 的 t 值是 1.383,其相對應的顯著水準是 0.2。因此即使使用 20% 的顯著水準,也不能拒絕平均數相等的虛無假設,可以說 p- 值大於 0.2。

Excel (the Pooled t-test) - Example

兩組樣本的假設檢定:相依樣本 相依樣本為成對或相關資料的樣本。 獨立樣本為兩組樣本間完全不相關。 例如: 若你想要買某一廠牌的汽車時,到兩家不同代理商比較價格。 若你希望測量新的減肥藥是否有效,你測量了使用前後的體重。

兩組樣本的假設檢定:相依樣本 檢定統計量的計算公式: 其中,自由度是 n-1, 是成對或相關觀測資料間差異的平均值。  是成對或相關觀測資料間差異的平均值。 sd 是成對或相關觀測資料間差異的標準差。 n 是成對觀測資料的數量。

範例 承 Nickel 貸款公司比較兩家公司在進行資產評估時是否有差異的例子。Nickel 貸款公司選擇了 10 間房屋為樣本,讓兩家公司進行估價。結果如下表所示(以千美元為單位): 在 0.05 顯著水準下,是否可以說這兩家公司的平均估價有差異?  

範例 continued 第一個步驟是建立虛無假設與對立假設。由於想要知道在兩家公司的資產估價間是否有差異,而非想了解哪一家的資產估價結果高於另一家,所以判斷本例屬於雙尾檢定。因此這個問題主要是想了解資產估價的樣本差異是否來自於母題平均數為 0 的母體,如果母體平均數的差距是 0,那麼可以說兩公司間的估價沒有差異。虛無假設與對立假設為:

範例 continued 給兩家公司進行估價的樣本房屋有 10 間,所以 n = 10,自由度 df = n-1 = 10-1 = 9。本例屬於雙尾檢定,且顯著水準是 0.05。查閱附錄B.2 以計算臨界值,找出自由度等於 9、雙尾檢定與顯著水準為 0.05 三個條件的交叉點,其值為 2.262。部分附錄 F 的表格請見下頁的表11-2。而決策法則是:如果計算出來的 t 檢定統計量的值小於-2.262 或是大於 2.262 時,必須拒絕虛無假設。詳細的計算過程如下頁表所示:

T分配表

範例 continued

範例 continued 因為 t 檢定統計量的值落在拒絕域中,因此拒絕虛無假設。差異的母體分配之平均值不為 0,可以說這兩家資產評估公司對於房屋的估價有明顯差異,最大的差異在第 3 間與第 8 間房屋的估價。也許可以進一步分析差異的原因。 使用附錄 B.2 以及雙尾檢定的部分來找出 p- 值。在自由度是 9、顯著水準為 0.01 下,找到最接近我們計算的t 值是 3.25。不過計算出來的檢定統計量大於這個值,但是小於 4.781(對應於 0.001 的顯著水準),因此 p- 值小於 0.01。

範例 continued 計算出來的 t 值是 3.3045,且雙尾檢定的 p- 值是 0.00916。因為 p- 值小於 0.05,必須拒絕估價間差異分配的平均數是 0 的虛無假設。事實上,p- 值小於 1%,所以虛無假設為真的機率非常小。

Excel