第八章 假设检验 关键词: 假设检验 正态总体参数的假设检验 拟合优度检验 1.

Slides:



Advertisements
Similar presentations
实用农业科技写作 王鹏文. 第一章 导论 第一节 农业科技写作概述 一 、 农业科技写作概念和分类: 科技文献类、科技应用类、 科技普及类、科技新闻类 二、 农业科技写作的意义和重要性: 科技工作的重要组成部分、科学研究的手段、 科技成果的反映和标志、科技交流的工具 三、 农业科技写作的特点 : 功利性与及时性、科学性与先进性、读者的专门性与狭隘性、
Advertisements

新课程引领 实践中前行 —— 蓟县初中信息技术三年课改总结. 自从 2005 年秋季我市进入基础教育新一 轮课程改革实验以来,在市教研室的正 确领导下,我县初中信息技术课改工作 稳步推进。三年来,取得了一些成果, 也有不少体会。现将三年来的信息技术 课改工作总结如下。
专题复习 --- 走进名著 亲近经典 读完《鲁滨孙漂流记》这本精彩的小说 后,一个高大的形象时时浮现在我的眼 前,他就是勇敢的探险家、航海家鲁滨 孙。他凭着顽强的毅力,永不放弃的精 神,实现了自己航海的梦想。 我仿佛看到轮船甲板上站着这样的一 个人:他放弃了富裕而又舒适的生活, 厌恶那庸庸碌碌的人生,从而开始了一.
河南省基础教育资源网 邓伟鹏 二〇一二年七月 内容大纲 1. 培训平台的目的 2. 培训平台介绍 3. 培训平台功能 4. 培训工作建立流程 5. 培训门户 6. 在线学习 6.1 课程学习 6.2 在线考试 7. 培训考试管理 7.1. 课程管理 7.2 必修学习班建立 7.3 在线考试管理 7.4.
轴对称(一) 课堂引入 仔细观察下列图片,思考这些图片有什么样 的特点.
桐乡市地方税务局 2013 年度社会保险费汇算清缴有 关政策及事项说明. 一、政策规定 根据《中华人民共和国社会保险法》、《桐乡市社会保险费征缴管 理办法》(市政府令第 42 号)、《 关于完善社会保险费征缴管理有关问 题的通知》(桐政办发 [2012]152 号)及《关于完善社会保险费征缴管理.
國中教育會考說明 年 5 月 14 日(六) 105 年 5 月 15 日(日)  08:20- 08:30 考試說明  08:20- 08:30 考試說明  08:30-  09:40 社 會  08:30-  09:40 自 然 09:40- 10:20 休息 09:40-
创意鄱阳湖— 一种基于无形资源理念开发鄱阳湖的思考 以传奇背景音乐作为开场,体现创意创造传奇 南昌大学 黄细嘉
說 劍 《莊子‧雜篇》─ 第 一 組 賴泊錞 謝孟儒 張維真 羅苡芸
防盜裝置  學生科技探究.
德 国 鼓 励 生 育 的 宣 传 画.
第四章:长期股权投资 长期股权投资效果 1、控制:50%以上 有权决定对方财务和经营.
NO.005 職涯 報 實習 徵才 攻讀 國立嘉義大學 學生事務處學生職涯發展中心.
饮食中的平衡 酸 性 食 物 与 碱 性 食 物.
知识聚焦 光合作用 呼吸作用 条件 场所 原料 产物 物质变化 能量变化 有光无光都可以 需要光 主要是线粒体 叶绿体 二氧化碳、水
國中教育會考 十二年國教—免試入學 及 意見整理.
控制方长投下的子公司,需要编制合并报表的演示思路
第八章 互换的运用.
探究实验的教学设计和教学策略 ENTER 余杭勾庄中学 郭 琳
人民版必修三专题三复习 近代中国 思想解放的潮流 灵石中学 易吉华.
体育田径课.
8 企业信息管理的定量分析 第八讲 企业信息管理的定量分析 8.1 企业信息化水平的测评 8.2 企业信息管理绩效的测评.
第六十四章 下肢骨关节损伤 卢国强.
川信-丰盛系列集合资金信托计划 2016年3月.
古文選讀.
农信社信贷产品实务技能提升培训.
严格标准 规范程序 认真做好党员发展工作.
薪資申報系統操作說明.
商学院 旅游管理专业介绍.
 历史以人类的活动为特定的对象,它思接万载,视通万里,千恣百态,令人销魂,因此它比其他学科更能激发人们的想像力。    
高齡者道路交通事故特性與道安防制措施 研究計畫報告
《数学》(华师大.八年级 下册) 第二十一章数据的整理与初步处理 扇形统计图的制作.
是重要的感觉器官,有许多感觉器,具触觉、嗅觉功能,还能感受异性的性信息素。 触角由柄节、梗节和鞭节三部分组成。
怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 (学院、部门适用)
『臺北市營建剩餘資源管理系統』 教育訓練說明 臺北市政府 報告人 王宏正
“三项制度+一个平台”构建 省级高校教学质量监控体系
瓯海职专财经专业组简介.
忠孝國小自立午餐老師的叮嚀 教師指導手冊.
国有资产清查 数据填报操作规范 2016年3月25日.
必修Ⅰ 地球上的水 第三章.
人力资源规划方案 人力资源规划项目组 2005年4月9日.
动画分镜头技巧 梁思平.
上海文会会计师事务所有限公司 中国注册会计师 童幸义
关于成绩的数理统计的探讨 望您多多指教!多谢!!.
仓储企业岗位人员招聘 第一组 组员 :陈娇娇 祝婷婷 丁元莉 袁珮 王慧.
第四章 时间序列的分析 本章教学目的:①了解从数量方面研究社会经济现象发展变化过程和发展趋势是统计分析的一种重要方法;②掌握时间数列编制的基本要求;③理解和掌握水平速度两方面指标的计算及运用④理解和掌握长期趋势分析和预测的方法。 本章教学重点:现象发展的水平指标和速度指标。 本章教学难点:现象变动的趋势分析。
人口与计划生育 统计分析 昌吉市计划生育委员会 二○○六年三月.
“08高考化学学业水平(必修科目)测试的命题和教学对策研究”
簡易送審動態案件網 路報送作業操作訓練 資料來源 銓敘部製作 報告人 饒瑞恭 日 期: 101 年 6 月 15 日.
初中数学七年级上册 (苏科版) 2.3 绝对值与相反数(1).
2014年深圳市学生人身意外伤害保险投保工作介绍 中国人民财产保险股份有限公司深圳市分公司
专业教师成绩录入指南 及教学文档材料归档要求
如何寫工程計畫書 臺北市童軍會考驗委員會 高級考驗營 版.
第四章 進階操作 在 Excel 中除了將資料逐字地輸入到儲存格外, 還有其他輸入資料的技巧, 可加速輸入資料的速度。 自動完成
東部海岸 馬蘭國小 五年己班 閔芳頤 Enter
關鍵數據 數據錯了 扣 50分 排序錯了 扣50分.
办学条件核查 评估秘书组 电力职业技术学院 山西机电职业技术学院 2014年7月9日.
材料二甲 授課教師:王致傑 老師 (學420、分機5305)
注音輸入法教學 大華技術學院資管系 指導老師:陳信如老師 學生:王麗嵐.
科 展 說 明.
第十四章 迴歸.
電子白板百萬小學堂 本活動建議搭配電子白板 學生最多可分成2~6組(請按組別按鈕) 老師可以視時間多少,來進行活動 每一組要回答十個問題。
怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 (项目经费适用)
合歡山 馬蘭國小 五年己班 何宜倞 ENTER.
成本会计学.
舊生升級編班與新生管理操作說明 全誼資訊股份有限公司 中華民國106年06月05日.
第六章 机件的表达方法 在工程实际中,由于机件的结构形状是多种多样的,仅用三视图往往不能完整、清楚、简便地表达出机件的结构和形状。为此,国家标准《机械制图》还规定了机件表达的其他方法。 本章将介绍视图、剖视图、断面图等常用表达方法,并讨论怎样根据机件的结构特点,恰当地选用这些表达方法。
新课程理念下如何进行课堂教学 刘志超 2014年2月25日.
第十三章 資料表格化與整理:Excel 2000的使用
6 分析資料-以統計測量數呈現.
Presentation transcript:

第八章 假设检验 关键词: 假设检验 正态总体参数的假设检验 拟合优度检验 1

8.1 假设检验 统计推断的另一类重要问题是假设检验问题。它包括 (1)已知总体分布的形式,需对其中的未知参数给出假设检验. —参数检验 (2)总体的分布形式完全未知的情况下,对总体的分布或数字特征进行假设检验.—非参数检验 2

(一)问题的提出 例1 设某种清漆的9个样品,其干燥时间(以小时计)分别为: 例1 设某种清漆的9个样品,其干燥时间(以小时计)分别为: 6.0 5.7 5.5 6.5 7.0 5.8 5.2 6.1 5.0 根据以往经验,干燥时间的总体服从正态分布N(6.0, 0.36),现根据样本检验均值是否与以往有显著差异?

例2 一种摄影药品被其制造商声称其贮藏寿命是均值180天、标准差不多于10天的正态分布。某位使用者担心标准差可能超过10天。他随机选取12个样品并测试,得到样本标准差为14天。根据样本有充分证据证明标准差大于10天吗?

例3 孟德尔遗传理论断言,当两个品种的豆杂交时,圆的和黄的、起皱的和黄的、圆的和绿的、起皱的和绿的豆的频数将以比例9:3:3:1发生。在检验这个理论时,孟德尔分别得到频数315、101、108、32、这些数据提供充分证据拒绝该理论吗? 5

假设:

(二)检验统计量和拒绝域 对例1的统计分析

(三)两类错误 第I类错误:拒绝真实的原假设(弃真) 第II类错误:接受错误的原假设(取伪) 由于样本的随机性,任一检验规则在应用时,都有可能发生错误的判断。 原假设为真 原假设不真 根据样本拒绝原假设 第I类错误 正确 根据样本接受原假设 第II类错误 第I类错误:拒绝真实的原假设(弃真) 第II类错误:接受错误的原假设(取伪)

17

19

20

处理假设检验问题的基本步骤

8.2 单个正态总体参数的假设检验

29

30

31

32

33

34

思考题:比较 与 你能写出右边假设问题检验的拒绝域吗?

36

37

38

39

40

41

42

43

例 某种元件的寿命X(以小时记)服从正态分布 均未知。现测得16只元件的寿命如下: 280 101 212 224 379 179 264 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 问是否有理由认为元件的平均寿命大于225(小时)? (取显著性水平为0.05) 44

没有落在拒绝域内,故不能拒绝原假设, 认为元件的平均寿命不大于225小时。

问:若将原假设和备择假设互换,即考虑左边检验 检验结果怎么样?请给出合理的解释。

一般地,在有关参数的假设检验中, 备择假设是我们根据样本资料 希望得到支持的假设。

例3 要求某种元件的平均使用寿命不得低于1000小时,生产者从一批这种元件中随机抽取25件,测得其平均寿命为950小时,标准差为100小时。已知这批元件的寿命服从正态分布。试在显著性水平0.05下确定这批元件是否合格? 49

认为这批元件的平均寿命小于1000小时,不合格。 t落在拒绝域内,故拒绝原假设, 认为这批元件的平均寿命小于1000小时,不合格。 50

52

53

问:以这两种种子种植的谷物产量是否有显著的差异(取显著性水平为0.05)? 例4:为了试验两种不同谷物种子的优劣,选取了十块土质不同的土地,并将每块土地分为面积相同的两部分,分别种植这两种种子。设在每块土地的两部分人工管理等条件完全一样。下面给出各块土地上的产量。 土地 1 2 3 4 5 6 7 8 9 10 种子A(xi) 23 35 29 42 39 29 37 34 35 28 种子B(yi) 26 39 35 40 38 24 36 27 41 27 di=xi-yi -3 -4 -6 2 1 5 1 7 -6 1 问:以这两种种子种植的谷物产量是否有显著的差异(取显著性水平为0.05)? 55

56

57

在Excel中的实现-------TTEST函数 本例的分析步骤如下: (1) 将两品种种子的产量数据输入Excel 表中,设数据区域分别为A1:A10和B1:B10; (2)下拉菜单“插入”选项卡═>单击“函数” ═> 在类别的下拉式菜单中选择“统计” ═>选“TTEST”;

(3) 在“Array1”文本框中输入“A1:A10”,在“Array2”文本框中输入“B1:B10”,“Tails” 文本框中输入”2” (“1”代表单尾概率,”2”代表双尾概率),“Type”文本框中输入“1”( “1”代表成对数据的t检验,“2”代表方差齐性的两样本t检验,“3”代表异方差的两样本t检验); (4)点击Enter键,即显示P_值为“0.889921”,因此认为两品种种子产量没有显著差异。

60

61

62

63

65

66

从资料来看想要支持的结论是:新品种苹果的重量差异小 67

68

例2 一种摄影药品被其制造商声称其贮藏寿命是均值180天、标准差不多于10天的正态分布。某位使用者担心标准差可能超过10天。他随机选取12个样品并测试,得到样本标准差为14天。根据样本有充分证据证明标准差大于10天吗? (取显著水平为0.05)

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

取用原料A生产的样品220件,测得平均重量为2.46(公斤),样本标准差s=0.57(公斤)。 例7:某厂使用两种不同的原料A,B生产同一类型产品。各在一周的产品中取样分析。 取用原料A生产的样品220件,测得平均重量为2.46(公斤),样本标准差s=0.57(公斤)。 取用原料B生产的样品205件,测得平均重量为 2.55(公斤),样本标准差为0.48(公斤)。 设两样本独立,来自两个方差相同的独立正态总体。问在水平0.05下能否认为用原料B的产品平均重量μ2较用原料A的产品平均重量μ1为大。 85

86

(二)比较两个正态总体方差的检验 87

88

89

例7:两台机床生产同一个型号的滚珠,从甲机床生产的滚珠中抽取8个,从乙机床生产的滚珠中抽取9个,测得这些滚珠的直径(毫米)如下: 甲机床 15.0 14.8 15.2 15.4 14.9 15.1 15.2 14.8 乙机床 15.2 15.0 14.8 15.1 14.6 14.8 15.1 14.5 15.0 90

91

92

93

94

在Excel中的实现----FTSET函数和TTEST函数 函数进行两样本的均值比较。

本例的分析步骤如下: (1) 将两组数据输入Excel 表中,设数据区域分别为A1:A8和B1:B9; (2)下拉菜单“插入”选项卡═>单击“函数” ═> 在类别的下拉式菜单中选择“统计” ═>选“FTEST”;

(3) 在“Array1”文本框中输入“A1:A8”,在“Array2”文本框中输入“B1:B9”, 并点击Enter键,即显示P_值为“0.7752”, 因此认为两总体方差相同.

在类别的下拉式菜单中选择“统计” ═>选“TTEST”; (4)重新下拉菜单“插入”选项卡═>单击“函数” ═> 在类别的下拉式菜单中选择“统计” ═>选“TTEST”; (5) 在“Array1”文本框中输入“A1:A8”,在“Array2”文本框中输入“B1:B9”,“Tails” 文本框中输入”1”(“1”代表单尾概率,”2”代表双尾概率),“Type”文本框中输入“2”( “1”代表成对数据的t检验,“2”代表方差齐性的两样本t检验,“3”代表异方差的两样本t检验);

(6)点击Enter键,即显示P_值为“0.0979”,因此在显著水平为0.1下,拒绝原假设 (7) 若在步骤(5)中的“Tails” 文本框中输入”2”,并点击Enter键,即显示P_值为“0.19587”,因此在显著水平0.1下,接受原假设

8.4 假设检验与区间估计 作区间估计时,对参数没有先验的认识,但确定参数是固定不变的,只是未知,所以区间估计的目的是:根据样本对参数进行估计; 作假设检验时,对参数有一个先验的认识(例如μ=μ0),但由于某种情形的出现(如工艺改良等),猜测真实参数值可能发生了变化,所以假设检验的目的是:根据样本确认参数是否真的发生了改变。 但置信区间与假设检验的拒绝域之间又有密切的关系。 100

101

102

103

104

105

106

107

108

109

110

正态总体均值、方差的置信区间与假设检验 待估 参数 原 假设 枢轴量 检验统计量 分 布 置信区间 拒绝域 一个正态总体 两个正态总体

8.5 拟合优度检验 正态分布前提下,对参数进行假设检验的。 实际中可能遇到这样的情形,总体服从 何种理论分布并不知道,要求我们直接 前面介绍的各种检验都是在总体服从 正态分布前提下,对参数进行假设检验的。 实际中可能遇到这样的情形,总体服从 何种理论分布并不知道,要求我们直接 对总体分布提出一个假设 。 112

例如,要检验在计算机上产生随机数的一个程序。指令该程序产生0到9之间的100个单个数字。观察整数的频数如下表。那么以0 例如,要检验在计算机上产生随机数的一个程序。指令该程序产生0到9之间的100个单个数字。观察整数的频数如下表。那么以0.05的显著性水平,有充分的理由相信该批整数不是均匀产生的吗? 整数 0 1 2 3 4 5 6 7 8 9 频数 11 8 7 7 10 10 8 11 14 14 113

例如,从1500到1931年的432年间,每年爆发战争的次数可以看作一个随机变量,据统计,这432年间共爆发了299次战争,具体数据如下: 战争次数X 0 1 2 3 4 发生 X次战争的年数 223 142 48 15 4 通常假设每年爆发战争的次数服从泊松分布。那么上面的数据是否有充分的理由推翻每年爆发战争的次数服从泊松分布假设? 114

注意:在拟合优度检验中,一般地,把想要支持结论放在原假设。 115

116

117

118

119

120

例: 从1500到1931年的432年间,每年爆发战争的次数可以看作一个随机变量,据统计,这432年间共爆发了299次战争,具体数据如下: 战争次数X 0 1 2 3 4 发生 X次战争的年数 223 142 48 15 4 通常假设每年爆发战争的次数服从泊松分布。那么上面的数据是否有充分的理由推翻每年爆发战争的次数服从泊松分布假设? 121

战争次数x 0 1 2 3 4 实测频数 223 142 48 15 4 概率估计 0.502 0.346 0.119 0.027 0.006 理论频数 217 149 51 122

123

例2 孟德尔遗传理论断言,当两个品种的豆杂交时,圆的和黄的、起皱的和黄的、圆的和绿的、起皱的和绿的豆的频数将以比例9:3:3:1发生。在检验这个理论时,孟德尔分别得到频数315、101、108、32、这些数据提供充分证据拒绝该理论吗? 124

125

豆子状态x 1 2 3 4 实测频数 315 101 108 32 概率 9/16 3/16 3/16 1/16 理论频数 312.75 104.25 104.25 34.75 126

例3 下面列出了84个伊特拉斯坎(Etruscan)人男子 的头颅的最大宽度(mm),试检验这些数据是否来 自正态总体(取α=0.1) 141 148 132 138 154 142 150 146 155 158 140 147 144 149 145 143 126 135 136 137 139 131 152 153 134 127

解 为粗略了解数据的分布情况,先画出直方图。 解 为粗略了解数据的分布情况,先画出直方图。 步骤如下: 1.找出数据的最小值、最大值为126、158,取区间[124.5, 159.5],它能覆盖[126, 158]; 2.将区间[124.5, 159.5]等分为7个小区间,小区间的长度Δ=(159.5-124.5)/7=5, Δ称为组距,小区间的端点称为组限,建立下表: 128

组 限 频数 频率 累计频率 124.5-129.5 129.5-134.5 134.5-139.5 139.5-144.5 144.5-149.5 149.5-154.5 154.5-159.5 1 4 10 33 24 9 3 0.0119 0.0476 0.1191 0.3929 0.2857 0.1071 0.0357 0.0595 0.1786 0.5715 0.8572 0.9524 129

3.自左向右在各小区间上作以ni /nΔ为高的小矩形 如下图,即为直方图。 注:直方图的小区间可以不等长,但小区间的长度不能太大,否则平均化作用突出,淹没了密度的细节部分;也不能太小,否则受随机化影响太大,产生极不规则的形状。 130

从本例的直方图看,有一个峰,中间高,两头低,较对称,样本象来自正态总体。于是检验 131

132

故在水平0.1下接受H0,认为数据来自正态总体。 x≤129.5 129.5<x≤134.5 134.5<x≤139.5 10 33 24 9 3 0.0087 0.0519 0.1752 0.3120 0.2811 0.1336 0.0375 0.73 4.36 14.72 26.21 23.61 11.22 3.15 6.79 41.55 24.40 10.02 Σ=87.67 故在水平0.1下接受H0,认为数据来自正态总体。 133

134