第5章 假设检验 会计学2011级 主讲:王红娜.

Slides:



Advertisements
Similar presentations
如何學好數學? 黃駿耀老師
Advertisements

辅助核算 3.5.
10 郑和远航.
三个偶像的故事和功绩 ——第12课 明清时期的反侵略斗争 董飞燕.
捣蛋鬼历险记 初一四班 孙嘉佑小组.
中國歷史 明代之患禍及民變.
10 郑和远航 郑和 郑和,1371年生于云南昆阳州(今昆明晋宁县)一个信奉伊斯兰教的回族家庭,原名马和,小字三宝,十一岁时在明太祖朱元璋发动的统一云南的战争中被俘进宫,后当朱元璋四子燕王朱棣的近侍。1403年朱棣登基,史称明成祖。次年正月初一,朱棣念他有勇有谋,屡立奇功,便赐姓“郑”,改称郑和,并提拔为内宫太监,于永乐三年(1405年7月11日)率领庞大船队首次出使西洋。自1405年到1433年,漫长的28年间,郑和船队历经亚非三十余国,涉十万余里,与各国建立了政治,经济,文化的联系,完成了七下西洋的伟
明清 抗击外国侵略的英勇斗争 雅克萨反击战(俄) 戚继光抗倭(日) 郑成功收复台湾(荷兰) 荷兰 俄 罗 斯 日 本 台湾 沙 俄 入 侵
戚继光抗倭.
刑事訴訟法 授課人:林俊益副教授 時間:95.9.~96.6..
妩媚人生 云 计 算 与 大规模数据并行处理技术 黄 宜 华 南 京 大 学 计算机科学与技术系 软件新技术国家重点实验室 妩媚人生 妩媚人生
第16 课 中外的交往与冲突 授课人:鲍婷.
历史上的中日关系.
云南外事外语职业学院 入党积极分子培训 赵田甜.
第四章 清代臺灣的社會文化變遷 第一節 移墾社會的形成
認識食品中毒 一、什麼是食品中毒? 二人或二人以上攝取相同的食品而發生相似的症狀,並且自可疑的食餘檢體及患者糞便、嘔吐物、血液等人體檢體,或者其它有關環境檢體(如空氣、水、土壤等)中分離出相同類型(如血清型、噬菌 體型)的致病原因,則稱為一件“食品中毒”。 但如因攝食肉毒桿菌毒素或急性化學性中毒而引起死亡,即使只有一人,也視為一件“食品中毒”。
題目:四大古文明 班級:六年八 班 組員:賴宣光.游家齊.陳羿文 吳佳芬.許淑婷.許芳瑜..
食 物 中 毒.
琦君 《髻》 S 康倩瑜.
眼乾乾唔使慌.
滑膜皱襞综合征.
“公平”是最热的关键词 1、胡锦涛首次进行“总动员”,提出“在促进发展的同时,把维护社会公平放到更加突出的位置” 。
贵州省公务员面试 备考指导 中公教育 面试讲师 刘运龙.
外 套 各式領型與變化 武 玫 莉 製 作.
第4节 人体对食物的消化吸收.
陈冤之魅,心鬼之泪 ——雾里探花 《东方快车谋杀案》 By第二小组.
高考作文等级评分标准/发展等级10分 深刻 丰富 有文采 有创意 ①透过现象 深入本质 ②揭示问题 产生的原因 ③观点具有 启发作用
文明礼仪在我心 文明礼仪在我心.
第10课 社会生活的变迁.
故事会 盘古开天劈地 在很久很久以前,天地可不象我们现在看到的这样————天高高的在上面,地在我们的脚下,中间隔着几千几万米远。那个时候的天地就象是一个包在大黑壳里的鸡蛋,混混沌沌的,什么也看不清。人们走路都得弯着腰,耕田打猎都很不方便,因为一不小心抬个头,就会碰到天,惹它生气,接着就会招来狂风暴雨。因此所有的植物也都长不高,所以结的粮食和果实都很少,根本就不够大家吃。还经常会发生饿死人的事情。
面向三农,拓宽信息渠道 辐射千村,服务百万农民
三招 让孩子爱上阅读 主讲人:芝莺妈妈 2012年10月19日.
FUZHUANGZHITUYANGBANZHIZUO
如何挑選吳郭魚 嗨~ 餐旅二乙 4a2m0105 白妤潔 4a2m0122 何姿瑩.
学校春季呼吸道传染病预防知识 连云港市疾病预防控制中心
服裝整理概論.
印染纺织类艺术.
创业计划书的编写.
创业计划书撰写.
第九章 进行充分调研 选择自主创业.
香溢饺子馆创业计划书.
第三章 中国的民族民俗 第一节 概论 第二节 汉族 第三节 满族 蒙古族 维吾尔族 回族 朝鲜族 第四节 壮族 土家族 苗族 黎族
第 4 章 投资银行: 基于资本市场的主业架构.
创业数字图书馆.
中国管理科学发展探索 成思危 2006年8月18日于上海复旦大学.
“四文”交融,虚实并举,打造具有鲜明职教特色的校园文化 ——江苏省扬州商务高等职业学校校园文化建设汇报
103年度高職優質化輔助方案計畫申辦及輔導訪視說明會
“十二五”科技发展思路 与科技计划管理 科技部发展计划司 刘敏 2012年9月.
社区妇幼保健工作 江东区妇幼保健院 胡波瑛.
人生不要太圓滿 ◎ 張忠謀.
导致羊水过少的五大因素.
胎教.
怎样进行一次宣讲 何惠玲.
第三课 中国共产党的历程.
[聚會時,請將傳呼機和手提電話關掉,多謝合作]
规范母婴保健服务 努力降低孕产妇死亡率 市卫生局基妇科 朱静.
中国地质科学院矿产资源研究所 财务报账培训
白天的月亮 想與日爭輝 人生不要太圓滿 文字取自於:張忠謀 攝於陽明山 阿道的攝影工作坊.
第十章(上) 实现中华民族的伟大复兴.
营养要均衡.
ㄩ.
高中新课程历史必修(Ⅰ) 教材比较研究 四川师范大学历史文化学院教授 陈 辉 教育部2009普通高中历史课改远程研修资料.
十年职业生涯规划 —— 年 姓名:刘娟 学号:.
主考官眼中的面试 ——面试主考官教你备战2016年国考面试 主讲老师:李海鹏.
国内知名高校 医学院(部、中心) 院系及附属医院设置情况 调研报告
財務報表分析 授課教師:陳依婷.
第六章 可供出售金融资产 一、可供出售金融资产的概念和特征 二、可供出售金融资产的核算.
主讲人:刘文波 (四会国税 政策法规股) 2014年4月
智慧宁波 智慧财税 . 宁波市地方税务局.
第六模块礼仪文书写作 第一节求职信、应聘信 QIUZHIXINYINGPINXIN.
Presentation transcript:

第5章 假设检验 会计学2011级 主讲:王红娜

本章内容 假设检验的基本思想 5.1 假设检验的基本问题 5.2 一个总体参数的检验 讨论:假设检验与区间估计

假设检验的基本思想——引例 某企业生产一种零件,过去资料表明其平均长度为4厘米,标准差为0.1厘米。改革工艺后,随机抽查了100个零件,测得样本平均长度为3.95厘米。问:工艺改革前后零件的长度是否发生了显著变化? 改革后零件的平均长度事先并不知道。可先假设为4厘米,然后利用样本的平均长度来检验假设是否正确。 这就是一个假设检验问题。

分析引例,原假设 𝐻 0 :𝜇= 𝜇 0 =4 若原假设成立,即工艺改革后零件长度没有显著变化,则样本均值 𝑥 服从正态分布,且样本均值 𝑥 为3.95。如果二者有显著差异,我们有理由认为样本不是取自均值为 𝜇 0 的总体,即认为工艺改革后零件长度不是 𝜇 0 。

换言之,应当确定一个区间,如 𝜇 0 −𝑘, 𝜇 0 +𝑘 ,如果样本取自均值为 𝜇 0 的总体,则只要是简单随机抽样,样本均值 𝑥 都应该以很大的概率落入此区间内。即 𝑥 落入此区间外的概率应该很小。一旦这个小概率事件 𝑋 − 𝜇 0 >𝑘 发生,人们必然怀疑原假设 𝐻 0 的真实性。

在解决实际问题时,人们事先指定一个小概率𝛼,如𝛼取0. 10,0. 05,0 在解决实际问题时,人们事先指定一个小概率𝛼,如𝛼取0.10,0.05,0.025等,使得当 𝐻 0 实际正确时否定 𝐻 0 的概率是𝛼。可由概率等式𝑃 𝑥 − 𝜇 0 >𝑘 𝐻 0 为真 =𝛼来确定常数𝑘,即误差范围。 基本思路: 首先假设 𝐻 0 成立,然后进行统计推断,如果导致一个不合理的现象发生,即小概率事件在一次抽样中发生了,则否定原假设 𝐻 0 ,这里运用的是“小概率事件在一次实验中几乎是不可能发生的”这一原则。

若取置信度为0.99,则𝛼=0.01, 𝑧 𝛼 2 =2.58 也就是说,如果原假设为真,则样本均值的标准化值 𝑧 > 𝑧 𝛼 2 发生了,即小概率事件 𝑧 >2.58 发生了,则拒绝 𝐻 0 。 本例计算结果: 𝑥 −𝜇 𝜎 𝑛 = 3.95−4 0.1 100 =5>2.58 说明小概率事件发生了,这是不合理的,应拒绝原假设。

小结 对未知总体作某种假设 样本观察结果 抽样检验 小概率事件发生 小概率事件未发生 拒绝 原假设 不拒绝

可见,假设检验的基本思想是——带有概率性质的反证法! 假设检验的两个特点: 其逻辑推理方法是反证法 判断结果合理与否,是基于“小概率事件不易发生”这一原理

5.1教学要求 能熟练陈述问题的假设 理解两类错误与显著性水平,理解两类错误之间的关系 理解检验统计量的构造方法,理解拒绝域的含义 理解𝑷值的含义,会用𝑷值进行决策判断

5.1 假设检验的基本问题 假设的陈述 一 二 两类错误与显著性水平 检验统计量与拒绝域 三 利用𝑷值进行决策 四 转到5.2

一、假设的陈述 什么是假设? 对总体参数的具体数值所作的陈述 总体参数包括总体均值、比率、方差等 分析之前必须陈述 我认为该企业生产的零件的平均长度为4厘米!

假设检验就是先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程。 假设检验包括参数检验和非参数检验两种方法。 假设检验逻辑上运用反证法,统计上依据小概率原理。

一个简单的例子 一名被告正在受法庭的审判,根据英国法律,先假设被告是无罪的,于是证明他有罪的责任就落在原告律师身上。用假设检验的术语就是要建立一个假设,记为 𝐻 0 :被告是无罪的,称为原假设或零假设。另一个可供选择的假设记作 𝐻 1 :被告是有罪的,称为备择假设或替代假设。法庭陪审团要审查各种证据,以确定原告律师是否证实了这些证据与“无罪”这一原假设不一致。如果陪审团员们认为证据与 𝐻 0 不一致,他们就拒绝该原假设而接受其备择假设 𝐻 1 ,即认为被告有罪。

反证法 如果一个人说他从来没有骂过人。他能够证明吗? 看来,企图肯定什么事物很难,而否定却要相对容易得多。这就是假设检验背后的哲学。 要证明他没有骂过人,他必须出示他从小到大每一时刻的录音录像,所有书写的东西等等,还要证明这些物证是完全的、真实的、没有间断的。这简直是不可能的。即使他找到一些证人,比如他的同学、家人和同事,那也只能够证明在那些证人在场的某些片刻,他没有被听到骂人。反过来,如果要证明这个人骂过人很容易,只要有一次被抓住就足够了。 看来,企图肯定什么事物很难,而否定却要相对容易得多。这就是假设检验背后的哲学。 科学往往是在否定中发展。

在假设检验中,一般要设立一个原假设(上面的“从来没骂过人”就是一个原假设); 而设立该假设的动机主要是企图利用人们掌握的反映现实世界的数据来找出假设与现实之间的矛盾,从而否定这个假设。

在多数统计教科书中(除理论探讨外),假设检验都是以否定原假设为目标。如否定不了,说明证据不足,无法否定原假设。但这并不等于原假设正确,而是“没有足够证据拒绝原假设”,因此“不能接受原假设”。 就像一两次没有听过他骂人还远不能证明他从来没有骂过人。

假设检验的过程:提出假设→抽取样本→作出决策

原假设(null hypothesis) 研究者想收集证据予以反对的假设,又称“0假设”,总是有符号“=”,“≤”或“≥”,表示为 𝐻 0 如: 𝐻 0 :𝜇=某一数值 例如: 𝐻 0 :𝜇=10𝑐𝑚

备择假设(alternative hypothesis) 研究者想收集证据予以支持的假设,也称“研究假设”,总是有符号“≠”,“<”或“>”,表示为 𝐻 1 𝐻 1 :𝜇<某一数值 或 𝜇>某一数值 例如: 𝐻 1 :𝜇<10𝑐𝑚 或 𝜇>10𝑐𝑚

提出假设(例题分析) 例1:一种零件的生产标准是直径应为10𝑐𝑚,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10𝑐𝑚,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设。 研究者想收集证据予以证明的假设应该是“生产过程不正常”。 建立的原假设和备择假设为: 𝐻 0 :𝜇=10𝑐𝑚 𝐻 1 :𝜇≠10𝑐𝑚

例2:某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设。 研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。 建立的原假设和备择假设为: 𝐻 0 :𝜇≥500 𝐻 1 :𝜇<500

例3:一家研究机构估计,某城市中家庭拥有汽车的比率超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设。 研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比率超过30%”。 建立的原假设和备择假设为: 𝐻 0 :𝜋≤30% 𝐻 1 :𝜋>30%

提出假设(结论与建议) 原假设和备择假设是一个完备事件组,而且相互对立 先确定备择假设,再确定原假设 等号“=”总是放在原假设上 在一项假设检验中,原假设和备择假设必有一个成立,且只有一个成立 先确定备择假设,再确定原假设 等号“=”总是放在原假设上 原假设的符号是“=”,“≤”或“≥” 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)

双侧检验与单侧检验 备择假设没有特定的方向性,并含有符号“≠”的假设检验,称为双侧检验或双尾检验(two-tailed test) 备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailed test) 备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验

双侧检验与单侧检验 ——假设的形式 假设 双侧检验 单侧检验 左侧检验 右侧检验 原假设 𝐻 0 :𝜇= 𝜇 0 𝐻 0 :𝜇≥ 𝜇 0 𝐻 0 :𝜇≤ 𝜇 0 备择假设 𝐻 0 :𝜇≠ 𝜇 0 𝐻 0 :𝜇< 𝜇 0 𝐻 0 :𝜇> 𝜇 0 返回5.1目录

二、两类错误与显著性水平 第Ⅰ类错误(弃真错误) 原假设为真时拒绝原假设(原假设为真,但由于样本的随机性,样本统计量落入拒绝域,使我们做出错误决策)。 小概率事件只是发生的概率很小,但并非绝对不发生。犯这类错误的概率就是小概率事件发生的概率,称为显著性水平,记为𝛼。

第Ⅱ类错误(取伪错误) 原假设为假时未拒绝原假设(原假设为假,但由于样本的随机性,样本统计量落入接受域,使我们做出错误决策)。 第Ⅱ类错误的概率记为𝛽。

假设检验中的两类错误—决策结果 假设检验就好像一场审判过程, 𝑯 𝟎 :无罪 统计检验过程 陪审团审判 裁决 实际情况 无罪 有罪 正确 𝑯 𝟎 检验 裁决 实际情况 𝑯 𝟎 为真 𝑯 𝟎 为假 未拒绝 𝑯 𝟎 正确决策(𝟏−𝜶) 第Ⅱ错误(𝜷) 拒绝 𝑯 𝟎 第Ⅰ错误(𝜶) 正确决策(𝟏−𝜷)

𝜶错误与𝜷错误的关系

小结 𝛼错误与𝛽错误此消彼长,但𝛼+𝛽≠1; 要同时减少𝛼与𝛽,须增大样本容量𝑛; 通常先控制犯𝛼错误的概率; 发生第Ⅰ类错误的概率被称为显著性水平,记为𝛼,是人们事先指定的犯第Ⅰ类错误的概率的最大允许值; 𝛽错误的概率不好控制,将“接受原假设”更倾向于说成“不拒绝原假设”。

显著性水平𝜶(significant level) 显著性水平是一个概率值 原假设为真时,检验统计量落在拒绝域的概率 表示为𝜶 常用的𝜶值有0.01, 0.05, 0.10 𝜶值由研究者事先确定。

假设检验中的小概率原理 什么小概率? 在一次试验中,一个几乎不可能发生的事件发生的概率; 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设; 小概率的值由研究者事先确定。

专家视野 著名的英国统计学家Ronald Fisher在他的研究中常常使用的小概率标准为0.05。 作为一个普遍适用的原则,后来人们通常选择显著性水平为0.05,当然也可比它大一些或小一些。 较常用的显著性水平有: 𝜶=0.01,𝜶=0.05,𝜶=0.1 返回5.1目录

三、检验统计量与拒绝域 根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。 检验统计量实际上是总体参数的点估计量。 标准化的检验统计量: 标准化检验统计量= 点估计量−假设值 点估计量的抽样标准差 对样本统计量进行标准化的依据 原假设 𝐻 0 为真 点估计量的抽样分布

拒绝域与临界值 能够拒绝原假设的统计量的所有可能取值的集合称为拒绝域。在图上表现为由显著性水平𝛼所围成的区域。 拒绝域的大小与事先选定的显著性水平𝛼有一定关系:当样本量固定时,拒绝域的面积随𝛼的减小而减小。 根据给定的显著性水平𝛼确定的拒绝域的边界值,称为临界值(Critical Value)。

显著性水平和拒绝域——双侧检验

显著性水平和拒绝域——单侧检验

显著性水平和拒绝域——左侧检验

显著性水平和拒绝域——右侧检验

假设检验的结论是在给定的显著性水平下作出的。显著水平不同,对同一问题所下的结论可能完全相反。 上图中的蓝点: 在0.1的显著性水平下,拒绝原假设; 在0.05的显著性水平下,不拒绝原假设。

即使在同一显著性水平下,由于临界值是固定的,拒绝域也就固定了。 讨论: 𝑍 1 和 𝑍 2 谁拒绝原假设的理由更充分?也就是说谁犯拒真错误的概率更小?

由于𝛼> 𝑝 1 > 𝑝 2 ,显然, 𝑍 2 拒绝原假设的理由更充分,即 𝑍 2 犯拒真错误的概率更小。 由显著性水平𝛼的含义可知: 𝑃 𝑍≥ 𝑍 𝛼 =𝛼 由图可以观察到: 𝑃 𝑍≥ 𝑍 1 = 𝑝 1 𝑃 𝑍≥ 𝑍 2 = 𝑝 2 由于𝛼> 𝑝 1 > 𝑝 2 ,显然, 𝑍 2 拒绝原假设的理由更充分,即 𝑍 2 犯拒真错误的概率更小。

思考题 生产耐高温玻璃,至少要能抗住500℃高温而玻璃不变形,这时对产品质量检验所设立的假设为( ) 生产耐高温玻璃,至少要能抗住500℃高温而玻璃不变形,这时对产品质量检验所设立的假设为(  ) A  𝐻 0 :𝜇≥500℃          B   𝐻 0 :𝜇≤500℃ C   𝐻 0 :𝜇=500℃           D 𝐻 0 :𝜇≠500℃ 加工零件所使用的毛坯如果过短,加工出来的零件则达不到规定的标准长度μ0,对生产毛坯的模框进行检验,所采用的原假设应当为(  ) A  𝜇= 𝜇 0             B  𝜇≥ 𝜇 0 C  𝜇≤ 𝜇 0            D  𝜇≠ 𝜇 0

思考题 在假设检验中,原假设 𝐻 0 ,备择假设 𝐻 1 ,则称( )为犯第二类错误。 在假设检验中,原假设 𝐻 0 ,备择假设 𝐻 1 ,则称(  )为犯第二类错误。 A   𝐻 0 为真,接受 𝐻 1       B 𝐻 0 为真,拒绝 𝐻 1 C  𝐻 0 不真,接受 𝐻 0       D  𝐻 0 不真,拒绝 𝐻 0

思考题 在一次假设检验,当显著性水平为0.01时,原假设被拒绝,若用0.05的显著性水平去检验,则( ) 在一次假设检验,当显著性水平为0.01时,原假设被拒绝,若用0.05的显著性水平去检验,则( ) A  一定会被拒绝          B 一定不会被拒绝 C  有可能拒绝原假设      D 需要重新检

思考题 设𝜶是显著性水平,𝛽是置信水平,若𝝀是统计量𝑇的临界值,则𝜶=𝑝( ),𝛽=𝑝( ) ;若 𝝀 1 、 𝝀 2 是统计量 χ 2 的临界值,且 𝝀 1 < 𝝀 2 ,则𝑝 χ 2 > 𝝀 2 =,𝑝 χ 2 < 𝝀 1 =。

决策规则 给定显著性水平𝛼,查表得出相应的临界值 𝑧 𝛼 或 𝑧 𝛼 2 , 𝑡 𝛼 或 𝑡 𝛼 2 给定显著性水平𝛼,查表得出相应的临界值 𝑧 𝛼 或 𝑧 𝛼 2 , 𝑡 𝛼 或 𝑡 𝛼 2 将检验统计量的值与𝛼水平的临界值进行比较 作出决策 双侧检验: 统计量 >临界值,拒绝 𝐻 0 左侧检验:统计量<−临界值,拒绝 𝐻 0 右侧检验:统计量>临界值,拒绝 𝐻 0 返回5.1目录

四、利用𝑷值进行决策 在原假设下,检验统计量沿着备择假设的方向取其实现值及更加极端值的概率称为𝑷值(𝑷-value)。 𝑷值反映实际数据与原假设 𝐻 0 之间不一致的程度。 如果得到很小的𝑷值,就意味着在原假设下小概率事件发生了。 如果小概率事件发生,是相信原假设,还是相信数据呢? 当然多半是相信数据,拒绝原假设。

到底𝑷值是多小的时候才能够拒绝原假设呢?也就是说,需要有什么是小概率的标准。 这要看具体应用的需要。但在一般的统计书和统计软件中,使用最多的标准是在原假设下(或原假设正确时),根据样本所得的数据来拒绝原假设的概率应小于0.05,当然也可能是0.01,0.005,0.001等等。 这种事先规定的概率即为显著性水平。

𝑷值的计算 一般地,用𝑋表示检验统计量,当 𝐻 0 为真时,可由样本数据计算出该统计量的样本统计值𝐶,根据检验统计量𝑋的具体分布,可求出𝑷值。具体地说: 左侧检验的𝑷值:𝑷=𝑃 𝑋<𝐶 右侧检验的𝑷值:𝑷=𝑃 𝑋>𝐶 双侧检验的𝑷值:𝑷=2𝑃 𝑋>𝐶 (当𝐶位于分布曲线的右端时) 或𝑷=2𝑃 𝑋<𝐶 (当𝐶位于分布曲线的左端时)。若𝑋服从正态分布和𝑡分布,其分布曲线是关于纵轴对称的,故其𝑷值可表示为𝑷=𝑃 𝑋 >𝐶

再次理解𝑷值 𝑷值是在原假设下,所有比当前观测事件更极端的事件发生的概率。 𝑷值就是拒绝原假设所需的最低显著性水平。 注意:这里的𝑷值是一种概率。

对𝑷值的陈述 𝑷值是在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率。也称为实际观察到的显著性水平。 实际检验时拒绝 𝐻 0 所犯错误的概率不一定有事先确定的𝛼那么大。以右侧检验为例,真正犯错误的概率是检验统计量落点以右的概率,这是实际观测到的显著性水平,将其称为假设检验的𝑷值。 根据数据信息来展示更为精确的显著性水平是有益处的。

总结: 𝑷值决策规则: 𝑷值越小,拒绝原假设的理由越充分。 𝑷<𝛼时,拒绝原假设; 𝑷>𝛼时,不拒绝原假设; 𝑷=𝛼时,重新抽样。

双侧检验的𝑷值

左侧检验的𝑷值

右侧检验的𝑷值

总结:假设检验的步骤 陈述原假设和备择假设; 从所研究的总体中抽出一个随机样本,确定一个适当的检验统计量,并利用样本数据算出其具体数值; 确定一个适当的显著性水平,并计算出其临界值,指定拒绝域; 将统计量的值与临界值进行比较,作出决策。 统计量的值落在拒绝域,拒绝 𝐻 0 ,否则不拒绝 𝐻 0 ; 也可以直接利用𝑷值作出决策。

假设检验的步骤(图示) 提出假设 𝐻 0 , 𝐻 1 选择统计量,确定 𝐻 0 为真时的抽样分布 根据决策要求确定𝛼 抽样获取样本值 计算检验统计量的数值 确定分布上的临界值𝐶和检验规则 比较并做出检验判断 返回5.1目录

5.2教学要求 熟练掌握一个总体的总体均值均值、总体比率的假设检验方法 掌握一个总体的总体方差的假设检验方法 会用Excel进行假设检验