Download presentation
Presentation is loading. Please wait.
1
第5章 假设检验 会计学2011级 主讲:王红娜
2
本章内容 假设检验的基本思想 5.1 假设检验的基本问题 5.2 一个总体参数的检验 讨论:假设检验与区间估计
3
假设检验的基本思想——引例 某企业生产一种零件,过去资料表明其平均长度为4厘米,标准差为0.1厘米。改革工艺后,随机抽查了100个零件,测得样本平均长度为3.95厘米。问:工艺改革前后零件的长度是否发生了显著变化? 改革后零件的平均长度事先并不知道。可先假设为4厘米,然后利用样本的平均长度来检验假设是否正确。 这就是一个假设检验问题。
4
分析引例,原假设 𝐻 0 :𝜇= 𝜇 0 =4 若原假设成立,即工艺改革后零件长度没有显著变化,则样本均值 𝑥 服从正态分布,且样本均值 𝑥 为3.95。如果二者有显著差异,我们有理由认为样本不是取自均值为 𝜇 0 的总体,即认为工艺改革后零件长度不是 𝜇 0 。
5
换言之,应当确定一个区间,如 𝜇 0 −𝑘, 𝜇 0 +𝑘 ,如果样本取自均值为 𝜇 0 的总体,则只要是简单随机抽样,样本均值 𝑥 都应该以很大的概率落入此区间内。即 𝑥 落入此区间外的概率应该很小。一旦这个小概率事件 𝑋 − 𝜇 0 >𝑘 发生,人们必然怀疑原假设 𝐻 0 的真实性。
6
在解决实际问题时,人们事先指定一个小概率𝛼,如𝛼取0. 10,0. 05,0
在解决实际问题时,人们事先指定一个小概率𝛼,如𝛼取0.10,0.05,0.025等,使得当 𝐻 0 实际正确时否定 𝐻 0 的概率是𝛼。可由概率等式𝑃 𝑥 − 𝜇 0 >𝑘 𝐻 0 为真 =𝛼来确定常数𝑘,即误差范围。 基本思路: 首先假设 𝐻 0 成立,然后进行统计推断,如果导致一个不合理的现象发生,即小概率事件在一次抽样中发生了,则否定原假设 𝐻 0 ,这里运用的是“小概率事件在一次实验中几乎是不可能发生的”这一原则。
7
若取置信度为0.99,则𝛼=0.01, 𝑧 𝛼 2 =2.58 也就是说,如果原假设为真,则样本均值的标准化值 𝑧 > 𝑧 𝛼 2 发生了,即小概率事件 𝑧 >2.58 发生了,则拒绝 𝐻 0 。 本例计算结果: 𝑥 −𝜇 𝜎 𝑛 = 3.95− =5>2.58 说明小概率事件发生了,这是不合理的,应拒绝原假设。
8
小结 对未知总体作某种假设 样本观察结果 抽样检验 小概率事件发生 小概率事件未发生 拒绝 原假设 不拒绝
9
可见,假设检验的基本思想是——带有概率性质的反证法!
假设检验的两个特点: 其逻辑推理方法是反证法 判断结果合理与否,是基于“小概率事件不易发生”这一原理
10
5.1教学要求 能熟练陈述问题的假设 理解两类错误与显著性水平,理解两类错误之间的关系 理解检验统计量的构造方法,理解拒绝域的含义
理解𝑷值的含义,会用𝑷值进行决策判断
11
5.1 假设检验的基本问题 假设的陈述 一 二 两类错误与显著性水平 检验统计量与拒绝域 三 利用𝑷值进行决策 四 转到5.2
12
一、假设的陈述 什么是假设? 对总体参数的具体数值所作的陈述 总体参数包括总体均值、比率、方差等 分析之前必须陈述
我认为该企业生产的零件的平均长度为4厘米!
13
假设检验就是先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程。
假设检验包括参数检验和非参数检验两种方法。 假设检验逻辑上运用反证法,统计上依据小概率原理。
14
一个简单的例子 一名被告正在受法庭的审判,根据英国法律,先假设被告是无罪的,于是证明他有罪的责任就落在原告律师身上。用假设检验的术语就是要建立一个假设,记为 𝐻 0 :被告是无罪的,称为原假设或零假设。另一个可供选择的假设记作 𝐻 1 :被告是有罪的,称为备择假设或替代假设。法庭陪审团要审查各种证据,以确定原告律师是否证实了这些证据与“无罪”这一原假设不一致。如果陪审团员们认为证据与 𝐻 0 不一致,他们就拒绝该原假设而接受其备择假设 𝐻 1 ,即认为被告有罪。
15
反证法 如果一个人说他从来没有骂过人。他能够证明吗? 看来,企图肯定什么事物很难,而否定却要相对容易得多。这就是假设检验背后的哲学。
要证明他没有骂过人,他必须出示他从小到大每一时刻的录音录像,所有书写的东西等等,还要证明这些物证是完全的、真实的、没有间断的。这简直是不可能的。即使他找到一些证人,比如他的同学、家人和同事,那也只能够证明在那些证人在场的某些片刻,他没有被听到骂人。反过来,如果要证明这个人骂过人很容易,只要有一次被抓住就足够了。 看来,企图肯定什么事物很难,而否定却要相对容易得多。这就是假设检验背后的哲学。 科学往往是在否定中发展。
16
在假设检验中,一般要设立一个原假设(上面的“从来没骂过人”就是一个原假设);
而设立该假设的动机主要是企图利用人们掌握的反映现实世界的数据来找出假设与现实之间的矛盾,从而否定这个假设。
17
在多数统计教科书中(除理论探讨外),假设检验都是以否定原假设为目标。如否定不了,说明证据不足,无法否定原假设。但这并不等于原假设正确,而是“没有足够证据拒绝原假设”,因此“不能接受原假设”。
就像一两次没有听过他骂人还远不能证明他从来没有骂过人。
18
假设检验的过程:提出假设→抽取样本→作出决策
19
原假设(null hypothesis) 研究者想收集证据予以反对的假设,又称“0假设”,总是有符号“=”,“≤”或“≥”,表示为 𝐻 0
如: 𝐻 0 :𝜇=某一数值 例如: 𝐻 0 :𝜇=10𝑐𝑚
20
备择假设(alternative hypothesis)
研究者想收集证据予以支持的假设,也称“研究假设”,总是有符号“≠”,“<”或“>”,表示为 𝐻 1 𝐻 1 :𝜇<某一数值 或 𝜇>某一数值 例如: 𝐻 1 :𝜇<10𝑐𝑚 或 𝜇>10𝑐𝑚
21
提出假设(例题分析) 例1:一种零件的生产标准是直径应为10𝑐𝑚,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10𝑐𝑚,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设。 研究者想收集证据予以证明的假设应该是“生产过程不正常”。 建立的原假设和备择假设为: 𝐻 0 :𝜇=10𝑐𝑚 𝐻 1 :𝜇≠10𝑐𝑚
22
例2:某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设。
研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。 建立的原假设和备择假设为: 𝐻 0 :𝜇≥500 𝐻 1 :𝜇<500
23
例3:一家研究机构估计,某城市中家庭拥有汽车的比率超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设。
研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比率超过30%”。 建立的原假设和备择假设为: 𝐻 0 :𝜋≤30% 𝐻 1 :𝜋>30%
24
提出假设(结论与建议) 原假设和备择假设是一个完备事件组,而且相互对立 先确定备择假设,再确定原假设 等号“=”总是放在原假设上
在一项假设检验中,原假设和备择假设必有一个成立,且只有一个成立 先确定备择假设,再确定原假设 等号“=”总是放在原假设上 原假设的符号是“=”,“≤”或“≥” 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)
25
双侧检验与单侧检验 备择假设没有特定的方向性,并含有符号“≠”的假设检验,称为双侧检验或双尾检验(two-tailed test)
备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailed test) 备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验
26
双侧检验与单侧检验 ——假设的形式 假设 双侧检验 单侧检验 左侧检验 右侧检验 原假设 𝐻 0 :𝜇= 𝜇 0 𝐻 0 :𝜇≥ 𝜇 0
𝐻 0 :𝜇≤ 𝜇 0 备择假设 𝐻 0 :𝜇≠ 𝜇 0 𝐻 0 :𝜇< 𝜇 0 𝐻 0 :𝜇> 𝜇 0 返回5.1目录
27
二、两类错误与显著性水平 第Ⅰ类错误(弃真错误)
原假设为真时拒绝原假设(原假设为真,但由于样本的随机性,样本统计量落入拒绝域,使我们做出错误决策)。 小概率事件只是发生的概率很小,但并非绝对不发生。犯这类错误的概率就是小概率事件发生的概率,称为显著性水平,记为𝛼。
28
第Ⅱ类错误(取伪错误) 原假设为假时未拒绝原假设(原假设为假,但由于样本的随机性,样本统计量落入接受域,使我们做出错误决策)。
第Ⅱ类错误的概率记为𝛽。
29
假设检验中的两类错误—决策结果 假设检验就好像一场审判过程, 𝑯 𝟎 :无罪 统计检验过程 陪审团审判 裁决 实际情况 无罪 有罪 正确
𝑯 𝟎 检验 裁决 实际情况 𝑯 𝟎 为真 𝑯 𝟎 为假 未拒绝 𝑯 𝟎 正确决策(𝟏−𝜶) 第Ⅱ错误(𝜷) 拒绝 𝑯 𝟎 第Ⅰ错误(𝜶) 正确决策(𝟏−𝜷)
30
𝜶错误与𝜷错误的关系
32
小结 𝛼错误与𝛽错误此消彼长,但𝛼+𝛽≠1; 要同时减少𝛼与𝛽,须增大样本容量𝑛; 通常先控制犯𝛼错误的概率;
发生第Ⅰ类错误的概率被称为显著性水平,记为𝛼,是人们事先指定的犯第Ⅰ类错误的概率的最大允许值; 𝛽错误的概率不好控制,将“接受原假设”更倾向于说成“不拒绝原假设”。
33
显著性水平𝜶(significant level)
显著性水平是一个概率值 原假设为真时,检验统计量落在拒绝域的概率 表示为𝜶 常用的𝜶值有0.01, 0.05, 0.10 𝜶值由研究者事先确定。
34
假设检验中的小概率原理 什么小概率? 在一次试验中,一个几乎不可能发生的事件发生的概率;
在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设; 小概率的值由研究者事先确定。
35
专家视野 著名的英国统计学家Ronald Fisher在他的研究中常常使用的小概率标准为0.05。
作为一个普遍适用的原则,后来人们通常选择显著性水平为0.05,当然也可比它大一些或小一些。 较常用的显著性水平有: 𝜶=0.01,𝜶=0.05,𝜶=0.1 返回5.1目录
36
三、检验统计量与拒绝域 根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。
检验统计量实际上是总体参数的点估计量。 标准化的检验统计量: 标准化检验统计量= 点估计量−假设值 点估计量的抽样标准差 对样本统计量进行标准化的依据 原假设 𝐻 0 为真 点估计量的抽样分布
37
拒绝域与临界值 能够拒绝原假设的统计量的所有可能取值的集合称为拒绝域。在图上表现为由显著性水平𝛼所围成的区域。
拒绝域的大小与事先选定的显著性水平𝛼有一定关系:当样本量固定时,拒绝域的面积随𝛼的减小而减小。 根据给定的显著性水平𝛼确定的拒绝域的边界值,称为临界值(Critical Value)。
38
显著性水平和拒绝域——双侧检验
40
显著性水平和拒绝域——单侧检验
41
显著性水平和拒绝域——左侧检验
42
显著性水平和拒绝域——右侧检验
43
假设检验的结论是在给定的显著性水平下作出的。显著水平不同,对同一问题所下的结论可能完全相反。
上图中的蓝点: 在0.1的显著性水平下,拒绝原假设; 在0.05的显著性水平下,不拒绝原假设。
44
即使在同一显著性水平下,由于临界值是固定的,拒绝域也就固定了。
讨论: 𝑍 1 和 𝑍 2 谁拒绝原假设的理由更充分?也就是说谁犯拒真错误的概率更小?
45
由于𝛼> 𝑝 1 > 𝑝 2 ,显然, 𝑍 2 拒绝原假设的理由更充分,即 𝑍 2 犯拒真错误的概率更小。
由显著性水平𝛼的含义可知: 𝑃 𝑍≥ 𝑍 𝛼 =𝛼 由图可以观察到: 𝑃 𝑍≥ 𝑍 1 = 𝑝 1 𝑃 𝑍≥ 𝑍 2 = 𝑝 2 由于𝛼> 𝑝 1 > 𝑝 2 ,显然, 𝑍 2 拒绝原假设的理由更充分,即 𝑍 2 犯拒真错误的概率更小。
46
思考题 生产耐高温玻璃,至少要能抗住500℃高温而玻璃不变形,这时对产品质量检验所设立的假设为( )
生产耐高温玻璃,至少要能抗住500℃高温而玻璃不变形,这时对产品质量检验所设立的假设为( ) A 𝐻 0 :𝜇≥500℃ B 𝐻 0 :𝜇≤500℃ C 𝐻 0 :𝜇=500℃ D 𝐻 0 :𝜇≠500℃ 加工零件所使用的毛坯如果过短,加工出来的零件则达不到规定的标准长度μ0,对生产毛坯的模框进行检验,所采用的原假设应当为( ) A 𝜇= 𝜇 0 B 𝜇≥ 𝜇 0 C 𝜇≤ 𝜇 0 D 𝜇≠ 𝜇 0
47
思考题 在假设检验中,原假设 𝐻 0 ,备择假设 𝐻 1 ,则称( )为犯第二类错误。
在假设检验中,原假设 𝐻 0 ,备择假设 𝐻 1 ,则称( )为犯第二类错误。 A 𝐻 0 为真,接受 𝐻 1 B 𝐻 0 为真,拒绝 𝐻 1 C 𝐻 0 不真,接受 𝐻 0 D 𝐻 0 不真,拒绝 𝐻 0
48
思考题 在一次假设检验,当显著性水平为0.01时,原假设被拒绝,若用0.05的显著性水平去检验,则( )
在一次假设检验,当显著性水平为0.01时,原假设被拒绝,若用0.05的显著性水平去检验,则( ) A 一定会被拒绝 B 一定不会被拒绝 C 有可能拒绝原假设 D 需要重新检
49
思考题 设𝜶是显著性水平,𝛽是置信水平,若𝝀是统计量𝑇的临界值,则𝜶=𝑝( ),𝛽=𝑝( ) ;若 𝝀 1 、 𝝀 2 是统计量 χ 2 的临界值,且 𝝀 1 < 𝝀 2 ,则𝑝 χ 2 > 𝝀 2 =,𝑝 χ 2 < 𝝀 1 =。
50
决策规则 给定显著性水平𝛼,查表得出相应的临界值 𝑧 𝛼 或 𝑧 𝛼 2 , 𝑡 𝛼 或 𝑡 𝛼 2
给定显著性水平𝛼,查表得出相应的临界值 𝑧 𝛼 或 𝑧 𝛼 2 , 𝑡 𝛼 或 𝑡 𝛼 2 将检验统计量的值与𝛼水平的临界值进行比较 作出决策 双侧检验: 统计量 >临界值,拒绝 𝐻 0 左侧检验:统计量<−临界值,拒绝 𝐻 0 右侧检验:统计量>临界值,拒绝 𝐻 0 返回5.1目录
51
四、利用𝑷值进行决策 在原假设下,检验统计量沿着备择假设的方向取其实现值及更加极端值的概率称为𝑷值(𝑷-value)。
𝑷值反映实际数据与原假设 𝐻 0 之间不一致的程度。 如果得到很小的𝑷值,就意味着在原假设下小概率事件发生了。 如果小概率事件发生,是相信原假设,还是相信数据呢? 当然多半是相信数据,拒绝原假设。
52
到底𝑷值是多小的时候才能够拒绝原假设呢?也就是说,需要有什么是小概率的标准。
这要看具体应用的需要。但在一般的统计书和统计软件中,使用最多的标准是在原假设下(或原假设正确时),根据样本所得的数据来拒绝原假设的概率应小于0.05,当然也可能是0.01,0.005,0.001等等。 这种事先规定的概率即为显著性水平。
53
𝑷值的计算 一般地,用𝑋表示检验统计量,当 𝐻 0 为真时,可由样本数据计算出该统计量的样本统计值𝐶,根据检验统计量𝑋的具体分布,可求出𝑷值。具体地说: 左侧检验的𝑷值:𝑷=𝑃 𝑋<𝐶 右侧检验的𝑷值:𝑷=𝑃 𝑋>𝐶 双侧检验的𝑷值:𝑷=2𝑃 𝑋>𝐶 (当𝐶位于分布曲线的右端时) 或𝑷=2𝑃 𝑋<𝐶 (当𝐶位于分布曲线的左端时)。若𝑋服从正态分布和𝑡分布,其分布曲线是关于纵轴对称的,故其𝑷值可表示为𝑷=𝑃 𝑋 >𝐶
54
再次理解𝑷值 𝑷值是在原假设下,所有比当前观测事件更极端的事件发生的概率。 𝑷值就是拒绝原假设所需的最低显著性水平。
注意:这里的𝑷值是一种概率。
55
对𝑷值的陈述 𝑷值是在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率。也称为实际观察到的显著性水平。
实际检验时拒绝 𝐻 0 所犯错误的概率不一定有事先确定的𝛼那么大。以右侧检验为例,真正犯错误的概率是检验统计量落点以右的概率,这是实际观测到的显著性水平,将其称为假设检验的𝑷值。 根据数据信息来展示更为精确的显著性水平是有益处的。
56
总结: 𝑷值决策规则: 𝑷值越小,拒绝原假设的理由越充分。 𝑷<𝛼时,拒绝原假设; 𝑷>𝛼时,不拒绝原假设;
𝑷=𝛼时,重新抽样。
57
双侧检验的𝑷值
58
左侧检验的𝑷值
59
右侧检验的𝑷值
60
总结:假设检验的步骤 陈述原假设和备择假设; 从所研究的总体中抽出一个随机样本,确定一个适当的检验统计量,并利用样本数据算出其具体数值;
确定一个适当的显著性水平,并计算出其临界值,指定拒绝域; 将统计量的值与临界值进行比较,作出决策。 统计量的值落在拒绝域,拒绝 𝐻 0 ,否则不拒绝 𝐻 0 ; 也可以直接利用𝑷值作出决策。
61
假设检验的步骤(图示) 提出假设 𝐻 0 , 𝐻 1 选择统计量,确定 𝐻 0 为真时的抽样分布 根据决策要求确定𝛼 抽样获取样本值
计算检验统计量的数值 确定分布上的临界值𝐶和检验规则 比较并做出检验判断 返回5.1目录
62
5.2教学要求 熟练掌握一个总体的总体均值均值、总体比率的假设检验方法 掌握一个总体的总体方差的假设检验方法 会用Excel进行假设检验
Similar presentations