第六章 假设检验的基本概念
假设检验在统计方法中的地位 统计方法 描述统计 统计推论 参数估计 假设检验
假设检验的概念 假设检验中的名词 假设检验中的小概率原理 假设检验的步骤 双侧检验和单侧检验 假设检验中的两类错误 9
一、假设检验的概念
什么是假设? 我认为该企业生产的零件的平均长度为4厘米! 对总体参数的一种看法 总体参数包括总体均值、成数、方差等 分析之前必需陈述
什么是假设检验? 概念 类型 特点 事先对总体参数或分布形式作出某种假设 然后利用样本信息来判断原假设是否成立 参数假设检验 非参数假设检验 采用逻辑上的反证法 依据统计上的小概率原理
二、假设检验中的名词
假设检验中的名词 原假设、备择假设 统计量 显著性水平 临界值、接受域、拒绝域 双边检验、单边检验
三、假设检验的基本原理: 小概率原理
假设检验的基本原理 小概率原理 什么小概率? 1. 在一次试验中,一个几乎不可能发生的事件发生的概率 1. 在一次试验中,一个几乎不可能发生的事件发生的概率 2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设 3. 小概率由研究者事先确定 a/2
四、假设检验的步骤
假设检验的步骤 提出原假设和备择假设 确定适当的检验统计量 规定显著性水平,求出拒绝域和临界值 计算检验统计量的值 作出统计判断
提出原假设和备择假设 什么是原假设?(Null Hypothesis) 1. 待检验的假设,又称“0假设” 为什么叫0假设? 什么是原假设?(Null Hypothesis) 1. 待检验的假设,又称“0假设” 2. 如果错误地作出决策会导致一系列后果 3. 总是有等号: , 或 4. 表示为 H0 H0: 某一数值 指定为 = 号,即 或 例如, H0: 3190(克)
提出原假设和备择假设 什么是备择假设?(Alternative Hypothesis) 1. 与原假设对立的假设 1. 与原假设对立的假设 2. 总是有不等号: , 或 3. 表示为 H1 H1: <某一数值,或 某一数值 例如, H1: < 3910(克),或 3910(克)
确定适当的检验统计量 什么是检验中的统计量? 1. 用于假设检验问题的统计量 2. 选择统计量的方法与参数估计相同,需考虑 1. 用于假设检验问题的统计量 2. 选择统计量的方法与参数估计相同,需考虑 是大样本还是小样本 总体方差已知还是未知 统计量的分布一般选择Z(正态)分布、t分布、F分布和x2分布 检验统计量的基本形式为
规定显著性水平 什么是显著性水平? 1. 是一个小概率值 2. 原假设为真时,拒绝原假设的概率 3. 表示为 (alpha) 1. 是一个小概率值 2. 原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域 3. 表示为 (alpha) 常用的 值有0.01, 0.05, 0.10 4. 由研究者事先确定
计算检验的统计量 利用样本数据,计算检验的统计量: Z值、t值、F值和x2值
作出统计判断 计算检验的统计量 根据给定的显著性水平,查表得出相应的临界值Z或Z/2和拒绝域 将检验统计量的值与 水平的临界值进行比较 得出接受或拒绝原假设的结论:若样本统计量的值落入拒绝域,则拒绝原假设,接受备择假设;否则,接受H0
五、双侧检验和单侧检验
双侧检验 (原假设与备择假设的确定) 拒绝域在统计分布的两侧 例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格 将“=”放在原假设H0中 例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格 建立的原假设与备择假设应为 H0: = 10 H1: 10
双侧检验 (显著性水平与拒绝域 ) 抽样分布 H0值 临界值 a/2 样本统计量 拒绝域 接受域 1 - 置信水平 Rejection region does NOT include critical value.
单侧检验 (原假设与备择假设的确定) 检验研究中的假设 先确立备择假设H1:将所研究的假设作为备择假设H1。或者说,把希望(想要)证明的假设作为备择假设 将认为研究结果是无效的说法或理论作为原假设H0。
左侧检验 (原假设与备择假设的确定) 例如,改进生产工艺后,会使产品的废品率降低到2%以下 建立的原假设与备择假设应为 H0: p 2% H1: p < 2% Rejection region does NOT include critical value.
左侧检验 (显著性水平与拒绝域 ) 抽样分布 a H0值 临界值 样本统计量 拒绝域 接受域 1 - 置信水平 观察到的样本统计量 Rejection region does NOT include critical value.
右侧检验 (原假设与备择假设的确定) 例如,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上 建立的原假设与备择假设应为 H0: 1500 H1: 1500 Rejection region does NOT include critical value.
右侧检验 (显著性水平与拒绝域 ) 抽样分布 a H0值 临界值 样本统计量 拒绝域 接受域 1 - 观察到的样本统计量 置信水平 Rejection region does NOT include critical value.
H0是受保护的假设,没有充分依据是否定不了的;因此,研究者通常把常规的、已经存在的现象写在受保护的原假设H0中, 双侧检验与单侧检验 (假设的形式) 假设 研究的问题 双侧检验 左侧检验 右侧检验 H0 m = m0 m m0 m m0 H1 m ≠m0 m < m0 m > m0 H0是受保护的假设,没有充分依据是否定不了的;因此,研究者通常把常规的、已经存在的现象写在受保护的原假设H0中, 9
六、假设检验中的两类错误 (决策风险)
假设检验中的两类错误 1. 第一类错误(弃真错误) 2. 第二类错误(取伪错误) 原假设为真时拒绝原假设 会产生一系列后果 1. 第一类错误(弃真错误) 原假设为真时拒绝原假设 会产生一系列后果 第一类错误的概率为 被称为显著性水平 2. 第二类错误(取伪错误) 原假设为假时接受原假设 第二类错误的概率为(Beta) 值是不固定的
错误和 错误的关系 增加样本量n,可以同时减少两类错误 一次抽样调查中,你不能同时减少两类错误! 和的关系就像翘翘板,小就大, 大就小 增加样本量n,可以同时减少两类错误
影响 错误的因素 1. 总体参数的真值 2. 显著性水平 3. 总体标准差 4. 样本容量 n - 0越小, 增大 1. 总体参数的真值 - 0越小, 增大 2. 显著性水平 当 减少时, 增大 3. 总体标准差 当 增大时, 增大 4. 样本容量 n 当 n 减少时, 增大