第八章 假设检验 本章重点: 1、正确建立零假设和备择假设 2、理解第一类错误和第二类错误 3、大样本情况下单个总体的假设检验

Slides:



Advertisements
Similar presentations
第一章 、随机事件与概率 1.1 、随机事件 1.2 、随机事件的概率 1.3 、随机事件概率的计算 1.4 、伯努利概型.
Advertisements

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
7.1 假设检验 1. 假设检验的基本原理 2. 假设检验的相关概念 3. 假设检验的一般步骤 4. 典型例题 5. 小结.
第四章 假设检验 第4.1节 假设检验的基本概念 第4.2节 正态总体均值与方差 的假设检验 第4.3节 非参数假设检验方法
07/16/96 概率统计 自考辅导.
第六章 样本及抽样分布 简单随机抽样: 代表性: 中每一个与所考察的总 体有相同的分布。 2.独立性: 是相互独立的随机变量。
10.2 立方根.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
第五讲 抽样分布与参数估计.
多元回归分析:推断 y = b0 + b1x1 + b2x bkxk + u 计量经济学导论 刘愿.
完全随机设计多样本资料秩和检验.
08-09冬季学期 概率论与数理统计 姜旭峰,胡玉磊.
第 8 章 假设检验 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学.
四种命题 2 垂直.
§6.3 假设检验的基本概念 我们将讨论不同于参数估计的另一类重要的统计推断问题. 这就是根据样本的信息检验关于总体的某个假设是否正确.
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
本讲义可在网址 或 ftp://math.shekou.com 下载
不确定度的传递与合成 间接测量结果不确定度的评估
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
第四章 抽样误差与假设检验 要求: 掌握:均数的抽样误差与标准误,t分 布的特征,t界值表,总体均数可信区间及其与参考值范围的区别。
区间估计 Interval Estimation.
信息技术与数学教学 华东师范大学数学系 万福永 第九讲 几种假设检验的Excel实现.
统计学期末复习
第6章 统计量及其抽样分布 统计量 关于分布的几个概念 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
§3.3 多元线性回归模型的统计检验 一、拟合优度检验 二、方程的显著性检验(F检验) 三、变量的显著性检验(t检验) 四、参数的置信区间.
Harvard ManageMentor®
混合离子络合滴定的最低允许PH值的计算 报告人:肖开炯.
第十章 方差分析.
数据统计与分析 秦 猛 南京大学物理系 手机: 第十讲 数据统计与分析 秦 猛 南京大学物理系 办公室:唐仲英楼A 手机:
第七章 参数估计 7.3 参数的区间估计.
若2002年我国国民生产总值为 亿元,如果 ,那么经过多少年国民生产总值 每年平均增长 是2002年时的2倍? 解:设经过 年国民生产总值为2002年时的2倍, 根据题意有 , 即.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
3.8.1 代数法计算终点误差 终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
第五节 对坐标的曲面积分 一、 对坐标的曲面积分的概念与性质 二、对坐标的曲面积分的计算法 三、两类曲面积分的联系.
完全随机设计多组资料的比较 赵耐青 卫生统计教研室.
第五章 多总体的统计检验.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第4章 Excel电子表格制作软件 4.4 函数(一).
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
一 测定气体分子速率分布的实验 实验装置 金属蒸汽 显示屏 狭缝 接抽气泵.
第4课时 绝对值.
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
第四节 实验数据的统计处理 分析化学的测定结果, 通常是用多次 重复测定的平均值 表示。测定的精密 度常用测定值的相对平均偏差 表示。
第四节 多个样本均数的两两比较 多个样本均数的两两比较又称多重比较(multiple comparison),其目的是推断究竟哪些总体均数之间存在差别。
分数再认识三 真假带分数的练习课.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
第八章 假设检验 8.1 假设检验的基本概念.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第十四章 假设检验 (Hypothesis Testing)
第八章 假设检验 8.3 两个正态总体参数的假设检验.
参数估计 参数估计问题:知道随机变量(总体)的分布类型, 但确切的形式不知道,根据样本来估计总体的参数,这 类问题称为参数估计。
单样本检验.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
数据的统计描述和分析 撰写:刘伟 董小刚 林玎 制作:李慧玲 李刚健 吉林建工学院基础科学系 2019/7/19.
第三节 数量积 向量积 混合积 一、向量的数量积 二、向量的向量积 三、向量的混合积 四、小结 思考题.
7.3 参数的区间估计 一、区间估计基本概念 二、正态总体均值与方差的区间估计 三、小结.
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
假设检验.
Presentation transcript:

第八章 假设检验 本章重点: 1、正确建立零假设和备择假设 2、理解第一类错误和第二类错误 3、大样本情况下单个总体的假设检验 第八章 假设检验 本章重点: 1、正确建立零假设和备择假设 2、理解第一类错误和第二类错误 3、大样本情况下单个总体的假设检验 4、区间估计与假设检验的关系 本章难点: 1、假设检验中的P值问题 2、小样本情况下的假设检验问题

STAT 实践中的统计 加入WTO之后,我国的企业面临着异常严重的挑战,汽车行业的形势尤为严峻。是挑战也是机遇,为了迎接挑战,国内汽车行业纷纷采取各种应对措施。A汽车集团公司对本公司的A1型号汽车的发动机系统进行了一系列改进,提高了启动速度,降低了噪音,改称为A2型。其中,公司关心的一个重要问题是汽车的节能性。节油是汽车的一个卖点,改进前的A1型汽车油耗较高,每百公里油耗为8.48升,公司希望改进后的车型比改进前节油,至少不比改进前更费油。

实践中的统计 为此,随机抽取了15辆A2型汽车做试验,测得15辆汽车的每百公里耗油量的数据如下表: 15辆汽车每百公里耗油量(单位:升) STAT 实践中的统计 为此,随机抽取了15辆A2型汽车做试验,测得15辆汽车的每百公里耗油量的数据如下表: 15辆汽车每百公里耗油量(单位:升) 其平均数为8.377。对此数据,技术部经理认为可以肯定改进后的汽车更省油。 8.50 8.75 8.33 8.21 8.52 8.30 8.31 8.19 8.40 8.86 8.41 8.01 8.20 8.26 8.39

STAT 实践中的统计 公司质量部经理对此结论有不同看法,他认为这个现象有可能是由抽样的随机性造成的,现在就下结论说改进后的汽车更省油还为时过早,应该对此问题作统计上的假设检验。质量部的张工程师刚通过国家质量工程师从业资格认证考试,学会了不少统计方法,质量部经理就派张工解决这个问题。通过简单的计算,很快张工就得到结论,他说,以现有的数据并不能认为改进前后汽车的油耗有明显变化。那么,张工是怎样作出他的统计分析结论的呢?

第一节 零假设和备择假设 一、对研究性假设的检验 STAT 如我们前面的案例就可以看成是一个研究性假设的例子。 第一节 零假设和备择假设 一、对研究性假设的检验 如我们前面的案例就可以看成是一个研究性假设的例子。 研究性假设是:改进后的车型更节油,即平均油耗低于8.48升。 通常,研究性假设作为备择假设。 则上例中我们可建立如下的零假设和备择假设:

STAT 二、对陈述正确性的检验 例:某饮料生产商声称他们生产的两升罐装饮料每一罐中平均至少有67.6盎司的量。为了检验该生产商的陈述,我们将抽取一个两升灌装饮料的样本,然后对其中所装饮料的量进行测量。 该问题即属于对陈述正确性的检验,一般地,我们都先假定生产商的陈述属正确的。 则上例中我们可建立如下的零假设和备择假设:

三、对决策情况下的检验 STAT 不管接受零假设还是接受备择假设,都须作出决策。 例:根据从刚刚收到的货物中所抽取的零件的样本,质量控制检验员就必须做出决策:是接受这批货物还是因为其不符合规格要求而向供应商退货。假定零件的平均长度是2英寸。 则上例中我们可建立如下的零假设和备择假设:

建立零假设和备择假设总结: 设 表示在零假设和备择假设中考虑的某一特定数值。一般来说,对总体均值的假设检验采取下面的三种形式之一: STAT 建立零假设和备择假设总结: 设 表示在零假设和备择假设中考虑的某一特定数值。一般来说,对总体均值的假设检验采取下面的三种形式之一:

第二节 第一类和第二类错误 STAT 第一类错误: 拒绝正确的原假设,简称“拒真”; 第二类错误 :接受错误的原假设,简称“纳伪” 总体情况 第二节 第一类和第二类错误 第一类错误: 拒绝正确的原假设,简称“拒真”; 第二类错误 :接受错误的原假设,简称“纳伪” 如下所示: 我们把两类错误发生的概率表示如下: α——第一类错误发生的概率; β——第二类错误发生的概率; 总体情况 结论 H0正确 H1错误 接受H0 正确结论 第二类错误 拒绝H1 第一类错误 正确结论

在实践中,我们通常确定允许犯第一类错误的概率的最大值,将其称为显著性水平。 可以选择α=0.05或α= 0.01。 STAT 在实践中,我们通常确定允许犯第一类错误的概率的最大值,将其称为显著性水平。 可以选择α=0.05或α= 0.01。

第三节 大样本情况下总体均值的单侧检验 STAT 1.建立零假设和备择假设。 例:联邦贸易委员会定期进行调查,目的是检验生产商们对自己产品的陈述。例如,大听的希尔托普(Hilltop)咖啡的标签标明:听内至少装有3磅的咖啡,我们用假设检验来检验标签的陈述是否正确。若抽取了36听咖啡作为样本。 步骤: 1.建立零假设和备择假设。 若根据样本计算出来的样本平均重量低于3磅,我们就可以怀疑零假设的正确性。究竟样本低到什么程度我们才可以认为对总体所作的假定是错误的呢?即愿意冒犯第一类错误的风险,错误地控告该公司违背了标签的陈述。 这将取决于决策者的态度。

当n=36时,样本均值服从正态分布,我们可以用 统计量 的取值来衡量样本均值偏离总体均值的程度。 STAT 当n=36时,样本均值服从正态分布,我们可以用 统计量 的取值来衡量样本均值偏离总体均值的程度。 我们先考察 的情况,下图表明观察到的样本均值低于总体均值的1.645倍标准差的概率是0.05。如果FTC认为,犯第一类错误的概率为0.05是可以接受的,那么,只要统计量z的值显示样本均值低于总体均值的1.645倍的标准差以上,我们就可以拒绝零假设。也就是

STAT 3 图1 样本均值低于总体均值的1.645倍的标准差的概率

在进行检验之前,我们要确定犯第一类错误的最大允许概率,即显著性水平。 STAT 在进行检验之前,我们要确定犯第一类错误的最大允许概率,即显著性水平。 在上例中,假定FTC的检验计划的主管人员作出了下列陈述:如果公司的产品重量符合技术规格的要求 ,我们就有99%的概率不对该公司采取不利的行动。当我们控告该公司的产品重量不足时,我们愿意冒的犯这类错误的风险的概率是1%。 可以推定, 。查标准正态分布表,可得临界值为2.33。

若根据样本均值计算得Z值小于-2.33,就可以拒绝零假设,接受备择假设。 称 STAT 若根据样本均值计算得Z值小于-2.33,就可以拒绝零假设,接受备择假设。 称 假定根据36个听装咖啡样本计算出的均值 ,又根据以前的研究,我们知道总体的标准差 ,计算z值:

如果 ,犯第一类错误的概率比 时犯第一类错的概率小。检验统计量的值在拒绝域内出现的可能性更大。 STAT 若 ,则统计量的值 如果 ,犯第一类错误的概率比 时犯第一类错的概率小。检验统计量的值在拒绝域内出现的可能性更大。 所以,确定检验的临界值时,只要假定 可以了。

总结 在大样本情况下,无论总体标准差已知或未知,样本均值总是服从正态分布,则可归纳左侧检验的一般步骤: STAT 一、单个总体均值的单侧假设检验 总结 在大样本情况下,无论总体标准差已知或未知,样本均值总是服从正态分布,则可归纳左侧检验的一般步骤: 1、建立零假设和备择假设 2、确定检验统计量,并计算其值 3、根据事先确定的显著性水平,查标准正态分布表得临界值 4、拒绝规则:

STAT 同理,在大样本情况下,右侧检验的一般步骤: 1、建立零假设和备择假设 2、确定检验统计量,并计算其值 3、根据事先确定的显著性水平,查标准正态分布表得临界值 4、拒绝规则:

STAT 例:某市的一家公司生产一种新型的轮胎,这种新型轮胎的设计规格是平均行驶里程至少为28000英里。随机抽取了30只轮胎作为一个样本进行检验,结果,样本均值是27500英里,样本标准差是1000英里。采用0.05的显著性水平,检验是否有足够的证据拒绝轮胎的平均行驶里程至少为28000英里的陈述。 解:已知 1、建立零假设和备择假设

STAT 2、确定检验统计量,并计算其值 3、 4、

二、 P值的作用 STAT P值是指观察到的样本均值小于或等于观察值的概率。也可以称为观测的显著性水平。 我们已经给出检验统计量的值z=-2.67,查标准正态分布表,可以求出在均值与z=-2.67之间的区域面积是0.4962。由此得到样本均值小于或等于观察值 的概率是0.5000-0.4962=0.0038,即P值就是0.0038。

P值可以用来进行假设检验的决策,如果P值比显著性水平小,则检验统计量的值就在拒绝域内,若更大,则落入接受域内。上例中,P=0.0038, STAT P值可以用来进行假设检验的决策,如果P值比显著性水平小,则检验统计量的值就在拒绝域内,若更大,则落入接受域内。上例中,P=0.0038, 假设检验的P值标准

第四节 大样本情况下总体均值的双侧检验 STAT 一、双侧检验 例:根据美国高尔夫球协会的准则,只有射程和滚动距离平均正好是280码的高尔夫球可在比赛中使用。假定某公司最近开发了一种高技术生产方法,用这种方法生产的高尔夫球的射程和滚动距离平均为280码。现在抽取一个由36个高尔夫球的随机样本来检验该公司的陈述是否为真。数据如下表。(假定在显著性水平为0.05的条件下进行)。 269 301 296 275 282 276 284 272 263 300 295 265 286 260 285 264 268 288 271 270 293 299 273 278 279 266 274 277 281 291

该问题就是一个双侧检验的例子。 STAT 先建立如下的零假设和备择假设: 在大样本的情况下,仍然选择统计量Z, 和单侧检验不同的是,此时的拒绝域分布在正态曲线的两侧,对应的概率均为 。查表时应该查 对应的临界值

上例中,依据表中资料可计算得, 则统计量的值为 根据给定的显著性水平 STAT 上例中,依据表中资料可计算得, 则统计量的值为 根据给定的显著性水平

STAT 归纳:在大样本情况下,双侧检验的一般步骤: 1、建立零假设和备择假设 2、确定检验统计量,并计算其值 3、根据事先确定的显著性水平,查标准正态分布表得临界值 4、拒绝规则:

STAT 二、双侧检验的P值 对于前面关于高尔夫球的例子,我们已知对应样本均值 的z值是-0.75,从标准正态分布表可以查到,在均值和z值-0.75之间的面积是0.2734。因此,左侧的面积为0.2266,而此时左侧的拒绝域内的面积为 =0.025。0.2266>0.025,统计量不在拒绝域内,不能拒绝零假设,与前的结论相同。 P值为z值对应一侧面积的2倍。 此时,判断的标准仍然是

在大样本的情况下,给定置信水平 的总体均值的置信区间为: 进行假设检验时,首先需要对总体的参数作出假定: 双侧检验 STAT 三、 区间估计和假设检验的关系 在大样本的情况下,给定置信水平 的总体均值的置信区间为: 进行假设检验时,首先需要对总体的参数作出假定: 双侧检验 (1)

因此,双侧假设检验的样本均值的非拒绝区域可以由下式给出: 双侧假设检验的非拒绝域和置信区间之间的关系: STAT 因此,双侧假设检验的样本均值的非拒绝区域可以由下式给出: 双侧假设检验的非拒绝域和置信区间之间的关系: (2)

由此得到由置信区间方法到假设检验的运算过程: STAT 由此得到由置信区间方法到假设检验的运算过程: 假设的形式: (1)从总体中抽取一个简单随即样本构建总体均值的置信区间: (2)如果置信区间包含假定的 值,则不拒绝零假设 。 否则,拒绝

例:仍然采用前述关于高尔夫球的双侧检验的例子: 根据样本数据我们已经计算得到: 对于给定的置信水平 可以得到总体均值的95%的置信区间为: STAT 例:仍然采用前述关于高尔夫球的双侧检验的例子: 根据样本数据我们已经计算得到: 对于给定的置信水平 可以得到总体均值的95%的置信区间为: 即274.58~282.42 总体均值的假设值 在这个区间,所以我们不能拒绝零假设。

STAT 第五节 小样本情况下总体均值检验 在区间估计中我们已经知道,当总体服从正态分布且总体方差未知时,小样本下的统计量 这时对总体均值的检验就应该采用t统计量来进行。 例:如果机场的总体平均质量等级得分大于或等于7分,那么就可以认为该机场提供的服务质量为优良。现随机抽取了12个乘客作为样本,得到伦敦某机场的质量等级分数如下:7、8、10、8、6、9、6、7、7、8、9、8。假定总体的等级近似服从标准正态分布,在0.05的显著性水平下可以认为该机场服务质量优良吗?

1.建立零假设和备择假设 2.选择统计量t,并计算 3. 4. STAT 1.建立零假设和备择假设 2.选择统计量t,并计算 3. 4.

注意:小样本的情况下的检验步骤与判断准则与大样本情况下的基本相同,唯一的不同是小样本对应 t分布,而大样本对应正态分布。 STAT 注意:小样本的情况下的检验步骤与判断准则与大样本情况下的基本相同,唯一的不同是小样本对应 t分布,而大样本对应正态分布。 另外,小样本下也可以运用P值来判断,但是由于t分布的表编制不很详细,不能通过查表来准确计算P值,但是判断的原则依然与前相同,

STAT 第六节 总体比例的检验 左侧检验 右侧检验 双侧检验

由于比例是特殊的均值,因此对比例进行检验的步骤及判断准则与对均值的检验相同,只需要检验统计量中的均值换成比例对应的指标就可。 STAT 我们只考虑 的情况下,样本比例服从正态分布下的总体比例的假设检验。 由于比例是特殊的均值,因此对比例进行检验的步骤及判断准则与对均值的检验相同,只需要检验统计量中的均值换成比例对应的指标就可。 例:在过去的几个月中,在松树溪打高尔夫球的人中有20%是女性。为了提高女性高尔夫球手的比例,球场采取了一项特殊的激励措施来吸引女性。一周以后,随机抽取了400名球手作为一个样本,结果有300名男性和100名女性。课程经理想知道这些数据是否支持他们的结论:松树溪的女性高尔夫球手的比例有所增加。

解:已知 1、建立零假设和备择假设 2、确定检验统计量,并计算其值 3、 4、 STAT 解:已知 1、建立零假设和备择假设 2、确定检验统计量,并计算其值 3、 4、

STAT 同样,我们可以计算该检验的P值,已知z=2.50,标准正态分布表显示均值与2.5之间的面积为0.4938,则P=0.5000-0.4938=0.0062。小于显著性水平0.05,拒绝零假设。 以下是关于本章内容的总结:

总体均值的检验 总结:单个总体的假设检验 H1: 条件 检验条件量 H0、H1 拒绝域 (1)H0: H1: 正态总体σ2已知 z 正态总体σ2已知 (2) H0: H1: z (3 )H0: H1: z

总体均值的检验 条件 检验条件量 H0、H1 拒绝域 (1) H0: H1: t 正态总体σ2未知(n<30) (2) H0: H1: t 正态总体σ2未知(n<30) (2) H0: H1: t (3) H0: H1: t

总体均值的检验 条件 检验条件量 H0、H1 拒绝域 (1) H0: H1: z 非正态总体n≥30 σ2已知或未知 (2) H0: H1: 非正态总体n≥30 σ2已知或未知 (2) H0: H1: z (3) H0: H1: z

总体成数的检验 条件 检验条件量 H0、H1 拒绝域 (1) H0:P=P0 H1:P≠P0 z np≥5 nq≥5 (2) H0:P≤P0 np≥5 nq≥5 (2) H0:P≤P0 H1:P>P0 z (3) H0:P≥P0 H1:P<P0 z