第 8 章 假设检验 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学.

Slides:



Advertisements
Similar presentations
第一章 、随机事件与概率 1.1 、随机事件 1.2 、随机事件的概率 1.3 、随机事件概率的计算 1.4 、伯努利概型.
Advertisements

第五章 假设检验 Hypothesis Testing 数理统计课题组. 本章大纲 1. 假设检验的基本概念 2.Neyman-Pearson 范式 3. 和假设检验有关的两个问题 4. 广义似然比检验 5. 单样本检验的几个实例 6. 两个样本的比较 7. 实验设计.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
7.1 假设检验 1. 假设检验的基本原理 2. 假设检验的相关概念 3. 假设检验的一般步骤 4. 典型例题 5. 小结.
第四章 假设检验 第4.1节 假设检验的基本概念 第4.2节 正态总体均值与方差 的假设检验 第4.3节 非参数假设检验方法
07/16/96 概率统计 自考辅导.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
第三章 区间估计与假设检验 3.1 区间估计与假设检验的基本概念 3.2 总体均值的区间估计与假设检验的SAS实现
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
第五讲 抽样分布与参数估计.
多元回归分析:推断 y = b0 + b1x1 + b2x bkxk + u 计量经济学导论 刘愿.
完全随机设计多样本资料秩和检验.
08-09冬季学期 概率论与数理统计 姜旭峰,胡玉磊.
常用逻辑用语复习课 李娟.
§6.3 假设检验的基本概念 我们将讨论不同于参数估计的另一类重要的统计推断问题. 这就是根据样本的信息检验关于总体的某个假设是否正确.
第六章 假设检验的基本概念.
第八章 假设检验 本章重点: 1、正确建立零假设和备择假设 2、理解第一类错误和第二类错误 3、大样本情况下单个总体的假设检验
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
本讲义可在网址 或 ftp://math.shekou.com 下载
不确定度的传递与合成 间接测量结果不确定度的评估
第四章 抽样误差与假设检验 要求: 掌握:均数的抽样误差与标准误,t分 布的特征,t界值表,总体均数可信区间及其与参考值范围的区别。
区间估计 Interval Estimation.
信息技术与数学教学 华东师范大学数学系 万福永 第九讲 几种假设检验的Excel实现.
统计学期末复习
第6章 统计量及其抽样分布 统计量 关于分布的几个概念 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布
一元线性回归(二).
第十章 兩母體之假設檢定 Inferences Based on Two-Samples:
§3.3 多元线性回归模型的统计检验 一、拟合优度检验 二、方程的显著性检验(F检验) 三、变量的显著性检验(t检验) 四、参数的置信区间.
第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
第十章 方差分析.
第八章 均值之差的推断 本章内容 8.1 两个总体均值之差推断的基本内容 8.2 独立样本均值之差检验 8.3 两总体方差差异检验
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
数据统计与分析 秦 猛 南京大学物理系 手机: 第十讲 数据统计与分析 秦 猛 南京大学物理系 办公室:唐仲英楼A 手机:
连续型随机变量及其概率密度 一、概率密度的概念与性质 二、常见连续型随机变量的分布 三、小结.
第七章 参数估计 7.3 参数的区间估计.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第四章 一次函数 4. 一次函数的应用(第1课时).
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第4章 Excel电子表格制作软件 4.4 函数(一).
iSIGHT 基本培训 使用 Excel的栅栏问题
3.1 变化率与导数   3.1.1 变化率问题 3.1.2 导数的概念.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第4课时 绝对值.
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
第八章 假设检验 8.1 假设检验的基本概念.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
第 6 章 统计量及其抽样分布 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学.
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
滤波减速器的体积优化 仵凡 Advanced Design Group.
第十四章 假设检验 (Hypothesis Testing)
第八章 假设检验 8.3 两个正态总体参数的假设检验.
参数估计 参数估计问题:知道随机变量(总体)的分布类型, 但确切的形式不知道,根据样本来估计总体的参数,这 类问题称为参数估计。
Sampling Error and Hypothesis Test
单样本检验.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
二、配对样本t检验 配对设计(paired design)定义:将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理,称为随机配对设计。
7.3 参数的区间估计 一、区间估计基本概念 二、正态总体均值与方差的区间估计 三、小结.
假设检验.
Presentation transcript:

第 8 章 假设检验 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学

8.1 假设检验的基本问题 8.2 一个总体参数的检验 8.3 两个总体参数的检验 8.4 假设检验中的其他问题 第 8 章 假设检验 8.1 假设检验的基本问题 8.2 一个总体参数的检验 8.3 两个总体参数的检验 8.4 假设检验中的其他问题

学习目标 了解假设检验的基本思想 掌握假设检验的步骤 对实际问题作假设检验 利用置信区间进行假设检验 利用P - 值进行假设检验 As a result of this class, you will be able to ...

8.1 假设检验的基本问题 8.1.1 假设问题的提出 8.1.2 假设的表达式 8.1.3 两类错误 8.1.4 假设检验的流程 8.1 假设检验的基本问题 8.1.1 假设问题的提出 8.1.2 假设的表达式 8.1.3 两类错误 8.1.4 假设检验的流程 8.1.5 利用P值进行决策 8.1.6 单侧检验 9

假设问题的提出

什么是假设? (hypothesis)  对总体参数的的数值所作的一种陈述 总体参数包括总体均值、比例、方差等 分析之前必需陈述 我认为该地区新生婴儿的平均体重为3190克!  对总体参数的的数值所作的一种陈述 总体参数包括总体均值、比例、方差等 分析之前必需陈述

什么是假设检验? (hypothesis testing) 事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立 有参数假设检验和非参数假设检验 采用逻辑上的反证法,依据统计上的小概率原理

提出原假设和备择假设  什么是原假设?(null hypothesis) 待检验的假设,又称“0假设” 研究者想收集证据予以反对的假设 3. 总是有等号 ,  或 4. 表示为 H0 H0:  某一数值 指定为 = 号,即  或  例如, H0:  3190(克)

提出原假设和备择假设  什么是备择假设?(alternative hypothesis) 与原假设对立的假设,也称“研究假设” 研究者想收集证据予以支持的假设总是有不等号: , 或  表示为 H1 H1: <某一数值,或 某一数值 例如, H1: < 3910(克),或 3910(克)

假设检验中的两类错误 (决策风险)

假设检验中的两类错误 1. 第一类错误(弃真错误) 2. 第二类错误(取伪错误) 原假设为真时拒绝原假设 会产生一系列后果 1. 第一类错误(弃真错误) 原假设为真时拒绝原假设 会产生一系列后果 第一类错误的概率为 被称为显著性水平 2. 第二类错误(取伪错误) 原假设为假时接受原假设 第二类错误的概率为(Beta)

 错误和  错误的关系   你不能同时减少两类错误! 和的关系就像翘翘板,小就大, 大就小

假设检验的流程 提出假设 确定适当的检验统计量 规定显著性水平 计算检验统计量的值 作出统计决策

确定适当的检验统计量  什么是检验统计量? 1. 用于假设检验决策的统计量 2. 选择统计量的方法与参数估计相同,需考虑 1. 用于假设检验决策的统计量 2. 选择统计量的方法与参数估计相同,需考虑 是大样本还是小样本 总体方差已知还是未知 检验统计量的基本形式为

规定显著性水平 (significant level)  什么是显著性水平? 1. 是一个概率值 2. 原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域 3. 表示为 (alpha) 常用的 值有0.01, 0.05, 0.10 4. 由研究者事先确定

作出统计决策 计算检验的统计量 根据给定的显著性水平,查表得出相应的临界值z或z/2, t或t/2 将检验统计量的值与 水平的临界值进行比较 得出拒绝或不拒绝原假设的结论

利用P值进行决策

什么是P 值? (P-value) 是一个概率值 如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率 被称为观察到的(或实测的)显著性水平 H0 能被拒绝的最小值

双侧检验的P 值 / 2 Z 拒绝 H0值 临界值 计算出的样本统计量 1/2 P 值

左侧检验的P 值 抽样分布 a H0值 临界值 样本统计量 拒绝域 1 -  置信水平 计算出的样本统计量 P 值 Rejection region does NOT include critical value.

右侧检验的P 值 抽样分布 a 置信水平 拒绝域 1 -  H0值 临界值 计算出的样本统计量 P 值 Rejection region does NOT include critical value.

利用 P 值进行检验 (决策准则) 单侧检验 双侧检验 若p-值 > ,不拒绝 H0 若p-值 < , 拒绝 H0

双侧检验和单侧检验

双侧检验与单侧检验 (假设的形式) m = m0 m  m0 m  m0 m ≠m0 m < m0 m > m0 假设 双侧检验与单侧检验 (假设的形式) 假设 研究的问题 双侧检验 左侧检验 右侧检验 H0 m = m0 m  m0 m  m0 H1 m ≠m0 m < m0 m > m0 9

双侧检验 (原假设与备择假设的确定) 属于决策中的假设检验 不论是拒绝H0还是不拒绝H0,都必需采取相应的行动措施 例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格 我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立 建立的原假设与备择假设应为 H0:  = 10 H1:   10

双侧检验 (显著性水平与拒绝域 ) 抽样分布 H0值 临界值 a/2 样本统计量 拒绝域 1 -  置信水平 Rejection region does NOT include critical value.

单侧检验 (显著性水平与拒绝域) 抽样分布 a H0值 临界值 样本统计量 拒绝域 1 -  置信水平 Rejection region does NOT include critical value.

8.2 一个总体参数的检验 8.2.1 检验统计量的确定 8.2.2 总体均值的检验 8.2.3 总体比例的检验 8.2.4 总体方差的检验 8.2 一个总体参数的检验 8.2.1 检验统计量的确定 8.2.2 总体均值的检验 8.2.3 总体比例的检验 8.2.4 总体方差的检验 9

一个总体参数的检验 Z 检验 (单尾和双尾) t 检验 2检验 均值 一个总体 比例 方差

总体均值检验

总体均值的检验 (检验统计量) 是 z 检验 样本量n 否 总体 是否已知? z 检验 大 用样本标 准差S代替 t 检验 小

总体均值的检验 (2 已知或2未知大样本) 1. 假定条件 使用Z-统计量 总体服从正态分布 总体均值的检验 (2 已知或2未知大样本) 1. 假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 使用Z-统计量 2 已知: 2 未知:

2 已知均值的检验 (例题分析) 【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为= 0.025 。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(=0.05) 双侧检验

2 已知均值的检验 (例题分析) H0:  = 0.081 检验统计量: H1:   0.081  = 0.05 n = 200 2 已知均值的检验 (例题分析) H0:  = 0.081 H1:   0.081  = 0.05 n = 200 临界值(s): 检验统计量: 决策: 在  = 0.05的水平上拒绝H0 Z 1.96 -1.96 .025 拒绝 H0 结论: 有证据表明新机床加工的零件的椭圆度与以前有显著差异

2 已知均值的检验 (P 值的计算与应用) 第1步:进入Excel表格界面,选择“插入”下拉菜单 第2步:选择“函数”点击 第3步:在函数分类中点击“统计”,在函数名的菜 单下选择字符“NORMSDIST”然后确定 第4步:将Z的绝对值2.83录入,得到的函数值为 0.997672537 P值=2(1-0.997672537)=0.004654 P值远远小于,故拒绝H0

2 已知均值的检验 (小样本例题分析) 【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N~(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(=0.05) 单侧检验

2 已知均值的检验 (小样本例题分析) H0:   1020 检验统计量: H1:  > 1020  = 0.05 2 已知均值的检验 (小样本例题分析) H0:   1020 H1:  > 1020  = 0.05 n = 16 临界值(s): 检验统计量: 决策: 在  = 0.05的水平上拒绝H0 Z 拒绝域 0.05 1.645 结论: 有证据表明这批灯泡的使用寿命有显著提高

2 未知大样本均值的检验 (例题分析) 【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准? (=0.05) 单侧检验

2 未知大样本均值的检验 (例题分析) H0:   1200 检验统计量: H1:  >1200  = 0.05 2 未知大样本均值的检验 (例题分析) H0:   1200 H1:  >1200  = 0.05 n = 100 临界值(s): 检验统计量: 决策: 在  = 0.05的水平上不拒绝H0 Z 拒绝域 0.05 1.645 结论: 不能认为该厂生产的元件寿命显著地高于1200小时

总体均值的检验 (2未知小样本) 1. 假定条件 总体为正态分布 2未知,且小样本 2. 使用t 统计量

2 未知小样本均值的检验 (例题分析) 【例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。 双侧检验

2 未知小样本均值的检验 (例题分析) H0:  = 5 检验统计量: H1:   5  = 0.05 2 未知小样本均值的检验 (例题分析) H0:  = 5 H1:   5  = 0.05 df = 10 - 1 = 9 临界值(s): 检验统计量: 决策: 在  = 0.05的水平上拒绝H0 t 2.262 -2.262 .025 拒绝 H0 结论: 说明该机器的性能不好

2 未知小样本均值的检验 (P 值的计算与应用) 第1步:进入Excel表格界面,选择“插入”下拉菜单 第2步:选择“函数”点击,并在函数分类中点击“统 计” ,然后,在函数名的菜单中选择字符 “TDIST”,确定 第3步:在弹出的X栏中录入计算出的t值3.16 在自由度(Deg-freedom)栏中录入9 在Tails栏中录入2,表明是双侧检验(单测 检验则在该栏内录入1) P值的结果为0.01155<0.025,拒绝H0

2 未知小样本均值的检验 (例题分析) 【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?( = 0.05) 单侧检验!

均值的单尾 t 检验 (计算结果) H0:   40000 检验统计量: H1:  < 40000  = 0.05 df = 20 - 1 = 19 临界值(s): 检验统计量: 决策: -1.7291 t 拒绝域 .05 在 = 0.05的水平上不拒绝H0 结论: 不能认为制造商的产品同他所说的标准不相符

总体比例的检验 (Z 检验)

一个总体比例检验 假定条件 有两类结果 总体服从二项分布 可用正态分布来近似 比例检验的 Z 统计量 0为假设的总体比例

一个总体比例的检验 (例题分析) 【例】一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(= 0.05) 双侧检验

一个总体比例的检验 (例题分析) H0:  = 14.7% 检验统计量: H1:   14.7%  = 0.05 n = 400 一个总体比例的检验 (例题分析) H0:  = 14.7% H1:   14.7%  = 0.05 n = 400 临界值(s): 检验统计量: 决策: Z 1.96 -1.96 .025 拒绝 H0 在 = 0.05的水平上不拒绝H0 结论: 该市老年人口比重为14.7%

总体方差的检验 (2 检验)

方差的卡方 (2) 检验 检验一个总体的方差或标准差 假设总体近似服从正态分布 检验统计量 样本方差 假设的总体方差

方差的卡方 (2) 检验 (例题分析) 0.3 -0.4 -0.7 1.4 -0.6 -0.3 -1.5 0.6 -0.9 1.3 【例】某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000cm3),得到如下结果。检验该机器的性能是否达到设计要求 (=0.05) 0.3 -0.4 -0.7 1.4 -0.6 -0.3 -1.5 0.6 -0.9 1.3 -1.3 0.7 1 -0.5 -0.2 -1.9 1.1 绿色 健康饮品 绿色 健康饮品 双侧检验

方差的卡方 (2) 检验 (例题分析)  H0: 2 = 1 统计量: H1: 2  1  = 0.05 df = 25 - 1 = 24 临界值(s): 统计量: 决策:  2 39.36 12.40  /2 =.05 在  = 0.05的水平上不拒绝H0 结论: 不能认为该机器的性能未达到设计要求

8.3 两个总体参数的检验 8.3.1 检验统计量的确定 8.3.2 两个总体均值之差的检验 8.3.3 两个总体比例之差的检验 8.3 两个总体参数的检验 8.3.1 检验统计量的确定 8.3.2 两个总体均值之差的检验 8.3.3 两个总体比例之差的检验 8.3.4 两个总体方差比的检验 8.3.5 检验中的匹配样本 9

两个正态总体参数的检验 两个总体的检验 Z 检验 (大样本) t 检验 (小样本) F 检验 独立样本 配对样本 均值 比例 方差

独立样本总体均值之差的检验

两个总体均值之差的检验 (12、 22 已知) 1. 假定条件 检验统计量为 两个样本是独立的随机样本 两个总体都是正态分布 两个总体均值之差的检验 (12、 22 已知) 1. 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 若不是正态分布, 可以用正态分布来近似(n130和 n230) 检验统计量为

两个总体均值之差的检验 (假设的形式) 假设 H0  1 – 2 = 0  1 – 2  0  1 – 2  0 H1 两个总体均值之差的检验 (假设的形式) 假设 研究的问题 没有差异 有差异 均值1  均值2 均值1 < 均值2 均值1  均值2 均值1 > 均值2 H0  1 – 2 = 0  1 – 2  0  1 – 2  0 H1  1 – 20  1 – 2 < 0  1 – 2 > 0 9

两个总体均值之差的检验 (例题分析) 【例】有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本量分别为n1=32,n2=40,测得x1= 50公斤,x2= 44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别? ( = 0.05) 双侧检验!

两个总体均值之差的检验 (例题分析) H0: 1- 2 = 0 检验统计量: H1: 1- 2  0  = 0.05 两个总体均值之差的检验 (例题分析) H0: 1- 2 = 0 H1: 1- 2  0  = 0.05 n1 = 32,n2 = 40 临界值(s): 检验统计量: 决策: 在  = 0.05的水平上拒绝H0 Z 1.96 -1.96 .025 拒绝 H0 结论: 有证据表明两种方法生产的产品其抗拉强度有显著差异

两个总体均值之差的检验 (12、 22 未知且不相等,小样本) 两个总体均值之差的检验 (12、 22 未知且不相等,小样本) 检验具有不等方差的两个总体的均值 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知且不相等12 = 22 检验统计量 其中:

两个总体均值之差的检验 (12、 22 未知但相等,小样本) 两个总体均值之差的检验 (12、 22 未知但相等,小样本) 检验具有等方差的两个总体的均值 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知但相等12 22 检验统计量

两个总体均值之差的检验 (例题分析) 【例】 “多吃谷物,将有助于减肥。”为了验证这个假设,随机抽取了35人,询问他们早餐和午餐的通常食谱,根据他们的食谱,将其分为二类,一类为经常的谷类食用者(总体1),一类为非经常谷类食用者(总体2)。然后测度每人午餐的大卡摄取量。经过一段时间的实验,得到如下结果:检验该假设 ( = 0.05) 单侧检验

两个总体均值之差的检验 (例题分析—用统计量进行检验) 两个总体均值之差的检验 (例题分析—用统计量进行检验) H0: 1- 2  0 H1: 1- 2 < 0  = 0.05 n1 = 15,n2 = 20 临界值(s): 检验统计量: 决策: 在  = 0.05的水平上拒绝H0 -1.694 t 拒绝域 .05 结论: 没有证据表明多吃谷物将有助于减肥

两个总体均值之差的检验 (例题分析—用Excel进行检验) 第1步:选择“工具”下拉菜单,并选择“数据分析”选项 第2步:选择“t检验,双样本异方差假设” 第3步:当出现对话框后 在“变量1的区域”方框内键入数据区域 在“变量2的区域”方框内键入数据区域 在“假设平均差”的方框内键入0 在“α(A)”框内键入0.05 在“输出选项”中选择输出区域 选择“确定”

两个匹配(或配对)样本的均值检验

两个总体均值之差的检验 (匹配样本的 t 检验) 1. 检验两个总体的均值 配对或匹配 重复测量 (前/后) 3. 假定条件 两个总体都服从正态分布 如果不服从正态分布,可用正态分布来近似 (n1  30 , n2  30 )

匹配样本的 t 检验 (假设的形式) 假设 H0 mD = 0 mD  0 mD  0 H1 mD  0 mD< 0 研究的问题 没有差异 有差异 总体1  总体2 总体1 < 总体2 总体1 > 总体2 H0 mD = 0 mD  0 mD  0 H1 mD  0 mD< 0 mD > 0 注:Di = X1i - X2i ,对第 i 对观察值 9

匹配样本的 t 检验 (数据形式) 1 2 M i n x 11 x 21 D1 = x 11 - x 21 x 12 x 22 观察序号 样本1 样本2 差值 1 x 11 x 21 D1 = x 11 - x 21 2 x 12 x 22 D1 = x 12 - x 22 M i x 1i x 2i D1 = x 1i - x 2i n x 1n x 2n D1 = x 1n- x 2n 9

匹配样本的 t 检验 (检验统计量) 统计量 样本差值均值 样本差值标准差 D0:假设的差值 自由度df =nD - 1 Just take the mean and standard deviation of the difference. SD is simply the standard deviation. The formula is the computational formula. 样本差值均值 样本差值标准差

匹配样本的 t 检验 (例题分析) 【例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5kg以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表: 训练前 94.5 101 110 103.5 97 88.5 96.5 104 116.5 训练后 85 89.5 101.5 96 86 80.5 87 93.5 93 102 在  = 0.05的显著性水平下,调查结果是否支持该俱乐部的声称? 单侧检验

配对样本的 t 检验 (例题分析) 样本差值计算表 训练前 训练后 差值Di 94.5 101 110 103.5 97 88.5 96.5 104 116.5 85 89.5 101.5 96 86 80.5 87 93.5 93 102 9.5 11.5 8.5 7.5 11 8 14.5 合计 — 98.5

配对样本的 t 检验 (例题分析) 差值均值 差值标准差

配对样本的 t 检验 (例题分析) H0: m1 – m2  8.5 检验统计量: H1: m1 – m2 < 8.5 a = 0.05 df = 10 - 1 = 9 临界值(s): 检验统计量: 决策: 在  = 0.05的水平上不拒绝H0 -1.833 t 拒绝域 .05 结论: 不能认为该俱乐部的宣称不可信

配对样本的 t 检验 (例题分析—用Excel进行检验) 第1步:选择“工具” 第2步:选择“数据分析”选项 第3步:在分析工具中选择“t检验:平均值的成对二样本分析” 第4步:当出现对话框后 在“变量1的区域”方框内键入数据区域 在“变量2的区域”方框内键入数据区域 在“假设平均差”方框内键入8.5 显著性水平保持默认值

两个总体比例之差的检验

两个总体比例之差的Z检验 1. 假定条件 两个总体是独立的 两个总体都服从二项分布 可以用正态分布来近似 检验统计量

两个总体比例之差的检验 (假设的形式) P1–P2 = 0 P1–P20 P1–P20 P1–P20 P1–P2<0 研究的问题 没有差异 有差异 比例1 ≥比例2 比例1 < 比例2 总体1 ≤比例2 总体1 > 比例2 H0 P1–P2 = 0 P1–P20 P1–P20 H1 P1–P20 P1–P2<0 P1–P2 >0 9

两个总体比例之差的Z检验 (例题分析) 【例】对两个大型企业青年工人参加技术培训的情况进行调查,调查结果如下:甲厂:调查60人,18人参加技术培训。乙厂调查40人,14人参加技术培训。能否根据以上调查结果认为乙厂工人参加技术培训的人数比例高于甲厂?( = 0.05) 单侧检验

两个总体比例之差的Z检验 (例题分析) H0: 1-  2  0 检验统计量: H1: 1-  2 < 0  = 0.05 n1 = 60,n2 = 40 临界值(s): 检验统计量: 决策: 在  = 0.05的水平上不拒绝H0 -1.645 Z 拒绝域  结论: 没有证据表明乙厂工人参加技术培训的人数比例高于甲厂

两个总体方差比的检验

两个总体方差比的检验 (F 检验) 假定条件 假定形式 检验统计量 两个总体都服从正态分布,且方差相等 两个独立的随机样本 H0:s12 = s22 或 H0:s12  s22 (或  ) H1:s12  s22 H1:s12 < s22 (或 >) 检验统计量 F = S12 /S22~F(n1 – 1 , n2 – 1) F ratio is a statistic defined as the ratio of 2 independent estimates of a normally distributed population’s variance. Note: degrees of freedom refer to numerator and denominator

两个总体方差的 F 检验 (临界值) a/2 不能拒绝H0 F 拒绝H0 拒绝 H0 不能拒绝H0 F 拒绝H0 a/2 拒绝 H0 The lower F is not the reciprocal of the upper F. What do you do if equal sample sizes? 66

两个总体方差的 F 检验 (例题分析) H0: 12 = 22 检验统计量: H1: 12  22  = 0.05 n1 = 15,n2 = 20 临界值(s): 检验统计量: F ratio is a statistic defined as the ratio of 2 independent estimates of a normally distributed population’s variance. Note: degrees of freedom refer to numerator and denominator 决策: 在  = 0.05的水平上不拒绝H0 F F0.0975 =0.352 .025 拒绝 H0 F0.025 =2.62 结论: 不能认为这两个总体的方差有显著差异

8.4 假设检验中的其他问题 8.4.1 用置信区间进行检验 8.4.2 单侧检验中假设的建立 9

用置信区间进行检验

用置信区间进行检验 (双侧检验) 求出双侧检验均值的置信区间 2已知时: 2未知时: 若总体的假设值0在置信区间外,拒绝H0

用置信区间进行检验 (单侧检验) 左侧检验:求出单边置信下限 右侧检验:求出单边置信上限 若总体的假设值0小于单边置信下限,拒绝H0

用置信区间进行检验 (例题分析) 【例】一种袋装食品每包的标准重量应为1000克。现从生产的一批产品中随机抽取16袋,测得其平均重量为991克。已知这种产品重量服从标准差为50克的正态分布。试确定这批产品的包装重量是否合格?( = 0.05) 双侧检验! 香脆蛋卷

用置信区间进行检验 (例题分析) H0:  = 1000 置信区间为 H1:   1000  = 0.05 n = 16 用置信区间进行检验 (例题分析) H0:  = 1000 H1:   1000  = 0.05 n = 16 临界值(s): 置信区间为 决策: Z 1.96 -1.96 .025 拒绝 H0 假设的0 =1000在置信区间内,不拒绝H0 结论: 不能认为这批产品的包装重量不合格

本章小节 1. 假设检验的概念和类型 2. 假设检验的过程 基于一个样本的假设检验问题 4. 基于两个样本的假设检验问题 1. 假设检验的概念和类型 2. 假设检验的过程 基于一个样本的假设检验问题 4. 基于两个样本的假设检验问题 5. 用置信区间进行检验 6. 利用p - 值进行检验 As a result of this class, you will be able to ...

结 束