概 率 统 计 主讲教师 叶宏 山东大学数学院.

Slides:



Advertisements
Similar presentations
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
Advertisements

2.6 隐函数微分法 第二章 第二章 二、高阶导数 一、隐式定义的函数 三、可微函数的有理幂. 一、隐函数的导数 若由方程 可确定 y 是 x 的函数, 由 表示的函数, 称为显函数. 例如, 可确定显函数 可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此 隐函数求导方法.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
第二节 换元积分法 一、第一类换元积分 法(凑微分法) 二、第二类换元积分法. 问题 解决方法 利用复合函数,设置中间变量. 过程令 一、第一类换元积分法(凑微分法)
7.1 假设检验 1. 假设检验的基本原理 2. 假设检验的相关概念 3. 假设检验的一般步骤 4. 典型例题 5. 小结.
第四章 假设检验 第4.1节 假设检验的基本概念 第4.2节 正态总体均值与方差 的假设检验 第4.3节 非参数假设检验方法
07/16/96 概率统计 自考辅导.
第六章 样本及抽样分布 简单随机抽样: 代表性: 中每一个与所考察的总 体有相同的分布。 2.独立性: 是相互独立的随机变量。
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
3.1.3 概率的基本性质.
第七章 非参数统计 非参数统计(亦称非参数检验),是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。 主要特点
10.2 立方根.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
完全随机设计多样本资料秩和检验.
08-09冬季学期 概率论与数理统计 姜旭峰,胡玉磊.
第 8 章 假设检验 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学.
四种命题 2 垂直.
1.1.3四种命题的相互关系 高二数学 选修2-1 第一章 常用逻辑用语.
§6.3 假设检验的基本概念 我们将讨论不同于参数估计的另一类重要的统计推断问题. 这就是根据样本的信息检验关于总体的某个假设是否正确.
第八章 假设检验 本章重点: 1、正确建立零假设和备择假设 2、理解第一类错误和第二类错误 3、大样本情况下单个总体的假设检验
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
本讲义可在网址 或 ftp://math.shekou.com 下载
不确定度的传递与合成 间接测量结果不确定度的评估
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第四章 抽样误差与假设检验 要求: 掌握:均数的抽样误差与标准误,t分 布的特征,t界值表,总体均数可信区间及其与参考值范围的区别。
区间估计 Interval Estimation.
信息技术与数学教学 华东师范大学数学系 万福永 第九讲 几种假设检验的Excel实现.
第一节 单因素方差分析 第二节 双因素方差分析 第三节 正交实验设计及方差分析
第6章 统计量及其抽样分布 统计量 关于分布的几个概念 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
§3.3 多元线性回归模型的统计检验 一、拟合优度检验 二、方程的显著性检验(F检验) 三、变量的显著性检验(t检验) 四、参数的置信区间.
第十章 方差分析.
数据统计与分析 秦 猛 南京大学物理系 手机: 第十讲 数据统计与分析 秦 猛 南京大学物理系 办公室:唐仲英楼A 手机:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第七章 参数估计 7.3 参数的区间估计.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
完全随机设计多组资料的比较 赵耐青 卫生统计教研室.
复习.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
数据统计与分析 秦 猛 南京大学物理系 第11讲 办公室:唐仲英楼A
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
第八章 假设检验 8.1 假设检验的基本概念.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
难点:连续变量函数分布与二维连续变量分布
主讲教师 欧阳丹彤 吉林大学计算机科学与技术学院
数理统计基本知识.
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第十四章 假设检验 (Hypothesis Testing)
第五章 数理统计的基本知识 §5.1 总体与样本.
第八章 假设检验 8.3 两个正态总体参数的假设检验.
贝叶斯估计 Bayes Estimation
二、配对样本t检验 配对设计(paired design)定义:将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理,称为随机配对设计。
7.3 参数的区间估计 一、区间估计基本概念 二、正态总体均值与方差的区间估计 三、小结.
一元一次方程的解法(-).
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
假设检验.
Sssss.
Presentation transcript:

概 率 统 计 主讲教师 叶宏 山东大学数学院

§6.3 假设检验的基本概念 我们将讨论不同于参数估计的另一类重要的统计推断问题. 这就是根据样本的信息检验关于总体的某个假设是否正确. §6.3 假设检验的基本概念 我们将讨论不同于参数估计的另一类重要的统计推断问题. 这就是根据样本的信息检验关于总体的某个假设是否正确. 这类问题称作假设检验问题 .

何为假设检验? 假设检验是指施加于一个或多个总体的概率分布或参数的假设.所作假设可以是正确的,也可以是错误的. 为判断所作的假设是否正确, 从总体中抽取样本,根据样本的取值,按一定原则进行检验, 然后作出接受或拒绝所作假设的决定.

若对参数 一无所知 用参数估计 的方法处理 若对 参数 有所 了解 但有怀 疑猜测 需要证 实之时 用假设 检验的 方法来 处理

假设检验的内容 总体分布已知时 检验关于未知参 数的某个假设 参数检验 非参数检验 假设检验 总体分布未知时 对分布类型的假 设检验问题

假设检验的理论依据 假设检验所以可行,其理论背景为实际推断原理,即“小概率原理” 人们在实践中普遍采用的一个原则: 小概率事件在一次试验中基本上不会发生 .

小概率事件在一次试验中基本上不会发生. 这里有两个盒子,各装有100个球. 下面我们用一例说明这个原则. 这里有两个盒子,各装有100个球. 99个白球 一个红球 99个红球 一个白球

现从两盒中随机取出一个盒子,问这 个盒子里是白球99个还是红球99个?

我们不妨先假设:这个盒子里有99个白球. 现在我们从中随机摸出一个球,发现是 此时你如何判断这个假设是否成立呢? 假设其中真有99个白球,摸出红球的概率只有1/100,这是小概率事件. 小概率事件在一次试验中竟然发生了, 不能不使人怀疑所作的假设.

例子中所使用的推理方法,可以称为 带概率性质的反证法 不妨称为概率反证法. 它不同于一般的反证法 一般的反证法要求在原假设成立的条件下导出的结论是绝对成立的,如果事实 与之矛盾,则完全绝对地否定原假设.

概率反证法的逻辑是: 如果小概率事件在一次试验中居然发生,我们就以很大的把握否定原假设. 在假设检验中,我们称这个小概率为显著性水平,用 表示. 的选择要根据实际情况而定. 常取

假设检验步骤 例 某工厂生产的一种螺钉,标准要求长度是32.5毫米. 实际生产的产品,其长度X假定服从正态分布 未知,现从该厂生产的一批产品中抽取6件, 得尺寸数据如下: 32.56, 29.66, 31.64, 30.00, 31.87, 31.03 问这批产品是否合格? 分析:这批产品(螺钉长度)的全体组成问题的总体X. 现在要检验E(X)是否为32.5.

已知 X~ 未知. 第一步: 提出原假设和备择假设 第二步: 取一检验统计量,在H0成立下 求出它的分布 能衡量差异 大小且分布 已知

第三步: 对给定的显著性水平 =0.01,查表确定临界值 ,使 即“ ”是一个小概率事件 . 得否定域 W: |t |>4.0322 对给定的显著性水平 =0.01,查表确定临界值 ,使 即“ ”是一个小概率事件 . 小概率事件在一次 试验中基本上不会 发生 . 得否定域 W: |t |>4.0322

这并不意味着H0一定对,只是差异还不够显著,不足以否定H0 . 拒绝域 W: |t |>4.0322 第四步: 将样本值代入算出统计量 t 的实测值, | t |=2.997<4.0322 没有落入 拒绝域 故接受H0 . 这并不意味着H0一定对,只是差异还不够显著,不足以否定H0 .

假设检验步骤 (1) 建立假设 (2) 在 为真时,选择统计量 (3) 确定拒绝域 (4) 作出判断

假设检验的两类错误 假设检验会不会犯错误呢? 由于作出结论的依据是 小概率原理 小概率事件在一次试验中基本上 不会发生 . 不是一定不发生

在给定的前提下,接受还是拒绝原假设完全取决于样本值, 因此所作检验可能导致以下两类错误的产生: 弃真错误 第一类错误 取伪错误 第二类错误

H0为真 实际情况 决定 拒绝H0 接受H0 H0不真 第一类错误 正确 第二类错误 假设检验的两类错误 H0为真 实际情况 决定 拒绝H0 接受H0 H0不真 第一类错误 正确 第二类错误 犯两类错误的概率: 显著性水平 P{第一类错误}= P{拒绝H0|H0为真}= , P{第二类错误}= P{接受H0|H0不真}= .

两类错误是互相关联的, 当样本容量固定时,一类错误概率的减少导致另一类错误概率的增加. 要同时降低两类错误的概率 ,或者要在 不变的条件下降低 ,需要增加样本容量.

§6.4 正态总体的参数检验 1.一个正态总体 (1)关于 的检验 给定显著性水平与样本值(x1,x2,…,xn ) H0 :   0 ; H1 :  0 构造统计量

U 检验法 ”是一个小概率事件. 也就是说,“ 故我们可以取拒绝域为: W: 如果由样本值算得该统计量的实测值落入区域W,则拒绝H0 ;否则,不能拒绝H0 . U 检验法

U 检验法 (2 已知) 原假设 H0 备择假设 H1 检验统计量及其 H0为真时的分布 拒绝域   0  0   0  < 0   0  > 0

T 检验法 (2 未知) 原假设 H0 备择假设 H1 检验统计量及其 H0为真时的分布 拒绝域   0  0   0  < 0   0  > 0

H0:   100 ; H1:  100 U 检验法 构造统计量 拒绝 >

未知. 接受 <

(2)关于  2 的检验 检验法( 已知) 原假设 检验统计量及其在 拒绝域 H0 H0为真时的分布 备择假设 H1  2= 02  2 02  2 02  2< 02  2 02  2> 02

检验法( 未知) 原假设 检验统计量及其在 拒绝域 H0 H0为真时的分布 备择假设 H1  2= 02  2 02  2 02  2< 02  2 02  2> 02

拒绝 >

2. 单侧检验与双侧检验 前面各例的检验,拒绝域取在两侧, ——称为双侧检验. 单侧检验—拒绝域取在左侧或右侧. 下面看一个单侧检验的例子:

例 某织物强力指标X的均值 =21公斤. 改进工艺后生产一批织物,今从中取30件,测得 =21. 55公斤 解:提出假设: 是 一小概率事件 取统计量 否定域为 W : =2.33

代入 =1.2, n=30,并由样本值计算得统计 U=2.51>2.33 故拒绝原假设H0 . 落入否定域 U=2.51>2.33 故拒绝原假设H0 . 这时可能犯第一类错误,犯错误的概率不超过0.01.

3.两个正态总体 设 X ~ N ( 1  1 2 ), Y ~ N ( 2  2 2 ) 两样本 X , Y 相互独立, 样本 (X1, X2 ,…, Xn ), ( Y1, Y2 ,…, Ym ) 显著性水平

(1) 关于均值差 1 – 2 的检验 原假设 H0 备择假设 H1 拒绝域 ( 12,22 已知) 检验统计量及其在 1 = 2 1  2 ( 12,22 已知) 1  2 1 < 2 1  2 1 >2

原假设 拒绝域 H0 其中 1 = 2 1  2 1  2 1 < 2 1 > 2 1  2 备择假设 H1 检验统计量及其在 H0为真时的分布 拒绝域 其中 12, 22未知 12 =  22

(2) 关于方差比 12 / 22 的检验 原假设 拒绝域 H0 1,  2 均未知 备择假设 H1 检验统计量及其在  12 =  22  12  22 1,  2 均未知  12  22  12 <  22  12  22  12 >  22

例 为比较两台自动机床的精度,分别取容量为11和9的两个样本,测量某个指标的尺寸(假定服从正态分布),得到下列结果: 车床甲:6.2, 5.7, 6.0, 6.3, 6.5, 6.0, 5.7, 5.8, 6.0, 5.8, 6.0; 车床乙:5.6, 5.7, 5.9, 5.5, 5.6, 6.0, 5.8, 5.5, 5.7. 在 =0.05时, 问这两台机床是否有同样的精度?

解:设两台自动机床的方差分别为 在 =0.05下检验假设: 其中 为两样本的样本方差 取统计量 否定域为 W: 或

由样本值可计算得F的实测值为: F =2.13 查表得 由于 0.26 < 2.13 < 4.3, 故接受H0 .

例 杜鹃总是把蛋生在别的鸟巢中, 现从两种鸟巢中得到杜鹃蛋24个.其中 9个来自一种鸟巢, 15个来自另一种鸟 例 杜鹃总是把蛋生在别的鸟巢中, 现从两种鸟巢中得到杜鹃蛋24个.其中 9个来自一种鸟巢, 15个来自另一种鸟 巢, 测得杜鹃蛋的长度(mm)如下: n = 9 21.2 21.6 21.9 22.0 22.0 22.2 22.8 22.9 23.2 m = 15 19.8 20.0 20.3 20.8 20.9 20.9 21.0 21.0 21.0 21.2 21.5 22.0 22.0 22.1 22.3

试判别两个样本均值的差异是仅 H0 : 1 = 2 ; H1 : 1  2 由随机因素造成的还是与来自不同的 鸟巢有关 解 取统计量

拒绝域 拒绝H0 即蛋的长度与不同鸟巢有关.