Presentation is loading. Please wait.

Presentation is loading. Please wait.

概 率 统 计 主讲教师 叶宏 山东大学数学院.

Similar presentations


Presentation on theme: "概 率 统 计 主讲教师 叶宏 山东大学数学院."— Presentation transcript:

1 概 率 统 计 主讲教师 叶宏 山东大学数学院

2 §6.3 假设检验的基本概念 我们将讨论不同于参数估计的另一类重要的统计推断问题. 这就是根据样本的信息检验关于总体的某个假设是否正确.
§6.3 假设检验的基本概念 我们将讨论不同于参数估计的另一类重要的统计推断问题. 这就是根据样本的信息检验关于总体的某个假设是否正确. 这类问题称作假设检验问题 .

3 何为假设检验? 假设检验是指施加于一个或多个总体的概率分布或参数的假设.所作假设可以是正确的,也可以是错误的. 为判断所作的假设是否正确, 从总体中抽取样本,根据样本的取值,按一定原则进行检验, 然后作出接受或拒绝所作假设的决定.

4 若对参数 一无所知 用参数估计 的方法处理 若对 参数 有所 了解 但有怀 疑猜测 需要证 实之时 用假设 检验的 方法来 处理

5 假设检验的内容 总体分布已知时 检验关于未知参 数的某个假设 参数检验 非参数检验 假设检验 总体分布未知时 对分布类型的假 设检验问题

6 假设检验的理论依据 假设检验所以可行,其理论背景为实际推断原理,即“小概率原理” 人们在实践中普遍采用的一个原则:
小概率事件在一次试验中基本上不会发生 .

7 小概率事件在一次试验中基本上不会发生. 这里有两个盒子,各装有100个球.
下面我们用一例说明这个原则. 这里有两个盒子,各装有100个球. 99个白球 一个红球 99个红球 一个白球

8 现从两盒中随机取出一个盒子,问这 个盒子里是白球99个还是红球99个?

9 我们不妨先假设:这个盒子里有99个白球. 现在我们从中随机摸出一个球,发现是 此时你如何判断这个假设是否成立呢? 假设其中真有99个白球,摸出红球的概率只有1/100,这是小概率事件. 小概率事件在一次试验中竟然发生了, 不能不使人怀疑所作的假设.

10 例子中所使用的推理方法,可以称为 带概率性质的反证法 不妨称为概率反证法. 它不同于一般的反证法 一般的反证法要求在原假设成立的条件下导出的结论是绝对成立的,如果事实 与之矛盾,则完全绝对地否定原假设.

11 概率反证法的逻辑是: 如果小概率事件在一次试验中居然发生,我们就以很大的把握否定原假设. 在假设检验中,我们称这个小概率为显著性水平,用 表示. 的选择要根据实际情况而定. 常取

12 假设检验步骤 例 某工厂生产的一种螺钉,标准要求长度是32.5毫米. 实际生产的产品,其长度X假定服从正态分布 未知,现从该厂生产的一批产品中抽取6件, 得尺寸数据如下: 32.56, 29.66, 31.64, 30.00, 31.87, 31.03 问这批产品是否合格? 分析:这批产品(螺钉长度)的全体组成问题的总体X. 现在要检验E(X)是否为32.5.

13 已知 X~ 未知. 第一步: 提出原假设和备择假设 第二步: 取一检验统计量,在H0成立下 求出它的分布 能衡量差异 大小且分布 已知

14 第三步: 对给定的显著性水平 =0.01,查表确定临界值 ,使 即“ ”是一个小概率事件 . 得否定域 W: |t |>4.0322
对给定的显著性水平 =0.01,查表确定临界值 ,使 即“ ”是一个小概率事件 . 小概率事件在一次 试验中基本上不会 发生 . 得否定域 W: |t |>4.0322

15 这并不意味着H0一定对,只是差异还不够显著,不足以否定H0 .
拒绝域 W: |t |>4.0322 第四步: 将样本值代入算出统计量 t 的实测值, | t |=2.997<4.0322 没有落入 拒绝域 故接受H0 . 这并不意味着H0一定对,只是差异还不够显著,不足以否定H0 .

16 假设检验步骤 (1) 建立假设 (2) 在 为真时,选择统计量 (3) 确定拒绝域 (4) 作出判断

17 假设检验的两类错误 假设检验会不会犯错误呢? 由于作出结论的依据是 小概率原理 小概率事件在一次试验中基本上 不会发生 . 不是一定不发生

18 在给定的前提下,接受还是拒绝原假设完全取决于样本值, 因此所作检验可能导致以下两类错误的产生:
弃真错误 第一类错误 取伪错误 第二类错误

19 H0为真 实际情况 决定 拒绝H0 接受H0 H0不真 第一类错误 正确 第二类错误
假设检验的两类错误 H0为真 实际情况 决定 拒绝H0 接受H0 H0不真 第一类错误 正确 第二类错误 犯两类错误的概率: 显著性水平 P{第一类错误}= P{拒绝H0|H0为真}= , P{第二类错误}= P{接受H0|H0不真}= .

20 两类错误是互相关联的, 当样本容量固定时,一类错误概率的减少导致另一类错误概率的增加.
要同时降低两类错误的概率 ,或者要在 不变的条件下降低 ,需要增加样本容量.

21 §6.4 正态总体的参数检验 1.一个正态总体 (1)关于 的检验 给定显著性水平与样本值(x1,x2,…,xn )
H0 :   0 ; H1 :  0 构造统计量

22 U 检验法 ”是一个小概率事件. 也就是说,“ 故我们可以取拒绝域为: W:
如果由样本值算得该统计量的实测值落入区域W,则拒绝H0 ;否则,不能拒绝H0 . U 检验法

23 U 检验法 (2 已知) 原假设 H0 备择假设 H1 检验统计量及其 H0为真时的分布 拒绝域   0  0   0
 < 0   0  > 0

24 T 检验法 (2 未知) 原假设 H0 备择假设 H1 检验统计量及其 H0为真时的分布 拒绝域   0  0   0
 < 0   0  > 0

25 H0:   100 ; H1:  100 U 检验法 构造统计量 拒绝 >

26 未知. 接受 <

27 (2)关于  2 的检验 检验法( 已知) 原假设 检验统计量及其在 拒绝域 H0 H0为真时的分布 备择假设 H1  2= 02
 2 02  2 02  2< 02  2 02  2> 02

28 检验法( 未知) 原假设 检验统计量及其在 拒绝域 H0 H0为真时的分布 备择假设 H1  2= 02  2 02
 2 02  2< 02  2 02  2> 02

29 拒绝 >

30 2. 单侧检验与双侧检验 前面各例的检验,拒绝域取在两侧, ——称为双侧检验. 单侧检验—拒绝域取在左侧或右侧. 下面看一个单侧检验的例子:

31 例 某织物强力指标X的均值 =21公斤. 改进工艺后生产一批织物,今从中取30件,测得 =21. 55公斤
解:提出假设: 一小概率事件 取统计量 否定域为 W : =2.33

32 代入 =1.2, n=30,并由样本值计算得统计 U=2.51>2.33 故拒绝原假设H0 .
落入否定域 U=2.51>2.33 故拒绝原假设H0 . 这时可能犯第一类错误,犯错误的概率不超过0.01.

33 3.两个正态总体 设 X ~ N ( 1  1 2 ), Y ~ N ( 2  2 2 ) 两样本 X , Y 相互独立,
样本 (X1, X2 ,…, Xn ), ( Y1, Y2 ,…, Ym ) 显著性水平

34 (1) 关于均值差 1 – 2 的检验 原假设 H0 备择假设 H1 拒绝域 ( 12,22 已知) 检验统计量及其在
1 = 2 1  2 ( 12,22 已知) 1  2 1 < 2 1  2 1 >2

35 原假设 拒绝域 H0 其中 1 = 2 1  2 1  2 1 < 2 1 > 2 1  2
备择假设 H1 检验统计量及其在 H0为真时的分布 拒绝域 其中 12, 22未知 12 =  22

36 (2) 关于方差比 12 / 22 的检验 原假设 拒绝域 H0 1,  2 均未知 备择假设 H1 检验统计量及其在
 12 =  22  12  22 1,  2 均未知  12  22  12 <  22  12  22  12 >  22

37 例 为比较两台自动机床的精度,分别取容量为11和9的两个样本,测量某个指标的尺寸(假定服从正态分布),得到下列结果:
车床甲:6.2, 5.7, 6.0, 6.3, 6.5, 6.0, 5.7, 5.8, 6.0, 5.8, 6.0; 车床乙:5.6, 5.7, 5.9, 5.5, 5.6, 6.0, 5.8, 5.5, 5.7. 在 =0.05时, 问这两台机床是否有同样的精度?

38 解:设两台自动机床的方差分别为 在 =0.05下检验假设: 其中 为两样本的样本方差 取统计量 否定域为 W:

39 由样本值可计算得F的实测值为: F =2.13 查表得 由于 < 2.13 < 4.3, 故接受H0 .

40 例 杜鹃总是把蛋生在别的鸟巢中, 现从两种鸟巢中得到杜鹃蛋24个.其中 9个来自一种鸟巢, 15个来自另一种鸟
例 杜鹃总是把蛋生在别的鸟巢中, 现从两种鸟巢中得到杜鹃蛋24个.其中 9个来自一种鸟巢, 15个来自另一种鸟 巢, 测得杜鹃蛋的长度(mm)如下: n = 9 m = 15

41 试判别两个样本均值的差异是仅 H0 : 1 = 2 ; H1 : 1  2 由随机因素造成的还是与来自不同的 鸟巢有关 解
取统计量

42 拒绝域 拒绝H0 即蛋的长度与不同鸟巢有关.


Download ppt "概 率 统 计 主讲教师 叶宏 山东大学数学院."

Similar presentations


Ads by Google