Presentation is loading. Please wait.

Presentation is loading. Please wait.

第4章 假设检验 4.1 基本概念 4.1.1引言 关于总体特征的随机变量的概率分布的一个陈述称为统计假设,如果这个陈述只涉及到总体的参数则称为参数假设。否则称为非参数假设,验证统计假设的方法叫做统计假设检验。 其意义:是利用适当的统计量对总体的分布或参数做出种种零假设 H0 ,然后根据观测信息来对H0.

Similar presentations


Presentation on theme: "第4章 假设检验 4.1 基本概念 4.1.1引言 关于总体特征的随机变量的概率分布的一个陈述称为统计假设,如果这个陈述只涉及到总体的参数则称为参数假设。否则称为非参数假设,验证统计假设的方法叫做统计假设检验。 其意义:是利用适当的统计量对总体的分布或参数做出种种零假设 H0 ,然后根据观测信息来对H0."— Presentation transcript:

1 第4章 假设检验 4.1 基本概念 4.1.1引言 关于总体特征的随机变量的概率分布的一个陈述称为统计假设,如果这个陈述只涉及到总体的参数则称为参数假设。否则称为非参数假设,验证统计假设的方法叫做统计假设检验。 其意义:是利用适当的统计量对总体的分布或参数做出种种零假设 H0 ,然后根据观测信息来对H0 进行检验,从而判断 H0 是否成立。 其任务:(1)对不同的问题确定相应的方法,通过选择适当统计量来判断 H0 是否成立。若成立接受它,若不成立拒绝它。 (2)评价检验方法好坏的标准。

2 其基本思想: 1)实际推断原理 2)统计假设检验主要是起否定作用,其逻辑推理表现为——否定之否定(即反证法) 统计推断的另一类重要问题是根据样本的信息来判断总体分布是否具有指定的特征。如已知样本来自正态总体,要问它的均值是否为μ0 。 例1. 某车间用一台包装机包装葡萄糖, 包得的袋装糖重是一个随机变量, 它服从正态分布。当机器正常时,其均值为0.5公斤, 标准差为0.015公斤。某日开工后为检验包装机是否正常, 随机地抽取它所包装的糖9袋, 称得净重为(公斤): 问机器是否正常?

3

4

5

6 注: 假设检验所采用的方法类似一种反证法:
先假设结论成立, 然后在这个结论成立的条件下进行推导 和运算, 如果得到矛盾, 则推翻原来的假设。 这里的矛盾是与实际推断原理的矛盾,即如果“小概率事件在一次试验中发生了”, 则认为出现了与实际情况不符的矛盾,故原假设不成立,因此,假设检验是一种带有概率性质的反证法。 基本概念与术语: 1. 称给定的 (0< <1) 为显著性水平.

7

8 5. 假设检验的一般步骤:

9 4.1.2 假设 在用统计方法为实际问题作决断时,常常需要做出适当的假设,然后再根据样本提供的信息进行判断,决定是否接受这个假设。在例1中我们要判断这批糖的重量是否合格时,首先假设它合格,H0:μ=μ0= 0.5 然后抽取 9 袋看是否存在常数 k*,是否有 对非参数分布族的假设检验的问题称为“非参数假设检验”。 一个假设是需要“检验”的,就是要在假设 H0 成立的前提下,根据样本观测值结果来判定是接受它还是拒绝它。这样的假设H0 称为“零假设”或“原假设”,它是作为检验的前提假设,当“零假设”被拒绝时,就意味着接受一个与之对立的假设,称为“备择假设”或“对立假设”,常用H1表示。

10 零假设通常应该受到保护的,没有充足的证据是不能被拒绝的,而对备择假设则应取慎重态度,没有充足的理由不能轻易接受。在例1中我们希望这批产品是合格的,没有充分证据不想轻易将它判为是不合格的。
4.1.3 检验 对给定的假设,要根据样本的取值情况来决定它是接受还是拒绝零假设,不能等到试验结果已经得知以后来制定接受或拒绝零假设的准则,而是应该事先规定好这种准则——即检验。对于一个假设,一个检验就是给出一个拒绝域和一个接受域。

11 为了确定拒绝域、接受域,往往首先由问题的实际背景出发,寻找一个统计量,使得在零假设 H0 成立时和备择假设 H1 成立时,该统计量的值有差异。从而使得我们能够根据统计量的值的大小选定拒绝域。并且我们称这个能从样本空间中划分出拒绝域的统计量为检验统计量。 4.1.4 两种错误概率和检验水平 在进行检验时,由于样本的随机性我们可能做出正确的判断也可能做出错误的判断。一般有两类错误: 第一类错误是:原假设 H0 成立时被拒绝,称为“弃真错误”犯弃真错误的概率常记为α; 第二类错误是:原假设 H0 不成立时被接受,称为“采伪错误”犯采伪错误的概率常记为β。

12 即 如果一个检验接受域为 ,拒绝域为 ,那么

13 从这里我们还可以看出当样本容量是固定时,要减少犯第一类错误的概率必须增加C,从而导致增大犯第二类错误的概率,反之若要减少犯第二类错误的概率必须减少C,从而使犯第一类错误的概率增。换句话说,当样本容量n固定时,不可能使犯两类错误的概率减少,这一现象在一般检验问题中都出现。基于这种情况,我们总是使犯第一类错误的概率限制在某个范围内,然后寻求使犯第二类错误尽可能小的检验。

14 4.1.5 功效函数、无偏检验 称样本观测值落在拒绝域的概率为检验的功效函数,又称为“势函数”即:
功效函数、无偏检验 称样本观测值落在拒绝域的概率为检验的功效函数,又称为“势函数”即: 且称满足上述条件的水平为α的检验为无偏检验。即对一个真实水平α的检验。

15 4.2 常用分布族的参数假设检验 4.2.1 假设的种类 设样本分布族由一个 k 维参数所决定,关于参数的假设可以有很多种。无论是零假设还是备择加设,如果一个假设值只指定参数参数的一个点,则它称为“简单假设”;否则就称为“复合假设”。如果一个假设只涉及一个(一维)参数,则它称为“单参数假设”。在单参数假设中(假定θ为一个一维参数),又分:

16 4.2.2 单个正态总体的均值检验 (一)a. 单个正态总体,已知 ,检验 :

17 ( ii ) H : m  m , H : m > m X - m 取统计量 ,而 Z = ,对于给定 s n X - m X -
1 X - m 取统计量 ,而 Z = ,对于给定 s n X - m X - m a ( < a < 1 ) ,当 H 成立时,  ,故 s n s n X - m X - m X - m > z  蕴含 > z ~ N ( , 1 ) a a s n s n s n X - m X - m P { > z } = a ,则 P { > z } a , a a s n s n X - m 从而拒绝域为 > z . a s n

18

19 (一)b. 单个正态总体,未知 ,检验 :

20 例2. 某种电子元件的寿命 x (以小时计)服从正态分布,、2 均未知,现测得16只元件的寿命如下:
是否有理由认为元件的平均寿命大于225小时?

21

22 4.2.3 单个正态总体方差的检验

23 例3.某厂生产的某种型号的电池,其寿命长期以来服从方差为 2=5000(小时2)的正态分布,现有一批这种电池,从它的生产情况看,寿命的波动性有所改变.现随机取26只,测出其寿命的样本方差为 s2=9200(小时2).问根据这一数据能否推断这批电池寿命的波动性较以往的有显著的变化 。(取 = 0.02)?

24 例4.

25

26

27 4.3 似然比检验 针对不同的分布、不同的参数构造不同的检验统计量,再根据所设定的假设来构造检验,是假设检验的中心任务。
我们称此检验为似然比检验,且称 λ为似然比。

28

29

30

31 这种似然比检验也称为广义似然比检验

32

33

34 4.4 双正态总体参数的假设检验 4.4.1 均值差的假设检验:

35 注: 1. 对于单侧检验 “ H0: 1-2≤ 0” 和 “ H0: 1-2 ≥ 0”,可以类似地讨论。 常用的是 0 = 0。 2. 对于两个正态总体的方差均为已知时, 可用 “ u-检验方法 ” 检验。

36 例7. 在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率,试验是在同一只平炉上进行的
例7. 在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率,试验是在同一只平炉上进行的.每炼一炉钢时除操作方法外,其它条件都尽可能做到相同.先用标准方法炼一炉,然后用建议的方法炼一炉,以后交替进行,各炼了10炉, 其得率分别为: 标准方法: 新方法: 设这两个样本相互独立, 且分别来自正态总体N(1,2)和N(2,2);1、2、2 均未知. 问建议的新操作方法能否提高得率?(取α=0.05.)

37

38 例8. 某地区高考负责人想知道某年来自城市中学考生的平均成绩是否比来自农村中学考生的平均成绩高。已知总体服从正态分布且方差大致相同,由抽样获得资料如下:

39 设 X 和 Y 是两个正态总体, 均值分别为 1 和 2,X 和 Y 不是相互独立的。
(二). 成对数据比较检验法 设 X 和 Y 是两个正态总体, 均值分别为 1 和 2,X 和 Y 不是相互独立的。 取成对样本: (X1,Y1),…,(Xn,Yn)。 要检验: H0: 1 =  , H1: 1 ≠  可以把这个问题转化成单个总体的假设检验, 令 U=X-Y, 它服从 N( ,2) , 这里  (=1- 2) ,2 均未知。 Ui=Xi-Yi(i=1,…,n)是来自该正态总体的样本。 显然, 检验 H0: 1= 2 , H1: 1 ≠ 2 等价于检验 H0: =0, H1: ≠0, 于是可把问题转化为上节的情况。

40 问能否认为这两台仪器的测量结果有显著的差异?
例9.有两台光谱仪Ix、Iy用来测量材料中某种金属的含量,为鉴定它们的测量结果有无显著的差异,制备了9 件试块(它们的成份、金属含量、均匀性等均各不相同),现在分别用这两台仪器对每一试块测量一次,得到 9 对观察值如下: - -0.18 解: 分别作各对数据的差 ,如上表,

41 并假设 u1 ,… ,u9来自正态总体 N( , 2),这里 、2 均属未知。若两台仪器的性能一样, 则各对数据的差异可看作是随机误差,而随机误差可以认为服从正态分布,其均值为零,因此本题归结为 检验假设: H0:  = 0 , H1:  ≠ 0.

42 4.4.2 方差比的假设检验

43

44 例10. 在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率,试验是在同一只平炉上进行的
例10. 在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率,试验是在同一只平炉上进行的.每炼一炉钢时除操作方法外,其它条件都尽可能做到相同.先用标准方法炼一炉,然后用建议的方法炼一炉,以后交替进行,各炼了10炉, 其得率分别为: 标准方法: 新方法: 设这两个样本相互独立, 且分别来自正态总体(1 ,12)和 N(2 ,22),1, 2,12, 22均未知。

45 试对数据检验假设(=0.01):H0: 12≤22, H1: 12>22.

46 例11. 某校某年级分别抽取男生和女生个14名,进行英语测验成绩如下:

47

48 4.7 秩检验 4.7.1 非参数检验与秩统计量 在统计的理论中,基于中心及限定理,把正态分布摆在重要的位置是正确的。然而往往不知道中心极限定理是否适用于基本分布,也不知道对正态分布的近似是否足够好,使得正态理论的置信区间和假设检验象我们要求的那样精确。但在许多情况下试验工作者并不知道基本分布的形式,他需要一种与分布形式武官的统计方法,这种方法称为非参数方法。非参数统计是统计统计学中的一个重要且有特点的领域。非参数检验中较有代表性的有: (1)一组独立样本是否是同分布的; (2)两个变量是否独立; (3)两组样本是否取于同一总体 非参数检验广泛使用秩统计量。

49 如果两个观察值相等,则秩样本中存在一个“结”,此时将按原序小的排在前面。但对连续总体分布不存在“结”。
基于秩统计量的检验方法就称为秩检验。

50 4.7.2 随机性检验

51

52

53

54 4.7.3 独立性检验

55

56

57 第4章结束

58


Download ppt "第4章 假设检验 4.1 基本概念 4.1.1引言 关于总体特征的随机变量的概率分布的一个陈述称为统计假设,如果这个陈述只涉及到总体的参数则称为参数假设。否则称为非参数假设,验证统计假设的方法叫做统计假设检验。 其意义:是利用适当的统计量对总体的分布或参数做出种种零假设 H0 ,然后根据观测信息来对H0."

Similar presentations


Ads by Google