Presentation is loading. Please wait.

Presentation is loading. Please wait.

第三章 假设检验 §3.1 假设检验的基本思想与概念 §3.2 正态总体的假设检验 §3.3 分布拟合检验.

Similar presentations


Presentation on theme: "第三章 假设检验 §3.1 假设检验的基本思想与概念 §3.2 正态总体的假设检验 §3.3 分布拟合检验."— Presentation transcript:

1 第三章 假设检验 §3.1 假设检验的基本思想与概念 §3.2 正态总体的假设检验 §3.3 分布拟合检验

2 §3.1假设检验的基本思想与概念 问题引入: 上章介绍的参数估计是统计推断的基本问题.讨论了如何利用已有的样本资料,在指定的可靠性下对总体的未知参数作出估计的方法.然而,在很多实际问题中,还有另一类问题,要求对参数的性质或总体分布的类型作出结论性的判断,如需要知道总体未知参数与某个已知数之间有无明显的差异,或是否明显的大于或小于某个数,或总体分布是否服从某已知类型的分布等等. 例如:某自动包装线工作是否正常?某班级某门课程的考试成绩是否服从正态分布?某种材料的强度在生产工艺改进后是否有显著的提高?治疗某种疾病的一种药物的疗效是否与另一种治疗同种疾病的药物的疗效相同.

3 处理这类问题的共同方法是:先把一些结论当作某种假设,然后选取合适的统计量,再根据实测资料的具体数值对假设进行检验,判断是否可以认为假设成立,从而得出有关结论,这就是本章要学习的假设检验问题.

4

5 上述例子中的零假设与备择假设 例 零假设 备择假设 例1 例2 例3 例4

6 假设检验 参数假设检验 非参数假设检验 总体分布未知时的假设检验问题 总体分布已 知,检验关 于未知参数 的某个假设

7 一、统计假设 二、假设检验的基本原理

8

9

10

11 三、假设检验的拒绝域与接受域

12

13 四、假设检验的两类错误

14 假设检验是一样本为出发点,小概率原理为依据的反证法
不是一定不发生 小概率事件在一次试验中基本上不会发生。 假设检验是一样本为出发点,小概率原理为依据的反证法 如果H0成立,但统计量的实测值落入否定域,从而作出否定H0的结论,就称为第一类错误,简称“弃真”的错误;如果H0不成立,但统计量的实测值未落入否定域,从而没有作出否定H0的结论,即接受了错误的H0,就称为第二类错误,简称 “纳伪” 。 假设检验的两类错误 H0为真 实际情况 决定 拒绝H0 接受H0 H1真 第一类错误 正确 第二类错误 样本实现

15 犯第一类错误的概率和犯第二错误的概率可以用一个称之为势函数的量统一表示。

16

17 五、假设检验的一般步骤 参数假设检验问题的一般形式: 提出 假设 构造 统计量 确定 拒绝域 计算 统计 量值 作出 决策
根据统计调查的目的, 提出 原假设H0 和备选假设H1 由犯第一类错误的 概率确定拒绝域 拒绝还是不能 拒绝H0

18 六、假设检验中要注意的其他事项

19

20

21 §3.2 正态总体的检验 一、单个正态总体均值的检验 (1) 类型1(双侧检验)

22

23 (2)类型2(左侧检验)

24 (3)类型3(右侧检验)

25 (1)类型1(双侧检验)

26 (2)类型2(左侧检验)

27 (3)类型3(右侧检验)

28 例3. 1某工厂生产的一种螺钉,标准要求长度是32. 5毫米
例3.1某工厂生产的一种螺钉,标准要求长度是32.5毫米.实际生产的产品长度X 假定服从正态分布 未知,现从该厂生产的一批产品中抽取6件, 得尺寸数据如下: 32.56, 29.66, 31.64, 30.00, 31.87, 31.03 问这批产品是否合格(置信水平0.01)?

29 分析:这批产品(螺钉长度)的全体组成问题的总体X.现在要检验E(X)是否为32.5.
已知 未知. 第一步:提出原假设和备择假设 第二步:取一检验统计量,在H0成立下求出它的分布 能衡量差异大小且分布已知 第三步:对给定的显著性水平 ,查表确定临界值

30 得否定域 W: | t |= |>4.0321 | t |=2.997<4.0322 即“ ”是一个小概率事件 .
即“ ”是一个小概率事件 . 小概率事件在一次试 验中基本上不会发生 . 得否定域 W: | t |= |>4.0321 第四步:将样本值代入算出统计量t 的实测值. | t |=2.997<4.0322 没有落入拒绝域 故不能拒绝H0 . 这并不意味着H0一定对,只是差异还不够显著, 不足以否定H0 .

31 例3.2 某工厂生产的固体燃料推进器的燃烧率服从正态分布
现在用新方法生产了一批推进器。从中随机取 n=25只,测得燃烧率的样本均值为 设在新方法下总体均方差仍为 2cm/s,问这批推进器的燃烧率是否较以往生产的推进器的燃烧率有显著的提高?取显著性水平 解:提出假设: 取统计量 代入 ,并由样本值计算得统计量U的实测值 U=3.125 故在0.01的显著水平上拒绝H0 ,即认为这批推进器的燃料率较以往生产的有极显著的提高。

32 例3.3 某种电子元件的寿命 X(以小时计)服从正态分布, 均未知。现测得16只元件的寿命如下:
问是否有理由认为元件的平均寿命大于225(小时)? 解: 按题意需检验 取 。检验问题的拒绝域为 现在n=16, 又算得 即得 t不落在拒绝域,故接受 即在0.95的可靠性下认为元件的平均寿命不大于225小时。

33 检验法 条件 检验统计量 拒绝域 U检验 σ已知 t检验 σ未知

34 二、单个正态总体方差的检验 (1) 类型1 (双侧检验)

35 (2) 类型2(左侧检验)

36 (3) 类型3(右侧检验)

37

38 例3.4 某厂生产的某种型号的电池,其寿命长期以来服从方差 (h )的正态分布,现有一批这种电池,从它的生产情况来看,寿命的波动性有所改变,现随机取26只电池,测出其寿命的样本方差

39 检验法 条件 检验统计量 拒绝域 检验 μ已知 μ未知

40 三、两个正态总体均值差的检验

41

42

43 例3.5 据以往资料,已知小麦在每个小区产量(千克)的方差为 .
今播种A种小麦12个小区,得平均产量 B种小麦8个小区,得平均 产量 试比较A、B两种小麦平均产量的差异是否有统计意义. 解 假设: 因为: 所以接受H0假设,即认为 A、B两种小麦平均产量的差异无统计意义。

44

45

46

47

48 ( ) 0.05 a = 例3.6 有两种灯泡,一种用 A 型灯丝,另一种用 B 型灯丝.随机 抽取两种 解 假设: 因
灯泡各10 只做试验,测得它们的寿命(小时)为: A 型: B 型: 设两种灯泡的寿命均服从正态分布且方差相等,试检验两种 灯泡的平均寿命之间是否存在显著差异? ( ) 0.05 a = 解 假设: 所以拒绝H0假设,即认为 A、B两种灯泡的平均寿命有统计意义。

49 检验法 条件 检验统计量 拒绝域 U检验 已知 t 检验 未知

50 近似U检验 未知 m,n充分大 近似 t 检验 m,n不太大 ,。

51 四、两个正态总体方差比的检验 在生产实际中,往往需要比较两个总体在同一指标上的稳定性,例如,两个工厂生产同一类型的灯泡,想了解那个工厂生产的灯泡寿命更稳定;又如,同一小麦品种在不同地区播种,比较在那个地区产量更稳定等等,这就形成了数理统计中两个总体方差的检验问题.

52

53

54 例3.7 测得两批电子器材的样本的电阻为:(单位:)
第一批: 第二批: 设这两批器材的电阻均服从正态分布,试检验 H0: 解 这是一个两正态总体的方差检验问题,用F检验法 假设 由样本观测数据得

55 所以 结论: 接受原假设,即可认为两批电子器材的方差相等

56 检验法 条件 检验统计量 拒绝域 F检验 已知 未知

57 §3.3 分布拟合检验 在总体参数及估计和假设检验中,有些方法的应用条件要求总体服从正态分布或近似服从正态分布,但在实际问题中,总体的分布类型往往是未知的,或知道的很少,因此,在对总体进行参数估计和假设检验以前,应先对总体服从的分布类型进行检验,比如在使用正态分布以前,通过假设检验验证总体服从正态分布.在另外一些问题中,要验证试验所得的数据是否服从某种理论或假设,或者验证影响实验结果的某两个因素之间是否关联等.以上问题属于非参数统计的范畴. 设随机试验E的可能基本结果有 ,对试验进行n次观测, 各结果出现的实际次数分别为 而根据某种理论假设推算得 理论观测次数为 1900年K.Pearson提出了如下统计量,并用 于假设检验:

58 1.建立统计假设 理论上可以证明,当n充分大时有: 若理论或假设中有k个参数要由试验数据估计,则自由度变为(m-k-1). 检验步骤
2.统计各种结果的实际观测次数,并根据统计假设确定各种结果的理论次数,计算检验统计量的值; 3.根据(3.3.2)对于给定的检验置信水平,确定检验临界值; 4.根据检验统计量的实现与临界值的大小做判定。

59 如果 否定 拒绝 接受 如果 接受 注意:若在计算各种结果理论值时,由观测结果估计了某些参数,则自由度作适当调整。 一、 拟合优度检验

60

61

62 例3.8孟德尔在著名的豌豆杂交实验中,用种皮黄色光滑的豌豆种子与种皮绿色皱纹的豌豆种子杂交,子二代所结种子出现分离现象,所结种子形色及植株数数据入下表所示。问这种分离比例是否符合遗传学的9:3:3:1的比例(检验置信水平为0.05). 形色 黄光 黄皱 绿光 绿皱 合计 数量 315 101 108 32 556 解:(1)建立统计假设 分离比符合9:3:3:1; 分离比不符合。 (2)如果统计假设 成立,则不同行色种子数理论值为:

63 显然 从而接受 二、 独立性检验 (3)由检验置信水平0.05查表
前面研究的问题中所涉及的总体,其变量的取值是可以量化的数量指标,如作物的产量,产品的寿命等.但在实际问题中,常常需要研究总体单元在某些或某个非数量指标上的状态,如人的性别,花的颜色,学生的籍贯等,这种变量取值本身是离散的,而且,不同的状态只能用语言或代号标明它的属性而不能精确的量化的变量称为定性变量.定性变量其各种状态之间没有大小,只能表示总体单元在某指标上的状态或属性.就总体的每个单元来说,在某个定性变量的任何一个状态(或几个定性变量的任何一个状态的组合)上总能作出“是”或“否”的回答,因此,对定性变量的观测结果往往是以计数数据的形式出现. 在科学试验中,常常要判断两个或多个定性指标间是否相互关联,这种检验问题就称为独立性检验问题.独立性检验是借助于列联表实现.

64 设定性指标A有r状态 定性指标B有c个状态,先从研究总体 中随机抽取n个对象进行观测,结果A, B组合 的实际频数为
样本实现可用下列计数表表示.这样的 表称为列联表(Contingency table). 合计 通过列联表可以检验A,B两个定性变量之间是否独立,这种检验称 为独立性检验或列联表检验. 其中表中括号内的 是在假定量定性指标相互独立下,由下列公式推算 出来的理论值。

65 检验依据下列关系式所给出的结论:

66

67 例3.9 采用网络媒体调查民众对对某项提案的看法, 调查结果如下表所示,问:在显著水平为0.05下,民众对该项议案的态度是否与性别有关?
合计 赞成 1154( ) 638(585.01) 1792 反对 1475( ) 642(691.10) 2117 弃权 243(239.11) 112(115.89) 355 2872 1392 4264 解:(1)建立统计假设 态度与性别无关; 态度与性别有关。 (2)如果统计假设 成立,则理论值计算如表内括号所示

68 (3)由检验置信水平0.05查表 显然 从而拒绝 说明民众对该项议案的态度与性别有关。


Download ppt "第三章 假设检验 §3.1 假设检验的基本思想与概念 §3.2 正态总体的假设检验 §3.3 分布拟合检验."

Similar presentations


Ads by Google