(二) 王晓莉
2 统计推断 随机抽样 参数? 统计量 ( 、、)( 、、)( 、、)( 、、) (X、s、p)(X、s、p)(X、s、p)(X、s、p) 参数估计 假设检验
3 主要内容 第一节: t 分布 第二节:可信区间的估计 ( t 分布 法)可信区间的估计 ( t 分布 法) 第三节:均数的 t 检验均数的 t 检验 第四节:均数假设检验的注意事项均数假设检验的注意事项
4 第一节 t 分布 复习两个概念: ▲ 正态分布 ▲ 标准正态分布 u ( z ) 分布
5 对 X 进行标准正态转化以后: 1 Z~N ( 0 , 1 ) ; ~t
6 t 分布的主要内容: t 分布的概念:小样本的概率分布 t 分布图形: t 分布面积特征 ( t 界值表):
7
8 t 分布(与 u 分布 比较的特点)
9 t 值表 (附表 2 P 118 ) 横坐标:自由度, υ 纵坐标:概率, p, 即曲线下阴影部分的面积 ; 表中的数字:相应的 |t | 界值。
10 t 值表规律: (1) 自由度( υ )一定时, p 与 t 成反比 ; (2) 概率( p ) 一定时, υ 与 t 成反比 ;
11
12
13 第二节:可信区间的估计 t 分布 法 公式 应用条件:样本量小于 100 ,已知均数和标准差。 例题:某产科医生统计正常妇女骨盆 x 线的资料 40 例,得到骨盆入口前后径均数 12.0cm ,标准差 0.9cm ,求正常妇女骨盆入口前后径的 95% 可信区 间。 意义 ( x t ·s x , x t ·s x ) 即( x±t ·s x )
第三节 均数的 t 检验 一 、 小样本均数与已知总体均数比较的 t 检验 二 、 两个小样本均数比较的 t 检验 三 、 配对资料的 t 检验
15 例题: 请选用合适的统计学方法进行分析 例 1. 已知某地婴儿的出生体重均数为 3.20kg ,一个产科 医生随机调查 25 名难产儿,其平均体重为 3.42kg ,问?? 例 2. 某内科医生随机测量了 25 名健康人血中 ß 脂旦白含 量,均数为 mg/100ml, 标准差为 mg/100ml ; 同时测量 23 名心肌梗塞病人血中 ß 脂旦白含量,均数为 mg/100ml, 标准差为 mg/100ml ;问?? 例 3. 某营养学家想研究控制饮食是否对高血脂病人有疗 效,对 18 名高血脂病人进行了一年的饮食控制,观察他 们在控制饮食前后的血清胆固醇变化,得到了如下资料 ( P34 ,表),问??
16 一、小样本均数与已知总体均数比较的 t 检验 ▲目的:比较一个小样本均数所代表的未知总 体均数与已知的总体均数有无差别。 ▲计算公式: P31 t 统计量: 自由度: n - 1
17 ▲ 适用条件: (1) 已知一个总体均数; (2) 可得到一个样本均数及该样本标准误; (3) 样本量小于 100 ; (4) 样本来自正态或近似正态总体。
18 已知: (1) 一个总体均数: 3.20kg ; (2) 一个样本均数: 3.42kg ; (3) 可计算出样本标准误: 3.42/ 5 (4) n =25 < 100;
19 假设检验: ▲ 建立假设: 检验假设:难产儿平均出生体重与一般婴儿平均出 生体重相同; 备择假设 : 难产儿平均出生体重与一般婴儿平均出 生体重不同; ▲ 确定显著性水平( ): 0.05
20 ▲ 计算统计量: t 统计量: t =2.62 ▲ 确定概率值: n= 25, 自由度 = n – 1 = 24, t 0.05(24) = t > t 0.05(24), p < 0.05 ▲ 做出推论 : p < 0.05 ( ), 小概率事件发生了,原假设不成立;拒绝 H 0, 接受 H 1 , 可认为: 难产儿平均出生体重与一般婴儿平均出生体重不同;难 产儿平均出生体重比一般婴儿平均出生体重大;难产儿平均出 生体重与一般婴儿平均出生体重差别显著。
21 二、两个小样本均数比较的 t 检验 ▲目的:由两个样本均数的差别推断两样本 所代表的总体均数间有无差别。 ▲计算公式及意义: P32 t 统计量: 自由度: n 1 + n 2 –2
22 ▲ 适用条件: ( 1 )已知 / 可计算两个样本均数及它们的标准差 ; ( 2 )两个样本之一的例数少于 100 ; ( 3 )样本来自正态或近似正态总体(如何判断); ( 4 )两个样本方差不能差别太大(方差齐,如何 判断)。
23 已知: (1) 一个样本 : 均数 491.4, 标准差 ( mg/100ml) ; 另一个样本 : 均数 672.3, 标准差 ( mg/100ml) ; (2) n 1 =25; n 2 =23 (3) 近似正态分布: ×2 < 491.4; × 2 < (4) 方差齐: 25/23 < 2
24 假设检验: ▲ 建立假设: 检验假设:心肌梗塞病人血清 ß 脂旦白与正常人血 清 ß 脂旦白均数相同; 备择假设:心肌梗塞病人血清 ß 脂旦白与正常人血 清 ß 脂旦白均数不同; ▲ 确定显著性水平( ): 0.05
25 ▲ 计算统计量: t 统计量: t = 4.34 ; 自由度: –2 = 46 表中: t 0.05(40) = t 0.05(50) = t 0.05(46) = ??? ▲ 确定概率值: t > t 0.05(46), p < 0.05;
26 ▲ 做出推论 : 因为 p < 0.05 ( ), 拒绝 H 0, 接受 H 1 : 可认为心肌梗塞病人血清 ß 脂旦白 与正常人血清 ß 脂旦白均数不同; 两样 本均数差别有显著性。
27 三、配对资料的 t 检验 什么是配对资料? 治疗前后;不同检验方法;进行配对; …… 一对观察对象之间除了处理因素 / 研究因素之 外,其它因素基本齐同。 目的:判断不同的处理是否有差别
28 公式: t (P34)=0.214 自由度:对子数 – 1 查表: t 0.05(17) = ?? 适用条件: 两组配对计量资料。
29 第四节均数假设检验的注意事项
30 1 、正确理解假设检验的结论(概率性) 假设检验的结论是根据概率推断的,所以不是绝对 正确的: (1) 当 p ≤ , 拒绝 H 0, 接受 H 1 ,按接受 H 1 下结论,可 能犯错误; (2) 当 p > , 不能拒绝 H 0, 不能接受 H 1 ,按不能接受 H 1 下结论,也可能犯错误;
31 2 、第 I 类错误和第 II 类错误 假设检验的结果有两种。 (1) 当拒绝 H 0 时, 可能犯错误,可能拒绝了实际上 成立的 H 0 , 称为 І 类错误( “ 弃真 ” 的错误 ),其 概率大小用 α 表示。 (理解什么是 “ 真 ” ) (2 )当不能拒绝 H 0 时,也可能犯错误,没有拒绝 实际上不成立的 H 0, 这类称为 II 类错误( ” 存伪 ” 的错误), 其概率大小用 β 表示, β 值一般不能确 切的知道。(理解什么是 “ 伪 ” )
32 II 类错误的概率 β 值的两个规律: 1. 当样本量一定时, α 愈小, 则 β 愈大,反之 …; 2. 当 α 一定时, 样本量增加, β 减少.
33 3. 统计学中的差异显著或不显著,和日常生 活中所说的差异大小概念不同. (有无 “ 显著性 ” 的 实质是什么?不仅区别于均数差异的大小,还区别于均数 变异的大小 ) 4 、其它注意事项 选择假设检验方法要注意符合其应用条件; 当不能拒绝 H 0 时,即差异无显著性时,应考虑 的因素:可能是样本例数不够; 单侧检验与双侧检验的问题
34 第一节 标准误 第二节 总体均数的估计 第三节 假设检验 第四节 均数的 u 检验 第五节 t 分布 均数的 t 检验 第六节 均数的 t 检验 第七节 均数假设检验的注意事项 小 结
分析下列问题 : 随机测量某地初生男女婴儿胸围 (cm) ,数据如下。 男婴: n 1 =250, s 1 =1.79cm X1=33.5cm 女婴: n 2 =236, s 2 =1.62cm X2= 32.8cm 试问: (1) 该地男婴胸围的 95% 正常值范围是多少? (2) 该地女婴胸围的 99% 可信区间是多少? (3) 该地男女婴的胸围是否相同?
36 是非判断: ( ) 1 .标准误是一种特殊的标准 差,其表示抽样误差的大小。 ( ) 2 . N 一定时,测量值的离散 程度越小,用样本均数估计总体均 数的抽样误差就越小。 ( ) 3 .假设检验的目的是要判断 两个样本均数的差别有多大。
37 1. 按 α=0.10 水准做 t 检验, P>0.10 ,不能认为两总体均 数不相等,此时若推断有错,其错误的概率为 ( )。 A .大于 0.10 B . β, 而 β 未知 C .小于 0.10 D . 1-β, 而 β 未知 选择题:
38 2. 两个样本均数比较,经 t 检验,差异有显著 性, p 越小,说明( ) A .两样本均数差别越大 B .两总体差别越大 C .越有理由认为两总体均数不同 D .越有理由认为两样本均数不同
39 思考题: 1. 标准差和标准误有何区别和联系? 2. 可信区间和参考值范围有何不同? 3. 一类错误和二类错误的区别
40 谢谢!