第六章 假设检验基础
假设检验的概念与原理 假设检验的思维逻辑 某商家宣称他的一大批鸡蛋“坏(变质)蛋率为1%”。对这批鸡蛋的质量(即“坏蛋率为1%”还是“坏蛋率高于1%”)做出判断, 在“坏蛋率为1%”的前提下,5个鸡蛋样品中出现一个“坏蛋”的机会是很小的,“小概率事件在一次随机试验中不(大)可能发生”的。 本章将要介绍的假设检验理论和方法,正是基于这一思维判断形式而发展出来的依据随机样本对于未知事物进行判断和决策的规则。应用假设检验理论和方法,依据样本提供的有限信息对总体做推断。
假设检验的基本步骤 例6-1 已知北方农村儿童前囟门闭合月龄为14.1月。某研究人员从东北某县抽取36名儿童,得囟门闭合月龄均值为14.3月,标准差为5.08月。问该县儿童前囟门闭合月龄的均数是否大于一般儿童?
假设检验的步骤: 1.选择检验方法,建立检验假设并确定检验水准 H0:μ=14.1(月),总体上该县儿童前囟门闭合月龄的平均水平与一般儿童的平均水平相同 H1 : μ>14.1(月),该县儿童前囟门闭合月龄的平均水平高于一般儿童的平均水平 检验水准(size of a test) α=0.05 或0.01
2.计算统计量 t检验的统计量t 自由度:
3.确定P值 P值的意义是: 如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)有多大? 自由度为35 ,查附表2,得到: 单侧 。 得知P>0.5。
如果P值大于α,在H0成立的假设下发生较为可能的事件,没有充足的理由对H0提出怀疑。于是做出不拒绝H0的决策。 如果P值小于或等于检验水准α,意味着在H0成立的前提下发生了小概率事件,根据“小概率事件在一次随机试验中不(大)可能发生”的推断原理,怀疑H0的真实性,从而做出拒绝(reject) H0的决策。因为H0与H1是对立的,既然拒绝H0 ,就只能接受H1 。 如果P值大于α,在H0成立的假设下发生较为可能的事件,没有充足的理由对H0提出怀疑。于是做出不拒绝H0的决策。
由于P>0. 5,自然有P>0. 05(即α)。这意味着,如果该县儿童前囟门闭合的平均月龄为14. 1月,观察到囟门闭合月龄均值为14 由于P>0.5,自然有P>0.05(即α)。这意味着,如果该县儿童前囟门闭合的平均月龄为14.1月,观察到囟门闭合月龄均值为14.3月的样本(以及均值更大的样本)的可能性还是比较大的(概率大于0.5);没有理由对H0提出怀疑,于是做出不拒绝H0的推断结论。 无论做出哪一种推断结论(接受或是拒绝H0 ),都面临着发生判断错误的风险。这就是假设检验的两类错误
图6-1 假设检验示意图
t检验 一组样本资料的t检验 检验假设 H0 :μ=μ0, H1 :μ≠μ0(单侧检验μ>μ0或μ<μ0) 统计量: 见例6-1
配对设计资料的t检验 实施的形式主要有: (1)将受试对象配成特征(主要非处理因素)相近的对子,同对的两个受试对象随机分别接受不同处理; (2)同一样品分成两份,随机分别接受不同处理(或测量)。
检验假设为 H0 :μd= 0, H1 :μd≠0 当成立时,检验统计量
例6-2 某儿科采用静脉注射人血丙种球蛋白治疗小儿急性毛细支气管炎。用药前后患儿血清中免疫球蛋白IgG(mg/dl)含量如表6-1所示。试问用药前后IgG有无变化?
表6-1 用药前后患儿血清中免疫球蛋白IgG(mg/dl)含量 表6-1 用药前后患儿血清中免疫球蛋白IgG(mg/dl)含量 序号 用药前 用药后 差值(=用药后含量-用药前含量) 1 2 3 4 5 6 1206.44 921.69 1294.08 945.36 721.36 692.32 1678.44 1293.36 1711.66 1416.70 1204.55 1147.30 472.00 371.67 417.58 471.34 483.19 454.97 7 980.01 1379.59 399.58 8 691.01 1091.46 400.45 9 910.39 1360.34 449.95 10 568.56 1091.83 523.27 11 1105.52 1728.03 622.51 12 757.43 1398.86 641.44
检验假设 H0:μd= 0, H1:μd≠0 α=0.05 n=12, Σd=5707.95, =Σd/n=5707.95/12=475.66 ∑d2=2793182.166
计算统计量 (mg/dl), ν=n-1=12-1=11
查附表2(t临界值表), t0.05,11=2.201,得P<0.05, 在α=0.05的水准上拒绝H0,可以认为用药后小儿IgG增高。
例6-3 用两种方法测定12份血清样品中Mg2+ 含量(mmol/l)的结果见表6-2。试问两种方法测定结果有无差异? 检验假设 H0:μd= 0, H1:μd≠0 α=0.05 n=12, , Sd={[0.026-(-0.04)2/12]/(12-1)}1/2=0.01497
表6-2 两种方法测定血清Mg2+ (mmol/l)的结果 试样号 甲基百里酚蓝(MTB)法 葡萄糖激酶两点法 差值 1 0.94 0.92 -0.02 2 1.02 1.01 -0.01 3 1.14 1.11 -0.03 4 1.23 1.22 5 1.31 1.32 0.01 6 1.41 1.42 7 1.53 1.51 8 1.61 9 1.72 10 1.81 1.82 11 1.93 12 2.02 2.04 0.02
计算统计量: 自由度 ν=n-1=12-1=11. 查附表2(t临界值表),双侧 t0.20,11 = 1.363,知P>0.20,在α=0.05水平上不能拒绝H0。所以尚不能认为两法测定结果不同。
两组独立样本资料的t检验 将受试对象随机分配成两个处理组,每一组随机接受的一种处理。一般把这样获得的两组资料视为代表两个不同总体的两份样本,据以推断它们的总体均数是否相等。 在实际工作中按完全随机设计的两样本比较来对待。此类比较分为两种情况。
两样本所属总体方差相等 检验假设为 H0:μ1=μ2, H1:μ1≠μ2 已知当H0成立时,检验统计量 自由度=n1+n2-2
合并方差 : 例6-4 某口腔科测得长春市13-16岁居民男性20人的恒牙初期腭弓深度均值为17.15mm, 标准差为1.59mm; 女性34人的均值为16.92mm,标准差为1.42mm。根据这份数据可否认为该市13-16岁居民腭弓深度有性别差异?
检验假设 H0:μ1=μ2 (男性与女性腭弓深度相同) H1:μ1≠μ2 (男性与女性腭弓深度不同) α=0.05 这里n1=20, mm, S1=1.59mm, n2=34, mm, S2=1.42mm。
自由度 ν=n1+n2-2=20+34-2=52 查附表2(t临界值表), t0.5,50=0.679, 知P>0.5,在α=0.05水准上尚不能拒绝H0。所以还不能认为该市13-16岁居民腭弓深度有性别差异。
两样本所属总体方差不等(Satterthwaite近似法) 检验假设为 H0:μ1=μ2, H1:μ1≠μ2 采用(6-5)式的统计量t’作检验。
自由度
例6-5 为探讨硫酸氧钒对糖尿病性白内障的防治作用,研究人员将已诱导糖尿病模型的20只大鼠随机分为两组。一组用硫酸氧钒治疗(DV组),另一组作对照观察(D组),12周后测大鼠血糖含量(mmol/L)。结果为,DV组12只,样本均数为6.5mmol/L,标准差为1.34mmol/L;D组8只,样本均数为13.7mmol/L,标准差为4.21mmol/L。试问两组动物血糖含量的总体均数是否相同?
检验假设 H0:μ1=μ2, H1:μ1≠μ2 α=0.05
查附表2(t临界值表),得 ,知P<0. 05, 在α=0 查附表2(t临界值表),得 ,知P<0.05, 在α=0.05水平上拒绝H0。所以可认为经硫酸氧钒治疗的大鼠与未治疗大鼠的血糖含量不同。
两组独立样本资料的方差齐性检验 H0:, H1: ν1=n1-1,ν2=n2-1
例6-6 试检验例6-5 中两组(DV组与D组)大鼠接受相应处理12周后测得的血糖含量(mmol/L)是否具有方差齐性? 查附表3.2,F0.05(7,11)=3.76, 知P<0.05,在α=0.05水平上拒绝H0。可以认为两个总体方差不相等。
二项分布与Poisson分布资料Z检验 二项分布资料的Z检验 (一)一组样本资料的Z检验 X ~N(nπ, nπ(1-π)) P~
检验假设 H0:π=π0, H1:π≠π0 检验统计量
当n不太大时, 需作如下的连续性校正,
例6-8 某医院称治疗声带白斑的有效率为80%。今统计前来求医的此类患者60例,其中45例治疗有效。试问该医院宣称的疗效是否客观? 1. 建立检验假设 H0:π= 0.80, H1:π<0.80 α=0.05
计算统计量 确定P值和作统计推断 按ν=∞查附表2(t临界值表),得(单侧)Z0.10=1.2816,知P>0.10。在α=0.05水准上不能拒绝H0。可以认为该医院宣称的有效率尚属客观。
两组独立样本资料的Z检验 H0:π1=π2, H1:π1≠π2 统计量
例6-9 用硝苯吡啶治疗高血压急症患者75例,有效者57例;用硝苯吡啶﹢卡托普利治疗同类患者69例,66例有效。试问两疗法的有效率是否相同? 建立检验假设 H0:π1=π2, H1:π1≠π2 α=0.05
计算统计量 p1=57/75=0.76,p2=66/69=0.95652, 确定P值和作推断 Z0.001/2=3.2905,所以P<0.001,在α=0.05水准上拒绝H0。可以认为两种疗法有效率不同。
Poisson分布资料的Z检验 当总体均数λ≥20时,依据Poisson分布近似正态分布的原理,可以对其总体均数进行推断。
检验假设 H0:λ=λ0, H1:λ≠λ0 检验统计量为
例6-10 某地十年前计划到2000年把孕产妇死亡率降到25/10万以下。2000年监测资料显示,该地区平均而言,每10万例活产儿孕产妇死亡31人。问该地区降低孕产妇死亡的目标是否到达到? 建立检验假设 H0:λ=25, H1:λ>25 α=0.05
计算统计量 按(6-13)式 确定P值和作推断 Z0.10=1.2816,知P>0.10,按α=0.05水准,尚不能拒绝H0。可以认为该地区达到了预定目标。
两组独立样本资料的Z检验 当两总体均数都大于20时,依据Poisson分布近似正态分布的原理,可以应用Z检验对其总体均数进行推断。 检验假设H0:λ1=λ2, H1:λ1≠λ2
当两样本观测单位数相等时,检验统计量为 两样本观测单位数不等时,检验统计量
例6-11 甲、乙两检验师分别观察15名正常人末梢血嗜碱性白细胞数量。每张血片均观察200个视野。结果甲计数到嗜碱性白细胞26个,乙计数到29个。试问两位检验师检查结果是否一致? 建立检验假设 H0:λ1=λ2 , H1:λ1≠λ2 α=0.05
计算统计量 按(6-14)式 确定P值和作推断 按ν=∞查附表2(t临界值表),知Z0.5/2=0.6745,所以P>0.5,按α=0.05水准不能拒绝H0。尚不能认为两检验师检查结果有差异。
例6-12 某车间改革生产工艺前,测得三次粉尘浓度,每升空气中分别有38、29、36颗粉尘;改进工艺后,测取两次,分别为25、18颗粉尘。问工艺改革前后粉尘数有无差别? 1.建立检验假设 H0:λ1=λ2 , H1:λ1≠λ2 α=0.05
计算统计量 因工艺改革前后观测单位数不等,故分别计算其均数。 , n1=3 , n2=2 Z=2.723>1.96,P<0.05,在α=0.05的水平上拒绝H0。可以认为工艺改革前后粉尘浓度不同,改革工艺后粉尘浓度较低。
假设检验与区间估计的关系 置信区间具有假设检验的主要功能 显然,H0: 不在此区间之内。这与按照α=0.05水准拒绝H0的推断结论是等价的。
单侧检验 结合例6-1的资料,对东北某县农村儿童前囟门闭合月龄总体均数μ的95%单侧置信区间的下限为 可以看到,H0: 被包含在区间(12.869,∞)之内,所以不能拒绝H0。这与假设检验的结论也等价的。
置信区间可提供假设检验没有提供的信息 置信区间在回答差别有无统计学意义的同时,还可以提示差别是否具有实际意义在图6-2中,置信区间(1)~(3)均不包含原假设H0,意味着相应的差异具有统计学意义。(1)还提示差异具有实际意义;(2)提示可能具有实际意义;(3)提示实际意义不大。图中的(4)与(5)均无统计学意义,但(4)提示样本量不足。(5)属于可以接受原假设的情况。
假设检验提供,而置信区间不提供的信息
假设检验的功效 假设检验的两类错误 第Ⅰ类错误:拒绝原本正确的H0,导致推断结论错误。
实际情况 检验结果 H0真 第Ⅰ类错误 (α) 结论正确(1-α) H0 不真 结论正确 (1-β) 第Ⅱ类错误(β) 表6-3 推断结论和两类错误 实际情况 检验结果 拒绝H0 不拒绝H0 H0真 第Ⅰ类错误 (α) 结论正确(1-α) H0 不真 结论正确 (1-β) 第Ⅱ类错误(β)
假设检验的功效 1-β称为假设检验的功效(power of a test)。其意义是,当所研究的总体与H0确有差别时,按检验水平α能够发现它(拒绝H0)的概率。如果1-β=0.90,则意味着当H0不成立时,理论上在每100次抽样中,在α的检验水准上平均有90次能拒绝H0。一般情况下对同一检验水准α,功效大的检验方法更可取
一组样本资料t检验的功效
例6-14 计算例6-1检验的功效1-β。 假定根据现有知识可以取σ=5月,δ=0.5月,。 由标准正态分布表查这个数值所对应的上侧尾部面积, 得到β=0.8531,于是, 1-β=0.1469。说明例6-1的检验功效太小,即发现δ=0.5个月的差别的机会只有14.69% 。
两组独立样本资料t检验的功效
例6-15 试计算例6-5中检验的功效。 假定根据现有知识可以取δ=1mm, σ=1.5mm, . n1=20, n2=34。 由标准正态分布表查这个数值所对应的上侧尾部面积, 得到β=0.3228,于是1-β=0.6772。
二项分布两组独立样本资料Z检验的功效
例6-16 试计算例6-9中检验的功效。 假定根据现有知识可以取δ=0.15,π1=0.76,π2=0.96, =1.547 由标准正态分布表查这个数值所对应的上侧尾部面积, 得到β=0.0594,于是1-β=0.9406。
应用假设检验需要注意的问题 ★在抽样研究中,研究设计、搜集数据和统计分析是一个整体。每一种假设检验方法都是与相应的研究设计相联系的 ★应用检验方法必需符合其适用条件 ★当样本量一定时,第Ⅰ类错误的概率α变小,第Ⅱ类错误的概率β就变大。 ★正确理解P值的意义。