第 八 章 t 检 验
应用时应了解各种检验方法的应用条件和检验统计量的计算方法。然后按假设检验的一般步骤来处理实际问题。 假设检验一般以检验统计量命名, 如 t 检验和 z 检验。 应用时应了解各种检验方法的应用条件和检验统计量的计算方法。然后按假设检验的一般步骤来处理实际问题。
t 检验的应用条件: 正态总体; ② 两小样本均数比较时,两样本均来自正态分 布总体,两样本的总体方差相等;若两总体 方差不齐可用t’检验; ① 单样本t检验中,σ 未知且n 较小,样本取自 正态总体; ② 两小样本均数比较时,两样本均来自正态分 布总体,两样本的总体方差相等;若两总体 方差不齐可用t’检验; ③ 两大样本均数比较时,可用Z检验。
1、样本均数与总体均数比较的 t 检验 使用范围:用于样本均数与已知总体均数(一般为理论值、标准值或经过大量观察所得的稳定值等)的比较。 分析目的:推断样本所代表的未知总体均数 与已知总体均数 0有无差别。 若 n 较大,则 , 可按算得的 t 值用 v = ∞ 查 t 界值表( t 即为 Z )得P值。
检验统计量 t 值的计算公式: 式中为 X样本均数, 0为已知总体均数,s为样本标准差,n为样本含量,为自由度。
例8.1 已知某地新生儿出生体重均数为3.36kg, 从该地随机抽取40名新生儿,测得其平均体重为3.27kg,标准差为0.44kg,问该地农村新生儿体重是否与该地新生儿平均出生体重不同?
(1) 建立检验假设,确定检验水准 H0:=3.36,该地农村新生儿体重与该地新生儿平均体重相同 =0.05
(2) 计算统计量 已知n=40, =3.27kg,S=0.44kg, =3.36kg。 按式(8.1) =n–1=40–1=39
(3) 确定P值,作出统计推断 查附表3,t界值表,t=-1.294的绝对值,得0.2<P<0.4,按 =0.05检验水准,不拒绝H0,结果无统计学意义,尚不能认为该地农村新生儿体重与该地新生儿平均体重不同。
二、配对设计均数比较的 t 检验 (配对t 检验) (paired/matched t-test for dependent samples)
配对设计资料有3种情况: 例 8.2 (P 92) ① 配对的两个受试对象分别接受两种处理 ② 同一样品(或对象)用两种方法或仪器检 测的结果 ③ 同一受试对象两个部位的检测结果 目的:推断两种处理(或方法)的结果有无差别。 例 8.2 (P 92)
配对设计资料的检验的基本思路: 解决这类问题,首先要求出各对差值(d)的均数。理论上,若两种处理无差别或某种处理不起作用时,差值d的均数应为0。所以对于配对设计的均数比较可看成样本均数 与总体均数( d =0)的比较:
式中 为样本中各对差值的均数, 为样本差值的标准差,n为对子数, 为自由度。
例 8.2 (1) 建立检验假设,确定检验水准 H0:d=0,儿童皮肤对不同结核菌素的反应性无差别 =0.05
(2) 计算统计量 今n=12, =d/n=39/12=3.25 差值的标准差为 按公式 =n–1=12–1=11
(3) 确定P值,作出统计推断 查附表3,t界值表,4.520>4.437,得P<0.001,按 =0.05水准,拒绝H0,接受H1。结果有统计学意义,可认为两种不同结核素对儿童皮肤反应性有差别。
三、两样本均数比较的t检验 目的:推断两个总体均数是否相等。
为两样本均数差值的标准误
在两总体方差相等的条件下,可将两方差合并,求合并方差(pooled variance)
表8.2 银屑病组与正常对照组的血清IL-6(pg/ml) 例8.3 某医生研究血清白介素-6(IL-6)与银屑病的关系,收集了12例处于进行期的银屑病患者及12例正常人的血清标本进行检测,得到如下结果,问银屑病患者与正常人的血清IL-6均数是否不同? 表8.2 银屑病组与正常对照组的血清IL-6(pg/ml) 组别 例数 均数 标准差 银屑病患者 12 182.4 27.7 正常人 149.7 19.5
(1) 建立假设检验,确定检验水准 H0:1=2,银屑病患者与正常人血清IL-6均数 相等, H1:12,银屑病患者与正常人血清IL-6均数 不相等, =0.05
(2) 计算统计量 今n1= 12, =182.4 pg/mL,S1=27.7 pg/mL, n2= 12 , =149.7 pg/mL,S2=19.5 pg/mL 按式(8.4)得 =n1+n2–2=12+12–2=22
(3) 确定P值,作出统计推断 查附表3,t界值表,得0.002<P<0.005,按 =0.05水准,拒绝H0,接受H1,结果有统计学意义,故可认为银屑病患者与正常人血清IL-6均数不同。
Z检验 Z检验(亦称Z-test)是用检验统计量Z来命名的。 用于样本含量n足够大(n>100)的样本均数与总体均数的比较、成组设计两样本均数的比较。 由于标准正态分布(分布)只有一条曲线,只要记住几个常用的界值,即可获得P值的大致范围,故检验可省去查t界值表的麻烦 。
(一)、单样本Z检验 式中 为样本均数,μ0为已知总体均数,s为样本标准差,n为样本含量。 适用于当n较大(n>100),检验统计量u值的计算公式为: 式中 为样本均数,μ0为已知总体均数,s为样本标准差,n为样本含量。
例 已知正常男性血色素μ0=14. 0g(%)。从某地区人群中随机抽取144名正常男性作为样本, = 14. 2g(%),s=1 例 已知正常男性血色素μ0=14.0g(%)。从某地区人群中随机抽取144名正常男性作为样本, = 14.2g(%),s=1.3g(%)。问该地区正常男性与一般正常男性血色素的差异有无不同?
(1)建立假设,确定检验水准 H0: μ=μ0 H1: μ≠μ0 =0.05 (2)计算统计量 μ0=14.0, n=144, =14.2, s=1.3
(3)确定P值 因为1.85<1.9600, 所以p>0.05。 (4)按=0.05检验水准,不拒绝H0,结果无统计学意义,尚不能认为该地区正常男性与一般正常男性血色素不同。
(二)、成组设计的两样本均数比较的Z检验 适用于两样本含量较大(n1、n2均大于50)时,
当两样本含量均大于50,即使总体分布偏离正态,其样本均数仍近似正态分布,可用 Z 检验。
例 为研究健康成年男、女血红蛋白有无差别,某地抽样调查了部分健康成人的血红蛋白含量,观察结果如下表。 表 健康成人的血红蛋白含量测定值(g/L) 性别 例数 均数 标准差 男 360 134.5 7.1 女 255 117.6 10.2
本资料是成组设计的两样本均数比较,可用t检验,由于两样本含量皆较大,也可用z检验以简化计算 (1) 建立假设检验,确定检验水准 H0:1=2,即健康成年男女血红蛋白没有差别,差 别是由抽样误差造成的。 H1: 1 ≠ 2 ,即即健康成年男女血红蛋白有差别。 =0.05(双侧)
(2) 计算统计量 今 =73.07, S1=10.75,n1=100 =80.30,S2=11.83,n2=105 将已知数据代入公式(9.26)中,得:
按 =0.05水准,拒绝H0,接受H1 。结果有统计学意义,可认为健康成年男、女血红蛋白含量有差别。 (3)确定P值,作出统计推断 按自由度v=∝,查t界值表,z0.001=3.2905,所以P<0.001。 按 =0.05水准,拒绝H0,接受H1 。结果有统计学意义,可认为健康成年男、女血红蛋白含量有差别。
正态性检验 1. 图示法 (直观) 2. 统计检验方法 P-P图(Proportion - proportion plots) (P96) Q-Q图 2. 统计检验方法 W检验 (S.S. Shapiro and M.B.Wilk) D检验 (D’ Agostino ) 矩法检验
方差齐性检验 两独立样本均数比较的t检验,要求相应的两总体方差相等,即方差具有齐性,若方差不齐时两小样本均数比较,需做t‘检验。 实际上,即使两总体方差相等,其两样本的方差,由于抽样误差的影响,也不一定相等。为此,我们要对两样本的方差作统计学检验。 实际上,即使两总体方差相等,其两样本的方差,由于抽样误差的影响,也不一定相等。为此,我们要对两样本的方差作统计学检验,检验两样本方差的不同是由于抽样误差引起的还是原来的两总体方差不同所造成的?
方差齐性检验
1=n1-1,2=n2-1
根据,1=n1-1,2=n2-1,查附表4方差齐性检验用的F分布表,如果,即P,因此拒绝H0,接受H1。可认为两个总体的方差不等。否则不拒绝H0,尚不能认为两个总体的方差不等。
例8.6 对例8.5进行方差齐性检验 肺癌病人: 矽肺0期病人: 例8.6 对例8.5进行方差齐性检验 例8.5由X线片上测得两组病人的R1值(肺门横径右侧距, cm),算得结果如下,试检验肺癌病人与矽肺0期病人的R1值的均数间差异是否明显。 肺癌病人: 矽肺0期病人:
1. H0:设两总体方差相等 H1:设两总体方差不等 α=0.1 2. 计算F值 3. 1= =N1-1=9, 2 =N2-1=49 查附表4,F0.1(9,49)=2.07,因为F 大于F0.1(9,49) 所以P<0.10,拒绝H0 。认为因为两总体方差的差异有统计学意义。 故不能用 t 检验而要用 t 检验。
假设检验的两型错误和检验效能 假设检验时,根据检验结果作出的判断,即拒绝或不拒绝H0,并不是百分之百的正确,可能发生两种错误。
第І类错误(type I error) 拒绝了实际上成立的H0,这类“弃真”错误称为第一类错误。 样本原本来自μ=μ0 的总体,由于抽样的偶然性得到了较大的t值,得到了较小的P值,落入了的拒绝域,从而做出拒绝的结论。
事实上,小概率事件只是在一次抽样中几乎不可能发生,而不是绝对不会发生。当小概率事件发生时,我们按照小概率事件原理拒绝了就犯了统计检验的错误。称这种错误为“弃真”,也称为第І类错误。
在假设检验中,拒绝H0有两种可能:(1) H0实际上不成立,拒绝它是对的;(2) H0实际上成立,我们拒绝错了。当实际上H0是正确的,但被我们拒绝了的时候,我们就犯了统计学检验的错误。
第ІІ类错误(type Ⅱ error) 不拒绝实际上不成立的H0,这类“存伪”的错误称为 II 型错误,其概率大小用 表示,其大小未知。
I 型错误和 II 型错误 实际情况 假设检验的结果 拒绝 H0 不拒绝 H0 推断正确(1- ) H0 不正确 推断正确(1-) II 型错误()
正常人 误诊 H0 α H1 患者 β 漏诊 t (界值) 图7.1 两型错误示意图(以单侧t检验为例)
a 与 b 间的关系 减少(增加)I型错误,将会增加(减少)II型错误 增大n 同时降低a 与 b b a
同时减少α和ß的唯一方法是增加样本含量,因为增加了样本的含量后,均数的抽样误差小,样本均数更接近总体均数,因而可使犯第一类错误和第二类错误的概率同时减少。
检验效能(power of a test) 1- ß 称为检验效能或把握度,即两总体确有差别时,按α水准能发现它们有差别的能力。 实际情况 假设检验的结果 拒绝 H0 不拒绝 H0 H0 正确 I 型错误() 推断正确(1- ) H0 不正确 检验效能(1-) II 型错误()
如1 = 0.90,意味着若两总体确有差别,则理论上在100次检验中,平均有90次能够得出有统计学意义的结论。所作的检验若有较大的1-β值,我们说该检验方法的检验功效较高,因为H0不成立时能够被及时检出。
假设检验的注意事项 1、要有严密的抽样研究设计 这是假设检验的前提。样本必须是从同质总体中随机抽取的;要保证组间的均衡性和资料的可比性,即除对比的主要因素(如用新药和用安慰剂)外,其它可能影响结果的因素(如年龄,性别,病程,病情轻重等)在对比组间应尽可能相同或相近。
应根据分析目的、资料类型、设计方案、资料的分布、样本含量的大小以及方法的适用条件等选择适宜的统计检验方法。 2、应满足假设检验方法的前提条件 应根据分析目的、资料类型、设计方案、资料的分布、样本含量的大小以及方法的适用条件等选择适宜的统计检验方法。
两样本均数比较方法的选择 n1+n2? 小样本 大样本 方差? z检验 方差齐 方差不齐 t 检验 t ’检验
P值是指在成立的前提下,出现现有样本统 计量以及更极端情况的概率。 P值越小,说明在 H0成立的条件下,得到现有样本的可能性越小, 越有理由拒绝H0。
P值的大小不仅与总体参数间的差别有关,而且与抽样误差等有关。不能认为P值越小,总体参数间的差别越大。假设检验只做出拒绝或不拒绝的定性结论,但不能给出总体参数间差别大小的结论。
4、结论不能绝对化 统计结论具有概率性质,不宜用“肯定”,“一定”,“必定”等词。 报告结果时应注意措辞,应列出检验水准、检验统计量值, P 值的确切范围、统计结论和专业结论。
1) 差别具有“显著性”指差别具有“统计学意义”; 2) 具有“统计学意义”不一定具有“专业意义” 5、正确理解“显著性”、“统计学意义”与“专业意义” 1) 差别具有“显著性”指差别具有“统计学意义”; 2) 具有“统计学意义”不一定具有“专业意义”
差别有统计学意义,过去称差别有“显著性”,不能理解为两者差异大,也不能理解为所分析的指标在实际应用上就有“显著效果”或“显著价值”。
如用某种降压药后舒张压平均下降0.1kPa,经t检验后可能得到p<α,由此作出的“用药前后的差异有统计学意义”的结论并不意味此药就有“显著疗效”或在临床上有“显著应用价值”,
它仅表明用药前后的差异不大可能仅仅是偶然巧遇而出现的,事实上0.1kPa的差值并无实际意义(有临床意义的差值应≥0.67kPa)。
假设检验的结果只能反映两者的差异是否由抽样误差引起,而差异的大小及是否具有实际价值只能根据专业知识予以确定。
小结 1.t检验和Z检验应用条件 2.两类错误 3.假设检验注意事项
练习
Exercise
为观察辛伐他汀治疗糖尿病高胆固醇血症的疗效,将100名2型糖尿病合并高血脂症患者随机分为两组,两组均在控制饮食及运动治疗的基础上,对照组54例给予格列喹酮片加二甲双胍片,治疗组46例另加服辛伐他汀片。结果:对照组TC降低0.35mmol/L,治疗组降低0.49mmol/L,经治疗前后配对t检验和两组差值的两样本t检验后均得P<0.05.由此研究者认为两组血糖下降同时TC下降明显,治疗组降糖同时加用辛伐他汀后降低TC较对照组更显著,故对于合并高血脂症的糖尿病患者应积极给予降脂治疗
问题 1.该资料属于何种设计方案? 2.该作者的结论是否正确?为什么? 答案:1.完全随机和自身配对 2.不正确,临床有实际意义差值不小于0.52mmol/L