Download presentation
Presentation is loading. Please wait.
1
秩转换的非参数检验 吴成秋 公共卫生学院预防医学系
2
一、非参数检验的概念 非参数检验是相对于参数检验而言的。如果总体分布为已知的数学形式,对其总体参数作假设检验称为参数检验.是一种不依赖于总体的具体分布而进行的假设检验,称为非参数检验 如:对正态总体均数作假设检验的t检验和U检验就为参数检验。但当计量资料的分布不能由已知的数学形式表达、没有总体参数时、两个或多个正态总体方差不等,也不能对其总体均数进行t检验或F检验的参数检验。 对于计量资料,不满足参数检验条件的, 1.可尝试变量变换使其满足参数检验条件,但有时达不到目的; 2.用非参数检验。对于等级资料,常首选非参数检验。
3
非参数检验对总体分布不作严格假定,又称任意分布检验,它直接对总体分布作假设检验。不受总体分布的限制,适用范围广,且简便易学.
二、非参数检验优点 非参数检验对总体分布不作严格假定,又称任意分布检验,它直接对总体分布作假设检验。不受总体分布的限制,适用范围广,且简便易学. 秩转换的非参数检验:是推断一个总体表达分布位置的中位数M(非参数)和已知M0、两个或多个总体的分布是否有差别。 秩转换的非参数检验:是先将数值变量从小到大,或等级从弱到强转换成秩后,再计算检验统计量, 其特点是假设检验的结果对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。
4
计量资料,若不满足正态和方差齐性条件,小样本资料选t检验或F检验是不妥的,而应选秩转换的非参数检验。
三 非参数检验方法的应用 计量资料,若不满足正态和方差齐性条件,小样本资料选t检验或F检验是不妥的,而应选秩转换的非参数检验。 分布不知是否正态的小样本资料,为保险起见,宜选秩转换的非参数检验。 一端或二端是不确定数值(如<0.5、>5.0等)的资料,不管是否正态分布,只能选秩转换的非参数检验。 等级资料,若选行×列表资料的2检验,只能推断构成比差别,而选秩转换的非参数检验,可推断等级强度差别。 如果已知其计量资料满足(或近似满足)t检验或F检验条件,当然选t检验或F检验,因为这时若选秩转换的非参数检验,会降低检验效能。
5
第一节 配对样本比较的Wilcoxon符号秩检验
亦称符号秩和检验,用于配对样本差值的中位数和0比较;还可用于单个样本中位数和总体中位数比较. 1.配对样本差值的中位数和0比较:目的是推断配对样本差值的总体中位数是否和0有差别,即推断配对的两个相关样本所来自的两个总体中位数是否有差别。方法步骤见例8-l。 例8-1 对12份血清分别用原方法(检测时间20分钟)和新方法(检测时间10分钟)测谷-丙转氨酶,结果见表8-1的(2)、(3)栏。问两法所得结果有无差别?
7
血清谷-丙转氨酶不知是否符合正态分布,本例为小样本资料,其配对差值经正态性检验得0. 1<P<0
血清谷-丙转氨酶不知是否符合正态分布,本例为小样本资料,其配对差值经正态性检验得0.1<P<0.2,虽可用配对t检验,为保守起见,现用Wilcoxon符号秩检验。 H0:差值的总体中位数Md=0 H1:Md≠0 =0.05 求检验统计量T值 : 编正秩和负秩 ①省略所有差值为0的对子数,令余下的有效对子数为n,n=ll; ②按11个差值的绝对值从小到大编正秩和负秩,遇差值的绝对值相等者取平均秩,称为相同秩(ties) ③任取正秩和或负秩和为T,本例取T=11.5。
8
如:表8-1第(4)栏差值的绝对值为2的有2个,其秩依次应为1,2,皆取平均秩为1.5,
注意:样本较小时,如果相同秩较多,检验结果会存在偏性,因此应提高测量精度,尽量避免出现较多的相同秩. 如:表8-1第(4)栏差值的绝对值为2的有2个,其秩依次应为1,2,皆取平均秩为1.5, 确定P值,作出推断结论: 当n≤50时,查T界值表(附表9)。查表时,自左侧找到n,将检验统计量T值与相邻左侧一栏的界值相比,若T值在上、下界值范围内,其P值大于表上方相应概率水平;若T值恰好等于界值,其P值等于(一般是近似等于)相应概率水平;若T值在上、下界值范围外,其P值小于相应概率水平. 本例n=11,T=11.5,查附表9,得双侧0.05<P<0.10,按=0.05水准不拒绝H0,尚不能认为两法测谷-丙转氨酶结果有差别。
9
若n>50,超出附表9的范围,可用正态近似法作u检验,按下式计算u值。
对秩的差值,省略所有差值为0的对子数,令余下的有效对子数为n;最后按n个差值编正秩和负秩,求正秩和或负秩和。但对于等级资料,相同秩多,小样本的检验结果会存在偏性,最好用大样本。
10
2.单个样本中位数和总体中位数比较: 目的是推断样本所来自的总体中位数M和某个已知的总体中位数M0是否有差别。用样本各变量值和M0的差值,即推断差值的总体中位数和0是否有差别。方法步骤见例8-2。
例8-2 已知某地正常人尿氟含量的中位数为45.30umol/L。今在该地某厂随机抽取12名工人,测得尿氟含量见表8-2第(1)栏。问该厂工人的尿氟含量是否高于当地正常人的尿氟含量?
12
尿氟含量据经验不符合正态分布(本例为小样本资料,虽经正态性检验得0. 1<P<0
尿氟含量据经验不符合正态分布(本例为小样本资料,虽经正态性检验得0.1<P<0.2,但还是作非正态分布资料处理。现用Wilcoxon符号秩检验。 H0:该厂工人尿氟含量的总体中位数M= H1:M> = 据表8-2第(3)、(4)栏,取T=1.50 有效差值个数,n=11。据n=11和T=1.5查附表9,得单侧P<0.005,按=0.05水准拒绝H0,接受Hl,可认为该厂工人的尿氟含量高于当地正常人的尿氟含量.
13
T的下侧界值与上侧界值之和为,n(n+1)/2,由于正秩和与负秩和之和也为n(n+1)/2,故若正秩和、负秩和中的小者小于或等于下侧界值,则大者大于或等于上侧界值。
T正+ T负= n(n+1)/ T= n(n+1)/4 下T,n+上T,n = n(n+1)/2 若T值在上、下界值范围内,其P值大于表上方相应概率水平;若T值恰好等于界值,其P值等于(一般是近似等于)相应概率水平;若T值在上、下界值范围外,其P值小于相应概率水平. T小 T大 下T,n T 上T,n
14
第二节 两个独立样本比较的Wilcoxon秩和检验
用于推断计量资 料或等级资料的两个独立样本所来自的两个总体分布是否有差别。 在理论上检验假设H0应为两个总体分布相同,即两个样本来自同一总体。由于秩和检验对于两个总体分布的形状差别不敏感,对于位置相同形状不同但类似的两个总体分布,如均数相等、方差不等的两个正态分布,推断不出两个总体分布(形状)有差别,故对立的备择假设Hl不能为两个总体分布不同,而只能为两个总体分布位置不同(对单侧检验可写作某个总体分布位置比另一个总体分布位置要右或要左一些)。
15
总体分布不同的两个正态分布,可用秩和检验来推断两个总体分布位置是否有差别,故在实际应用中检验假设H0可写作两个总体分布位置相同。总之,不管两个总体分布的形状有无差别,秩和检验检验的目的是推断两个总体分布的位置是否有差别。如要推断两个不同人群的某项指标值的大小是否有差别或哪个人群的大,可用其指标值分布的位置差别反映,而不关心其指标值分布的形状有无差别。两个总体分布位置不同,实际情况一般是两个总体分布形状相同或类似,这时可简化为两个总体中位数不等;但理论上一个总体分布为正偏态、另一个总体分布为负偏态时,也可能两个总体中位数相等,这时认为正偏态总体分布位置比负偏态总体分布位置要右一些。
16
1.原始数据的两样本比较: 计量资料为原始数据。 例8-3 对10例肺癌病人和12例矽肺0期工人用X光片测量肺门横径右侧距RD值(cm),结果见表8-5。问肺癌病人的RD值是否高于矽肺0期工人的RD值?
17
本例两样本资料经方差齐性检验,推断得两总体方差不等(P<0. 01),现用Wilcoxon秩和检验
本例两样本资料经方差齐性检验,推断得两总体方差不等(P<0.01),现用Wilcoxon秩和检验. H0:肺癌病人和矽肺0期工人的RD值总体分布位置相同 H1:肺癌病人的RD值高于矽肺0期工人的RD值 = 求检验统计量T值:编秩方法: ①把两样本数据混合从小到大编秩,遇数据相等者取平均秩; ②以样本例数小者为n1,其秩和(T1)为T,若两样本例数相等,可任取一样本的秩和(T1或T2)为T,本例T=141.5
18
确定P值,作出推断结论: 当n1≤10和n2--n1≤10时,查T界值表(附表10)。查表时,先找到nl与n2-n1相交处所对应的4行界值,再逐行将检验统计量T值与界值相比,若T值在界值范围内,其P值大于相应概率水平;若T值恰好等于界值,其P值等于(一般是近似等于)相应概率水平;若T值在界值范围外,其P值小于相应概率水平。 本例n1=10,n2-n1=2,T=141.5,查附表10,得单侧0.025<P<0.05,按=0.05水准拒绝H0,接受H1,可认为肺癌病人的RD值高于矽肺0期工人的RD值。 若nl>10或n2-nl>10,超出附表10的范围,可用正态近似法作u检验,令n2+nl=N,按下式计算u值。
19
tj(j=1,2,…n)为第j个相同秩的个数。
2.频数表资料和等级资料的两样本比较: 计量资料为频数表资料,是按数量区间分组;等级资料是按等级分组。 例 名吸烟工人和40名不吸烟工人的碳氧血红蛋白HbCO(%)含量见表8-6。问吸烟工人的HbCO(%)含量是否高于不吸烟工人的HbCO(%)含量?
21
H0:吸烟工人和不吸烟工人的HbC0含量总体分布位置相同 H1:吸烟工人的HbCO含量高于不吸烟工人的HbCO含量 =0
H0:吸烟工人和不吸烟工人的HbC0含量总体分布位置相同 H1:吸烟工人的HbCO含量高于不吸烟工人的HbCO含量 = 求T值,计算u值 ①先确定各等级的合计人数、秩范围和平均秩,见表8-6的(4)栏、(5)栏和(6)栏,再计算两样本各等级的秩和,见(7)栏和(8)栏; ②本例 T=1917 ③用公式(8-2)计算u值,n1=39,n2=40,N=39+40=79, ∑(tj3-tj)=(33-3)+(313-31)+(273-27)+(143-14)+(43-4)=52230 查附表2(t界值表,=时)得单侧P<0.0005,按=0.05水准拒绝H0,接受H1,可认为吸烟工人的HbCO(%)含量高于不吸烟工人的HbCO(%)含量
22
第三节 完全随机设计多个样本比较的H检验 一、多个独立样本比较的Kruskal-Wallis H检验 Kruskal-Wallis H检验,用于推断计量资料或等级资料的多个独立样本所来自的多个总体分布是否有差别。在理论上检验假设H0应为多个总体分布相同,即多个样本来自同一总体。由于H检验对多个总体分布的形状差别不敏感,故在实际应用中检验假设H0可写作多个总体分布位置相同。对立的备择假设H1为多个总体分布位置不全相同。
23
1.原始数据的多个样本比较 方法步骤见例8-5. 例8-5 用三种药物杀灭钉螺,每批用200只活钉螺,用药后清点每批钉螺的死亡数,再计算死亡率(%),结果见表8-9。问三种药物杀灭钉螺的效果有无差别?
本例为百分率资料,不符合正态分布,现用Kruskal-Wallis H检验。
24
H0:三种药物杀灭钉螺的死亡率总体分布位置相同 H1:三种药物杀灭钉螺的死亡率总体分布位置不全相同 =0
H0:三种药物杀灭钉螺的死亡率总体分布位置相同 H1:三种药物杀灭钉螺的死亡率总体分布位置不全相同 =0.05 求检验统计量H值: ①把三个样本数据混合从小到大编秩,遇数据相等者取平均秩;②设各样本例数为ni(∑ni=N)、秩和为Ri,按下式求H值。 当各样本数据存在相同秩时,按公式(8-4)算得的H值偏小,按下式求校正Hc值。
25
确定P值,作出推断结论: 当样本个数g=3和每个样本例数ni≤5时,查H界值表(附表11)本例N=15,n1=n2=n3=5,查附表11得P<0.01,按=0.05水准拒绝H0,接受H1,可认为三种药物杀灭钉螺的效果不同。 若g=3且最小样本的例数大于5或g>3时,则H或Hc近似服从=g-1的2分布,查2界值表。 例8-6 比较小白鼠接种三种不同菌型伤寒杆菌9D、11C和DSCl后存活日数,结果见表8-10。问小白鼠接种三种不同菌型伤寒杆菌的存活日数有无差别?
27
本例为时间资料,不是正态分布,现用Kruskal-Wallis H检验
本例为时间资料,不是正态分布,现用Kruskal-Wallis H检验. H0:接种三种不同菌型伤寒杆菌的存活日数总体分布位置相同 H1:接种三种不同菌型伤寒杆菌的存活日数总体分布位置不全相同 =0.05 N= =30。按公式(8-4)和公式(8-5) Hc=9.77/0.98=9.97 =3-1=2。查附表8(2界值表)得0.005<P<0.0l,按=0.05水准拒绝H0,接受H1,可认为小白鼠接种三种不同菌型伤寒杆菌的存活日数有差别。
28
2.频数表资料和等级资料的多个样本比较 方法步骤见例8-7。 例8-7 四种疾病患者痰液内嗜酸性粒细胞的检查结果见表8-11。问四种疾病患者痰液内嗜酸性粒细胞有无差别? H0:四种疾病患者的痰液内嗜酸性粒细胞总体分布位置相同 H1:四种疾病患者的痰液内嗜酸性粒细胞总体分布位置不全相同 =0.05 如表8-11第(2)栏的秩和R1是用第(2)栏各等级的频数与第(8)栏平均秩相乘再求和,即R1=0(6)+2(21)+9(40.5)+6(55.5)=739.5,仿此得表8-11下部Ri行。
30
=4-1=3。查附表8(2界值表)得P<0. 005,按=0
=4-1=3。查附表8(2界值表)得P<0.005,按=0.05水准拒绝H0,接受H1,可认为四种疾病患者痰液内的嗜酸性粒细胞有差别。 两独立样本比较,若n1和n2较大,如为频数表资料或等级资料时,可用Wilcoxon秩和检验的公式(8-2),也可用H检验的公式(8-4)和公式(8-5)。两者的关系是:H(或Hc)=u2。
31
二、多个独立样本两两比较的Nemenyi法检验 当经过多个独立样本比较的H检验拒绝H0,接受Hl,认为多个总体分布位置不全相同时,若要进一步推断是哪两两总体分布位置不同,可用Nemenyi法检验。方法步骤见例8-8。 例8-8 对例8-6资料(表8-10)作三个样本间的两两比较 H0:任意两存活日数总体分布位置相同 Hl:任意两存活日数总体分布位置不同 = 设为g个样本。当各样本例数较大时,按下式求第i个样本和第j个样本比较的2值。
32
=3-1=2。据 查附表8(2界值表)得0.025<P<0.05,可认为小白鼠接种llc的存活日数高于接种9D的存活日数;据
查附表8得0.01<P<0.025,可认为小白鼠接种DSCl的存活日数高于接种9D的存活日数;据 查附表8得0.99<P<0.995,尚不能认为小白鼠接种11C与接种DSCl的存活日数有差别。
33
第四节随机区组设计多个样本比较的M检验 一、多个相关样本比较的Friedman M检验 M检验,用于推断随机区组设计的多个相关样本所来自的多个总体分布是否有差别。检验假设H0和备择假设H1与多个独立样本比较的H检验相同。 例8-9 8名受试对象在相同实验条件下分别接受4种不同频率声音的刺激,他们的反应率(%)资料见表8-12。问4种频率声音刺激的反应率是否有差别? 随机区组设计的区组个数用n表示,相关样本个数(即研究因素的水平个数)用g表示,每个样本例数为n,总例数N=ng。本例n=8,g=4,N=32。本例为百分率资料,不符合正态分布,现用Friedman M检验。
35
H0:4种频率声音刺激的反应率总体分布位置相同 H1:4种频率声音刺激的反应率总体分布位置不全相同 =0
H0:4种频率声音刺激的反应率总体分布位置相同 H1:4种频率声音刺激的反应率总体分布位置不全相同 =0.05 求检验统计量M值: ①将每个区组的数据由小到大分别编秩,遇数据相等者取平均秩; ②计算各样本的秩和风,平均秩和为R=n(g+1)/2; ③按下式求M值。
36
确定P值,作出推断结论: 当n≤15和g≤15时,查M界值表(附表12)。本例n=8和g=4,查附表12得P<0. 05,按=0
确定P值,作出推断结论: 当n≤15和g≤15时,查M界值表(附表12)。本例n=8和g=4,查附表12得P<0.05,按=0.05水准拒绝H0,接受H1,可认为4种频率声音刺激的反应率有差别。 若n>15或g>15时,超出附表12的范围,可用近似法,按下式计算2值。 式中tj(j=1,2,…)为按区组而言的第j个相同秩的个数,C为校正系数。若相同秩个数少,C近似等于1,也可不校正。 当g>4,或者g=4且n>5,或者g=3且n>9时,就可近似用公式(8-8)。对例8-9,n=8,g=4,已算得M=199.5,按公式(8-8) =4-1=3。查附表8(2界值表)得P<0.005。
37
二、多个相关样本两两比较的q检验 当经过多个相关样本比较的Friedman M检验拒绝H0,接受Hl,认为多个总体分布位置不全相同时,若要进一步推断是哪两两总体分布位置不同,可用q检验。方法步骤见例8-10。 例8-10 对例8-9资料(表8-12)作四个样本;间的两两比较。 H0:任意两反应率总体分布位置相同 H1:任意两反应率总体分布位置不同 = 设为g个相关样本,当区组个数n较多时,按下式求第i个样本和第j个样本比较的q值。
Similar presentations