第八章 秩转换的非参数检验 (Nonparametric Test)
Wilcoxon signed-rank test Wilcoxon rank sum test Kruskal-Wallis H test Content Wilcoxon signed-rank test Wilcoxon rank sum test Kruskal-Wallis H test Friedman M test
参数检验 非参数检验 如果总体分布为已知的数学形式,对其总体参数作假设检验。 如: t 检验和 F 检验 。 对总体分布不作严格假定,又称任意分 布检验(distribution-free test), 它直接对总体分布作假设检验。
秩转换的非参数检验 推断一个总体表达分布位置的中位数M(非参数)和已知M0、两个或多个总体的分 布是否有差别。 先将数值变量从小到大,或等级从弱到强转换成秩后,再计算检验统计量。 特点:假设检验的结果对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。
应用范围: 对于计量资料: 1. 不满足正态和方差齐性条件的小样本资料; 2. 分布不明的小样本资料; 3. 一端或二端是不确定数值(如<0.5、>5.0等)的资料(必选); 对于等级资料: 若选行×列表资料的 检验,只能推断构成比差 别,而选秩转换的非参数检验,可推断等级强度 差别。
注意:如果已知其计量资料满足(或近似满足) 检验或 检验条件,当然选 检验或 检验,因为这时若选秩转换的非参数检验,会降低检验效能。
配对样本比较的Wilcoxon符号秩检验 第一节 配对样本比较的Wilcoxon符号秩检验
1.配对样本差值的中位数和0比较 目的是推断配对样本差值的总体中位数是否和0有差别,即推断配对的两个相关样本所来自的两个总体中位数是否有差别。方法步骤见例8-1。
例8-1 对12份血清分别用原方法(检测时间20分钟)和新方法(检测时间10分钟)测谷-丙转氨酶,结果见表8-1的(2)、(3)栏。问两法所得结果有无差别?
若多个差值为0,可通过提高测量工具的精度来解决。 检验步骤 1. 建立检验假设,确定检验水平 2. 求检验统计量T值 ①省略所有差值为0的对子数,令余下的有效对子数为n,见表8-1第(4)栏,本例 n=11; 若多个差值为0,可通过提高测量工具的精度来解决。
②按差值的绝对值从小到大编秩,然后分别冠以正负号。遇差值绝对值相等则取平均秩,称为相同秩(ties)(样本较小时,如果相同秩较多,检验结果会存在偏性,因此应提高测量精度,尽量避免出现较多的相同秩), 表8-1第(4)栏差值的绝对值为2有2个,其秩依次应为1,2,皆取平均秩为1.5,见表8-1第(5)、(6)栏; ③任取正秩和或负秩和为T,本例取T=11.5。
3. 确定P值,作出推断结论 当n≤50时,查T界值表(附表9), 判断原则:内大外小 。
若当n>50,超出附表9范围,可用正态近似法作u检验。
注意 配对等级资料采用符号秩检验最好选用大样本。
2.单个样本中位数和总体中位数比较 目的是推断样本所来自的总体中位数M和某个已知的总体中位数M0是否有差别。用样本各变量值和M0的差值,即推断差值的总体中位数和0是否有差别。方法步骤见例8-2。
例8-2 已知某地正常人尿氟含量的中位数为45.30 。今在该地某厂随机抽取12名工人,测得尿氟含量见表8-2第(1)栏。问该厂工人的尿氟含量是否高于当地正常人的尿氟含量?
检验步骤 据表8-2第(3)、(4)栏,取T=1.5。
两个独立样本比较的Wilcoxon秩和检验 第二节 两个独立样本比较的Wilcoxon秩和检验
1.原始数据的两样本比较 例8-3 对10例肺癌病人和12例矽肺0期工人用X光片测量肺门横径右侧距RD值(cm),结果见表8-5。问肺癌病人的RD值是否高于矽肺0期工人的RD值?
表8-5 肺癌病人和矽肺0期工人的RD值(cm)比较
检验 步骤 求检验统计量T值:
确定P值,作出推断结论:
2.频数表资料和等级资料的两样本比较 计量资料为频数表资料,是按数量区间分组;等级资料是按等级分组。现以等级资料为例,方法步骤见例8-4。 例8-4 39名吸烟工人和40名不吸烟工人的碳氧血红蛋白HbCO(%)含量见表8-6。问吸烟工人的HbCO(%)含量是否高于不吸烟工人的HbCO(%)含量?
表8-6 吸烟工人和不吸烟工人的HbCO(%)含量比较
①先确定各等级的合计人数、秩范围和平均秩,见表8-6的(4)栏、(5)栏和(6)栏,再计算两样本各等级的秩和,见(7)栏和(8)栏; ②本例T=1917;
③计算u值
完全随机设计多个样本比较的Kruskal-Wallis H 检验 第三节 完全随机设计多个样本比较的Kruskal-Wallis H 检验
一、多个独立样本比较的 Kruskal-Wallis H 检验
1.原始数据的多个样本比较 例8-5 用三种药物杀灭钉螺,每批用200只活钉螺,用药后清点每批钉螺的死亡数、再计算死亡率(%),结果见表8-9。问三种药物杀灭钉螺的效果有无差别?
表8-9 三种药物杀灭钉螺的死亡率(%)比较
求检验统计量H值:
本例
例8-6 比较小白鼠接种三种不同菌型伤寒杆菌9D、11C和DSC1后存活日数,结果见表8-10。问小白鼠接种三种不同菌型伤寒杆菌的存活日数有无差别?
表8-10 小白鼠接种三种不同菌型伤寒杆菌的存活日数比较
2.频数表资料和等级资料的多个样本比较 例8-7 四种疾病患者痰液内嗜酸性白细胞的检查结果见表8-11。问四种疾病患者痰液内的嗜酸性白细胞有无差别?
表8-11 四种疾病患者痰液内的嗜酸性白细胞比较
检验步骤
二、多个独立样本两两比较的Nemenyi法检验
例8-8 对例8-6资料(表8-10)作三个样本间的两两比较。 例8-8 对例8-6资料(表8-10)作三个样本间的两两比较。
随机区组设计多个样本比较的Friedman M检验 第四节 随机区组设计多个样本比较的Friedman M检验
一、多个相关样本比较的Friedman M检验
例8-9 8名受试对象在相同实验条件下分别接受4种不同频率声音的刺激,他们的反应率(%)资料见表8-12。问4种频率声音刺激的反应率是否有差别?
表8-12 8名受试对象对4种不同频率声音刺激的反应率(%)
求检验统计量M值: ① 将每个区组的数据由小到大分别编秩, 遇数据相等者取平均秩; ②计算各样本的秩和 ,平均秩和为 ; ③按下式求M值。
对例8-9,n=8,g=4,已算得M=199.5,则
二、多个相关样本两两比较的检验
例8-10 对例8-9资料(表8-12)作四个样本间的两两比较。 例8-10 对例8-9资料(表8-12)作四个样本间的两两比较。
本例根据表8-12有:n=8, g=4
表8-15 表8-12相关样本的两两比较
练习题 P178 一、最佳选择题 全做 三、计算分析题
谢谢大家!