第11章 秩转换的非参数检验 (nonparametric test).

Slides:



Advertisements
Similar presentations
主编 周仁郁. 4.1 非参数检验 配对秩和检验( Wilcoxon 法) 不依赖总体分布类型, 也不对总体参数进行统计推 断的假设检验, 称为非参数检验 配对资料比较时,H 0 为差值总体中位数 M d = 0 H 0 成立时, 配对数据的差值服从以 0 为中心的对称 分布. 把差值按绝对值从小到大用.
Advertisements

第十七章 分类资料的统计推断.
第十二章 非参数检验 (Nonparametric test)
SPSS 軟體與統計應用 Ya-Yun Cheng, How-Ran Guo
第八章 秩转换的非参数检验 (Nonparametric Test)
第五讲 非参数统计分析 吴成秋 南华大学公共卫生学院
Dr. Baokun Li 经济实验教学中心 商务数据挖掘中心
The application of medical statistics methods
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
第十章 基于秩次的非参数检验.
How to Use SPSS in Biomedical Data analysis
第六章 方差分析 (Analysis of Variance,ANOVA)
第七章 非参数统计 非参数统计(亦称非参数检验),是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。 主要特点
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
完全随机设计多样本资料秩和检验.
第 8 章 假设检验 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学.
第十一章 非参数检验 (nonparametric test).
  秩转换的非参数检验 吴成秋 公共卫生学院预防医学系.
第 八 章 t 检 验.
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
本讲义可在网址 或 ftp://math.shekou.com 下载
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第三章 导数与微分 习 题 课 主要内容 典型例题.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
成组设计两样本均数的比较 赵耐青 卫生统计教研室.
無母數統計方法 符號檢定法 W-符號等級檢定法 W-等級和檢定法 K-W檢定法 連檢定 結論
t 检验——问题提出 假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同;
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
SAS  統計程序實作 CONTENTS By DR. Yang , Yi-Chiang /11/11.
第十章 兩母體之假設檢定 Inferences Based on Two-Samples:
第十六章 無母數統計.
第十六章 無母數統計 陳順宇 教授 成功大學統計系.
第二章 SAS的描述统计功能 2.1 描述性统计的基本概念 2.2 在SAS中计算统计量 2.3 统计图形.
第七章 SPSS的非参数检验.
第13章 有序分类变量的统计推断——非参数检验
用于计算智能研究 和人类主观测试的 统计检验 Hideyuki TAKAGI 日本 九州大学
4 統計分析程序的選擇.
统计软件应用 6 主讲人 陶育纯 SPSS统计分析 统计软件应用 6 主讲人 陶育纯 教案.
第十章 方差分析.
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习3 主讲人 陶育纯 医学统计学方法 实习3 主讲人 陶育纯 流行病与卫生统计学教研室
第七章 参数估计 7.3 参数的区间估计.
医学统计学方法 实习3 主讲人 陶育纯 医学统计学方法 实习3 主讲人 陶育纯
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 6 主讲人 陶育纯 医学统计学方法 6 主讲人 陶育纯 流行病与卫生统计学教研室
抽样和抽样分布 基本计算 Sampling & Sampling distribution
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
完全随机设计多组资料的比较 赵耐青 卫生统计教研室.
第五章 多总体的统计检验.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
SAS软件应用基础 SAS过程步.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第4课时 绝对值.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第四节 多个样本均数的两两比较 多个样本均数的两两比较又称多重比较(multiple comparison),其目的是推断究竟哪些总体均数之间存在差别。
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
Statistical Methods in Medicine
统计工具的使用方法 主讲人 陶育纯 统计工具的使用方法 主讲人 陶育纯
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
二、配对样本t检验 配对设计(paired design)定义:将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理,称为随机配对设计。
SAS 統計程序實作 PROC GLM 變異數分析 (PROC ANOVA)
SAS 統計程序實作 PROC NPAR1WAY 無母數檢定
SAS 統計程序實作 PROC MEANS (一個母體)
Presentation transcript:

第11章 秩转换的非参数检验 (nonparametric test)

参数检验 parametric test 如 t 检验: F 检验: 这时,对总体参数的假设检验称为参数检验。 (1)总体分布类型已知,如率服从二项分布、样本均数服从正态分布; (2)由样本参数推断未知总体参数。 这时,对总体参数的假设检验称为参数检验。 如 t 检验: F 检验:

非参数检验(nonparametric test)对数据的总体分布类型不作严格假定,又称任意分布检验(distribution-free test), 它直接对总体分布的位置作假设检验。

秩转换 rank transformation 将数值变量值从小到大,或等级变量值从弱到强转换成秩次。 例1 11只大鼠存活天数: 存活天数4,10,7,50,3,15,2,9,13,>60,>60 秩次 3 6 4 9 2 8 1 5 7 10 11 10.5 10.5 例2 7名 肺炎病人的治疗结果: 危险程度 治愈 治愈 死亡 无效 治愈 有效 治愈 秩次 1 2 7 6 3 5 4 2.5 2.5 7 6 2.5 5 2.5 秩相同取平均秩!!

参数检验 非参数检验 (nonparametric test) (parametric test) 已知总体分布类型,对未知参数进行统计推断 对总体的分布类型不作严格要求 不受分布类型的影响,比较的是总体分布位置 依赖于特定分布类型,比较的是参数 优点:方法简便、易学易用,易于推广使用、应用范围广;可用于参数检验难以处理的资料(如等级资料,或含数值“>50mg”等 ) 缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低;样本含量较大时,两者结论常相同

应用非参数检验的首选情况: 1.不满足正态和方差齐性条件的小样本资料; 2.总体分布类型不明的小样本资料; 3.一端或二端是不确定数值(如<0.002、>65等)的资料(必选); 4.单向有序列联表资料; 5. 各种资料的初步分析。

配对样本比较的Wilcoxon符号秩检验 (Wilcoxon signed-rank test) 第一节 配对样本比较的Wilcoxon符号秩检验 (Wilcoxon signed-rank test) 1.配对样本差值的中位数与0的比较 2.单个样本中位数和总体中位数比较

1.配对样本差值的中位数和0比较 原方法(检测时间20分钟) 新方法(检测时间10分钟)测谷-丙转氨酶 问两法所得结果有无差别? 例8-1 12份血清 原方法(检测时间20分钟) 新方法(检测时间10分钟)测谷-丙转氨酶 问两法所得结果有无差别?

*配对差值经正态性检验,得0.1<P<0.2,可用配对t 检验 表8-1 12份血清两法测血清谷-丙转氨酶(nmol· S-1/L)的比较

检验步骤 1. 建立检验假设,确定检验水平 2. 求检验统计量T值 ①省略所有差值为0的对子数,令余下的有效对子数为n,见表8-1第(4)栏,本例 n=11;

②按差值的绝对值从小到大编秩,然后分别冠以正负号。遇差值绝对值相等【称为相同秩(ties)】则取平均秩,(样本较小时,如果相同秩较多,检验结果会存在偏性,因此应提高测量精度,尽量避免出现较多的相同秩) ③任取正秩和或负秩和为T,本例取T=11.5。

3. 确定P值,作出推断结论 (1)当n≤50时,查T界值表(附表9,p534) 判断原则:T 在范围之外,P< ;

(2)若当n>50,超出附表9范围,可用正态近似法作Z检验。

2.单个样本中位数和总体中位数比较 例8-2 已知某地正常人尿氟含量的中位数为45.30 。(总体中位数) 例8-2 已知某地正常人尿氟含量的中位数为45.30 。(总体中位数) 12名工人尿氟含量见表8-2第(1)栏(样本) 。问该厂工人的尿氟含量是否高于当地正常人? 与样本均数与总体均数比较的t检验的资料类型相同

表8-2 12名工人的尿氟含量与45.30( )比较 据经验尿氟含量不符合正态分布(本例为小样本资料,虽经正态性检验,得 ,但还是作非正态分布资料处理。

据表8-2第(3)、(4)栏,取T=1.5。

两个独立样本比较的Wilcoxon秩和检验Wilcoxon rank sum test 第二节 两个独立样本比较的Wilcoxon秩和检验Wilcoxon rank sum test

1.区间(计量)数据的两样本比较 符合参数条件时,采用两样本均数的t检验

例8-3 表8-5 肺癌病人和矽肺0期工人的RD值(cm)比较

检验 步骤 求检验统计量T 值: (同一组可直接写秩号)

确定P值,作出推断结论: p535

2.两样本等级(有序)资料的比较 表8-6 吸烟工人和不吸烟工人的HbCO(%)含量比较

①先确定各等级的合计人数、秩范围和平均秩,见表8-6的(4)栏、(5)栏和(6)栏,再计算两样本各等级的秩和,见(7)栏和(8)栏; ②本例T=1917;

③计算Z值

两独立样本比较还常用Mann-Whitney U检验 原理: 把第一个样本的n1(小于等于n2 )个变量值的每一个值,与第二个样本的每个变量值X逐个进行比较,每次比较均记录比较的结果: 小于X记1,与X相等记0.5,大于X记0。 比较结果之和即为U值。 例如:表8-5资料

表8-5 肺癌病人和矽肺0期工人的RD值(cm)比较 代入P129公式(8-3)计算Z值

完全随机设计多个样本比较的 Kruskal-Wallis H检验 第三节 完全随机设计多个样本比较的 Kruskal-Wallis H检验

一、多个独立样本(计量)比较的 Kruskal-Wallis H检验 H0 :多个总体分布位置相同; H1 :多个总体分布位置不全相同。 如果满足参数条件,这类资料一般作完全随机设计ANOVA

例8-5

样本数据存在相同秩的情况 例8-6 比较小白鼠接种三种不同菌型伤寒杆菌9D、11C和DSC1后存活日数,结果见表8-10。问小白鼠接种三种不同菌型伤寒杆菌的存活日数有无差别?

2.多个有序(等级)数据样本的比较 例8-7

二、多个独立样本作两两比较的 Nemenyi法检验 当经过多个独立样本比较的kruskal-Wallis H检验拒绝H0,接受H1 ,认为多个总体分布位置不全相同时,若要进一步推断是哪两两总体分布位置不同,可用Nemenyi法检验(Nemenyi test)。

第四节 随机区组设计多个样本比较的 Friedman M检验

一、Friedman M检验方法 例8-9 8名受试对象在相同实验条件下分别接受4种不同频率声音的刺激,他们的反应率(%)资料见表8-12。问4种频率声音刺激的反应率是否有差别?

二、两两比较的q检验 当经过多个相关样本比较的Friedman M检验拒绝H0 ,接受H1 ,认为多个总体分布位置不全相同时,若要进一步推断是哪两两总体分布位置不同,可用q检验。

.

参数检验 parametric test 如 t 检验: F 检验: 这时,对总体参数的假设检验称为参数检验。 (1)总体分布类型已知,如率服从二项分布、样本均数服从正态分布; (2)由样本参数推断未知总体参数。 这时,对总体参数的假设检验称为参数检验。 如 t 检验: F 检验:

非参数检验(nonparametric test)对数据的总体分布类型不作严格假定,又称任意分布检验(distribution-free test), 它直接对总体分布的位置作假设检验。

秩转换 rank transformation 将数值变量值从小到大,或等级变量值从弱到强转换成秩次。 例1 11只大鼠存活天数: 存活天数4,10,7,50,3,15,2,9,13,>60,>60 秩次 3 6 4 9 2 8 1 5 7 10 11 10.5 10.5 例2 7名 肺炎病人的治疗结果: 危险程度 治愈 治愈 死亡 无效 治愈 有效 治愈 秩次 1 2 7 6 3 5 4 2.5 2.5 7 6 2.5 5 2.5 秩相同取平均秩!!

参数检验 非参数检验 (nonparametric test) (parametric test) 已知总体分布类型,对未知参数进行统计推断 对总体的分布类型不作严格要求 不受分布类型的影响,比较的是总体分布位置 依赖于特定分布类型,比较的是参数 优点:方法简便、易学易用,易于推广使用、应用范围广;可用于参数检验难以处理的资料(如等级资料,或含数值“>50mg”等 ) 缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低;样本含量较大时,两者结论常相同

Nonparametric statistics 非参数统计 Nonparametric statistics

参数分析和非参数分析 1)参数分析(parametric analysis):要求数据取自分布为已知的总体,或对数据的分布有要求。 2)非参数分析(nonparametric analysis):不要求数据取自分布为已知的总体,或对数据的分布无要求。不依赖总体分布具体形式的检验方法.。 例如:总体均数估计,t-test, ANOVA 用样本统计量对已知分布的未知参数进行估计或检验。 。

非参数分析方法的应用 1)配对两样本的比较 2)成组两样本的比较 3)成组多样本的比较 4)配伍多样本的比较 5)变量之间的关联性

一、Wilcoxon 符号秩和检验 应用: 配对样本总体均值的比较

1、Wilcoxon 符号秩和检验的概念 Wilcoxon 符号秩 (sign rank):将数据按其绝对值大小由小到大排列(0排除在外),给出顺序号(如果数据相同,取其顺序号的均数);然后每一个顺序号赋予一个和原数据相同的符号。这样得到的数称为符号秩。

例如:Wilcoxon符号秩的求法 Id x1 x2 d d rank 1 0.5 0.3 0.2 0.2 1 2 2.3 1.3 1.0 1.0 5 3 1.3 1.6 0.3 -0.3 -2.5 4 1.4 1.4 0.0 0.0 - 5 1.4 2.0 0.6 -0.6 - 4 6 1.7 1.4 0.3 0.3 2.5 7 2.3 1.1 1.2 1.2 6 8 2.1 0.8 1.3 1.3 7

符号秩和 (sum of sign rank): 正秩和 T(+) =所有正的符号秩之和; 负秩和 T( - )=所有负的符号秩的绝对值之和。 例如: T(+)=1+5+2.5+6+7=21.3 T (-)=| - 2.5 - 4 |=6.5 Id x1 x2 d rank 1 0.5 0.3 0.2 1 2 2.3 1.3 1.0 5 3 1.3 1.6 -0.3 -2.5 4 1.4 1.4 0.0 - 5 1.4 2.0 -0.6 - 4 6 1.7 1.4 0.3 2.5 7 2.3 1.1 1.2 6 8 2.1 0.8 1.3 7

2、Wilcoxon符号秩和检验的方法步骤 1)统计假设: 2)计算秩、秩和、有效对子数n和T: T=min{T(+), T(-)} 3)确定统计量及其分布:当H0成立时,

连续性校正公式: 4)作出统计结论: a)当n 较小时,查附表10,确定推断H0的p-值: 如果T< T(n,α),则 p <α; 如果T >T(n,α),则 p >α。 b)当n 较大时,利用近似正态分布性进行统计推断。

3、Wilcoxon符号秩和检验法的应用举例 例1a: Id x1 x2 d rank 1 0.5 0.3 0.2 1 2 2.3 1.3 1.0 5 3 1.3 1.6 -0.3 -2.5 4 1.4 1.4 0.0 - 5 1.4 2.0 -0.6 - 4 6 1.7 1.4 0.3 2.5 7 2.3 1.1 1.2 6 8 2.1 0.8 1.3 7

(3) 求T(+)和T(-):T(+)=21.5,T(-)=6.5 (4) 求T T=min{T(+), T(-)}=6.5 1. 建立检验假设,确定检验水准 α= 0.05 2. 计算统计量T 求差值d (2) 给d编秩并带上符号 (3) 求T(+)和T(-):T(+)=21.5,T(-)=6.5 (4) 求T T=min{T(+), T(-)}=6.5 3. 确定概率,判断结果 n=7,查附表10,T>T(7, 0.05)=2, p>0.05,不拒绝H0。

SAS 程序 data d1; input id x1 x2 ; d=x1-x2; cards; 1 0.5 0.3 2 2.3 1.3 3 1.3 1.6 4 1.4 1.4 5 1.4 2.0 6 1.7 1.4 7 2.3 1.1 8 2.1 0.8 run; proc univariate; var d;

SAS 输出结果 Univariate Procedure Variable=D1 Moments N 8 Sum Wgts 8 Mean 0.3875 Sum 3.1 Std Dev 0.70799 Variance 0.50125 Skewness 0.092637 Kurtosis -1.53212 USS 4.71 CSS 3.50875 CV 182.7071 Std Mean 0.250312 T:Mean=0 1.548066 Pr>|T| 0.1655 Num ^= 0 7 Num > 0 5 M(Sign) 1.5 Pr>=|M| 0.4531 Sgn Rank 7.5 Pr>=|S| 0.2344

例1b:研究者用配对设计研究两种处理方法结果有无差异。由于数据不满足参数检验的假设条件,现决定用Wilcoxon符号秩和检验法分析数据。经计算两组数据差值 d 的符号秩和T=50, 有效对子数 n=59,试作统计推断。

2. 计算统计量 3. 确定P值,判断结果 1. 建立检验假设,确定检验水准 α= 0.05 T=50, n=59 z=6.30>2.58,P<0.01, 在α= 0.05检验水准上拒绝H0,可认为两种处理方法结果有显著性差异。

二、Wilcoxon 秩和检验 应用: 成组设计(完全随机设计)两样本总体均值的比较

1、Wilcoxon 秩和检验的概念 Wilcoxon 秩 (rank):将所有数据由小到大排列,给出顺序号(如果数据相同,取其顺序号的均数)。这样得到的数称为秩。 Wilcoxon秩的求法: Id x1 rank id x2 rank 1 0.5 2 1 0.0 1 2 2.3 12 2 2.2 11 3 1.3 3 3 1.6 8 4 1.4 5.5 4 1.4 5.5 5 2.0 10 5 1.4 5.5 6 1.7 9 6 1.4 5.5 7 2.5 13

秩和 (sum of rank): 秩和 T1 =样本数小的秩之和 秩和 T2=n1(n1+n2+1) – T1(假设 n1<n2) 例如: n1=6, n2=7,T1=36.5, T2=6(6+7+1) -36.5=47.5。 Id x1 rank id x2 rank 1 0.5 2 1 0.0 1 2 2.3 12 2 2.2 11 3 1.3 3 3 1.6 8 4 1.4 5.5 4 1.4 5.5 5 2.0 10 5 1.4 5.5 6 1.7 9 6 1.4 5.5 7 2.5 13 组秩和: 54.5 36.5

2、秩和检验的方法步骤 1)统计假设: 2)计算秩、秩和、样本数n1,n2和T: T=min{T1, T2} 3)确定统计量及其分布:当H0成立时,

连续性校正公式: 4)作出统计结论: a)当n 较小时,查附表11,确定推断H0的p-值: 如果T< T(n1,n2,α),则 p <α; 如果T >T(n1,n2,α),则 p >α。 b)当n 较大 时,利用近似正态分布性进行统计推断。

3、Wilcoxon秩和检验法的应用举例 例2a: Id x1 rank id x2 rank 1 0.5 2 1 0.0 1 2 2.3 12 2 2.2 11 3 1.3 3 3 1.6 8 4 1.4 5.5 4 1.4 5.5 5 2.0 10 5 1.4 5.5 6 1.7 9 6 1.4 5.5 7 2.5 13

2. 计算统计量T T=36.5, 3. 确定P值,判断结果 1. 建立检验假设,确定检验水准 α= 0.05 n1=6, n2=7, 查附表11得: T(6,7, 0.05)=27, T>T(6,7, 0.05), p>0.05,不拒绝H0。

SAS 程序 data d2; do id=1 to 7; do a=1 to 2; input y @@; output; end; cards; 0.5 0.0 2.3 2.2 1.3 1.6 1.4 1.4 2.0 1.4 1.7 1.4 2.5 . run; proc npar1way data=d2 wilcoxon; class a; var y;

SAS 输出结果 N P A R 1 W A Y P R O C E D U R E Wilcoxon Scores (Rank Sums) for Variable Y Classified by Variable A Sum of Expected Std Dev Mean A N Scores Under H0 Under H0 Score 1 7 54.5000000 49.0 6.90317653 7.78571429 2 6 36.5000000 42.0 6.90317653 6.08333333 Average Scores Were Used for Ties Wilcoxon 2-Sample Test (Normal Approximation) (with Continuity Correction of .5) S = 36.5000 Z = -.724304 Prob > |Z| = 0.4689

例2b: 为研究慢性支气管病人痰液中嗜酸性粒细胞是否高于正常人,选择了24名正常人和44名患者。由于数据不满足参数检验的假设条件,现决定用Wilcoxon秩和检验法来分析数据。经计算正常人组的秩和T=560.5, 试作统计推断。

1. 建立检验假设,确定检验水准 α= 0.05 2. 计算统计量 T=560.5, n1=24,n2=44 3. 确定P值,判断结果 z=3.43>2.58,P<0.01, 在0.05检验水准上拒绝H0。 即可认为两者有显著性差异。

三、 Kruskal-Wallis 秩和检验 应用: 成组设计(完全随机设计)多个样本总 体均值的比较

1、Kruskal-Wallis 秩和检验的概念 K-W 秩 (rank):将所有数据由小到大排列,给出顺序号(如果数据相同,取其顺序号的均数)。这样得到的数称为秩。 例如:K-W秩的求法: x1 rank x2 rank x3 rank 0.5 1 1.0 2 1.2 3 1.3 4.5 1.4 6.5 2.0 9.5 1.3 4.5 1.8 8 2.2 11.5 1.4 6.5 2.0 9.5 2.2 11.5

秩和 (sum of rank): 组秩和 Ti =第 i 组的秩之和。 例如: n1=4, T1=16.5 n2=4, T2=26.0 n3=4, T3=35.5 n=n1+n2+n3=12 x1 rank x2 rank x3 rank 0.5 1 1.0 2 1.2 3 1.3 4.5 1.4 6.5 2.0 9.5 1.3 4.5 1.8 8 2.2 11.5 1.4 6.5 2.0 9.5 2.2 11.5

2、K-W秩和检验的方法步骤 1)统计假设: 2)计算秩和各组的秩和 Ti 和样本数 ni 3)确定统计量H:

当数据中有秩次相同的数据时: 其中, 4)作出统计推断。 当n 较小时,查附表13,确定推断H0 的 p-值; 如果min{ni}>5,用上述卡方分布作推断。

3、K-W秩和检验法的应用举例 例3a: x1 rank x2 rank x3 rank 0.5 1 1.0 2 1.2 3 1.3 4.5 1.4 6.5 2.0 9.5 1.3 4.5 1.8 8 2.2 11.5 1.4 6.5 2.0 9.5 2.2 11.5

1. 建立检验假设,确定检验水准 2. 计算统计量H H=3.496 3. 确定P值,判断结果 α= 0.05 1. 建立检验假设,确定检验水准 α= 0.05 2. 计算统计量H H=3.496 3. 确定P值,判断结果 查附表13,得到:p>0.10;不拒绝H0。

data d3; do id=1 to 4; do a=1 to 3; input y @@; output; end; cards; 0.5 1.0 1.2 1.3 1.4 2.0 1.3 1.8 2.2 1.4 2.0 2.2 run; proc npar1way wilcoxon; class a; var y; SAS 程序

SAS 输出结果 N P A R 1 W A Y P R O C E D U R E Wilcoxon Scores (Rank Sums) for Variable Y Classified by Variable A Sum of Expected Std Dev Mean A N Scores Under H0 Under H0 Score 1 4 16.5000000 26.0 5.84652189 4.12500000 2 4 26.0000000 26.0 5.84652189 6.50000000 3 4 35.5000000 26.0 5.84652189 8.87500000 Average Scores Were Used for Ties Kruskal-Wallis Test (Chi-Square Approximation) CHISQ = 3.5204 DF = 2 Prob > CHISQ = 0.1720

例3b:随机抽样得到正常人(A=1)、单纯性肥胖(A=2)和皮质醇增多症(A=3)的血浆总皮质醇测定值。问这三组人的血浆总皮质醇测定值有无显著性差异? A=1 R1 A=2 R2 A=3 R3 0.4 1 0.6 2 9.8 20 1.9 4 1.2 3 10.2 21 2.2 6 2.0 5 10.6 22 2.5 8 2.4 7 13.0 23 2.8 9 3.1 10.5 14.0 25 3.1 10.5 4.1 14 14.8 26 3.7 12 5.0 16 15.6 27.5 3.9 13 5.9 17 15.6 27.5 4.6 15 7.4 19 21.6 29 7.0 18 13.6 24 24.0 30 Ti 96.5 117.5 251

1. 建立检验假设,确定检验水准 2. 计算统计量H 3. 确定P值,判断结果 α= 0.05 H=18.129> 2(0.01,2)=9.21, P<0.01, 拒绝H0,即三个组的测定值有显著性差异。

SAS 程序 data d4; do id=1 to 10; do a=1 to 3; input y @@; output; end; cards; 0.4 0.6 9.8 1.9 1.2 10.2 2.2 2.0 10.6 2.5 2.4 13.0 2.8 3.1 14.0 3.1 4.1 14.8 3.7 5.0 15.6 3.9 5.9 15.6 4.6 7.4 21.6 7.0 13.6 24.0 run; proc npar1way wilcoxon; class a; var y;

SAS 输出结果 N P A R 1 W A Y P R O C E D U R E Wilcoxon Scores (Rank Sums) for Variable Y Classified by Variable A Sum of Expected Std Dev Mean A N Scores Under H0 Under H0 Score 1 10 96.500000 155.0 22.7252455 9.6500000 2 10 117.500000 155.0 22.7252455 11.7500000 3 10 251.000000 155.0 22.7252455 25.1000000 Average Scores Were Used for Ties Kruskal-Wallis Test (Chi-Square Approximation) CHISQ = 18.130 DF = 2 Prob > CHISQ = 0.0001

四、Nemenyi 秩和检验 应用: 多个样本总体均值的两两比较

1、Nemenyi 秩和检验的方法步骤 1)统计假设: 2)计算第i组与第j组的平均秩和之差dij: 3)计算临界值: 4)结论:如果dij > d (i,j,α),则在α水平上拒绝H0。

2、 Nemenyi 秩和检验的应用举例 例3c,对三组人的血浆总皮质醇测定值进行多重比较。 α= 0.05 1) 在例3b中,H=18.129,S2=77.47, T1=96.5,T2=117.5,T3=251 因为组样本数相同,所以三个临界值相同,它是: 2 d(0.01)=6.9211 = 即 d(1,2)=2.1, p>0.05,不拒绝H0。

2)同理,d(1,3)=15.45,p<0.01,拒绝H0; d(2,3)=13.35,p<0.01,拒绝H0。 各组之间平均等级的两两比较 比较组别 P 1与2 2.1 >0.05 1与3 15.45 <0.01 2与3 13.35

五、Friedman 秩和检验 应用: 随机区组资料多个样本总体均值的总比较

例:今测得6名产妇羊水中前列腺素含量(ng)如下表,问不同时间羊水中前列腺素含量差别有无统计学意义?

表15.12 不同时间产妇羊水中前列腺素含量(ng) 编号 用药前 用药后1小时 产程开始 分娩时 1 0.032 (1) 0.040(2) 4.90(3) 22.2(4) 2 0.040(1) 0.074(2) 4.80(3) 21.1(4) 3 0.070(1) 0.093(2) 1.70(3) 17.7(4) 4 0.011(1) 0.099(2) 1.04(3) 3.93(4) 5 0.078(2) 0.074(1) 2.12(3) 14.58(4) 6 0.289(1) 0.300(2) 7.04(3) 13.93(4) mi 7 11 18 24 (mi - E) - 8 -4 3 9 (mi - E)2 64 16 9 81

1. 建立检验假设,确定检验水准 2. 计算统计量M H0:不同时间羊水中前列腺素含量相同。 α= 0.05 2. 计算统计量M (1)在各区组(b)内编秩,相同数据取平均秩次 (2)求各处理组(k)秩和mi (3) 求平均秩E: b:区组数,k:处理数 本例b=6,k=4,则 (4) 计算M

3. 确定概率,判断结果 查附表12,当b=6,k=4时,M0.05=76。 因M=170>M0.05,P<0.05,故可认为不同时间羊水中前列腺素含量差异有统计学意义。 20.05(3)=7.81, 20.01(3)=11.34 2=17> 20.01(3) , P<0.01

SAS 程序 data a; input block group y @@; cards; 1 1 0.032 1 2 0.04 1 3 4.9 1 4 22.2 2 1 0.04 2 2 0.074 2 3 4.8 2 4 21.1 3 1 0.07 3 2 0.093 3 3 1.7 3 4 17.7 4 1 0.011 4 2 0.099 4 3 1.04 4 4 3.93 5 1 0.078 5 2 0.074 5 3 2.12 5 4 14.58 6 1 0.289 6 2 0.3 6 3 7.04 6 4 13.93 ; Proc freq; tables block*group*y / noprint cmh2 scores=rank; run;

SAS 输出结果 The FREQ Procedure Summary Statistics for group by y Controlling for block Cochran-Mantel-Haenszel Statistics (Based on Rank Scores) Statistic Alternative Hypothesis DF Value Prob 1 Nonzero Correlation 1 16.8200 <.0001 2 Row Mean Scores Differ 3 17.0000 0.0007 Total Sample Size = 24

六、随机区组资料的两两比较(P215) 应用: 随机区组资料多个样本总体均值的两两比较

七、等级相关 应用: 两个样本的相关分析 当两个变量不服从正态分布时,可以采用等级相关分析。

回忆: Pearson相关系数的估计和检验 1)估计相关系数ρ,估计公式: y x 80 307 75 259 90 341 70 237 80 307 75 259 90 341 70 237 75 254 105 416 70 267 85 320 88 374 78 316 其中,{xi}和{yi}是服从正态分布的两个随机变量, 分别是这两个随机变量的均值。

2、 计算估计值r 的标准误 3、 ρ的假设检验 H0: ρ=0 vs H1: ρ≠0 4、统计推断结论:查ν=n-2 的 t-分布表。

Spearman 相关系数的估计和检验 1、ρ的估计公式: 当两个随机变量{xi}和{yi}不服从正态分布或分布未知时,用下面公式估计相关系数,这就是Spearman相关系数。 其中{si}和{ti}分别是{xi}和{yi}的秩, 分别是{si}和{ti}的均值。

超出该表范围,可直接查相关系数界值表,=n-2 Spearman相关系数ρ的简化公式: 其中,d= s-t 2、 ρ 的假设检验 H0: ρ=0 vs H1: ρ≠0 n<50, 查附表14。 超出该表范围,可直接查相关系数界值表,=n-2

【例15. 6】 某地作肝癌病因研究,调查了10个不同地区肝癌死亡率(1/10万)与某种食物中黄曲霉素相对含量,见表15 【例15.6】 某地作肝癌病因研究,调查了10个不同地区肝癌死亡率(1/10万)与某种食物中黄曲霉素相对含量,见表15.16第(2)、(4)栏。试作等级相关分析 。

地区 黄曲霉素 肝癌 等级差 编号 相对含量x 等级 死亡率Y d d2 (1) (2) (3) (4) (5) (6)=(3)-(5) 等级差平方 编号 相对含量x 等级 死亡率Y d d2 (1) (2) (3) (4) (5) (6)=(3)-(5) (7)=(6)2 1 0.7 21.5 3 2 4 2 1.0 18.9 1.7 14.4 3.7 46.5 7 3 9 5 4.0 27.3 6 5.1 64.6 5.5 46.3 8 5.7 34.2 5.9 77.6 10 1 10.0 55.1 合计 42

H1:不同地区肝癌死亡率与黄曲霉素相对含量相关。 1. 建立检验假设,确定检验水准 H0: 不同地区肝癌死亡率与黄曲霉素相对含量不相关。 H1:不同地区肝癌死亡率与黄曲霉素相对含量相关。 α= 0.05 2. 计算统计量rs (1)编等级 (2)求等级差d及d2 (3) 计算rs rs=1- 3. 确定概率,判断结果 查表得rs0.05(10)=0.648, rs0.01(10)=0.794 P<0.05, 拒绝H0,可认为黄曲霉素与肝癌死亡率间 存在正相关。

data d5; input x y @@; cards; 0.7 21.5 1.0 18.9 1.7 14.4 3.7 46.5 4.0 27.3 5.1 64.6 5.5 46.3 5.7 34.2 5.9 77.6 10.0 55.1 run; proc corr nosimple spearman; var x y; SAS 程序

SAS 输出结果 Correlation Analysis 2 'VAR' Variables: X Y Spearman Correlation Coefficients / Prob > |r| under Ho: Rho=0 / N = 10 X Y X 1.00000 0.74545 0.0 0.0133 Y 0.74545 1.00000 0.0133 0.0 SAS 输出结果

SUMMARY Wilcoxon符号秩和检验:配对设计两样本比较 Wilcoxon秩和检验:成组设计两样本比较 Kruskal-Wallis秩和检验:成组设计多样本比较 Nemenyi秩和检验:成组设计多样本两两比较 Friedman秩和检验:随机区组设计资料的多样本比较 Spearman 相关系数的估计和统计检验。

作业:实习册—P27:2,3,4 P226 2,4