考试 1. 时间 :2011 年 11 月 14 日 18:30 2. 地点 : 待定 3. 方式 : 开卷考试 4. 题目类型:待定 5. 计算机操作要求:会用 spss 录数据、计算机 操作、认读结果、制作统计表、按假设检 验步骤进行假设检验
例题 例 为比较定量骨超声测定仪与磁共振成像 仪对原发性骨质疏松性椎体骨折诊断结果是否 有差别,某医师分别对 16 例伴有脊椎压缩性骨 折绝经妇女,采用两法检测骨硬度( Stiffness ) (%) ,结果见表 12-1 第( 2 )、( 3 )栏。问:两 法检测结果是否有差别?
两个分类变量间关联的密切程度 关联系数 C(contingency coefficient) Crosstabs 下: Statistics-nominal-contingency coefficient
例题 12.1 骨硬度 (%) 观察对象 骨超生磁共振 问题 : 1 、资料类型 2 、设计类型 3 、统计描述指标 4 、统计推断方法
例 12.1 两法测定硬度差值的频数分布图
例题 12.1 Statistics DIFF NValid16 Missing 0 Mean Median Std. Devia Range 57 Minimum -20 Maximum 37 Percentiles
第七课 基于秩转换的非参数检验 参数检验( parametric test ) 假定随机样本来自已知分布的总体,利用 某已知分布推断两个或两个以上总体参数是否相 同的方法( t 检验、方差分析)。 非参数检验( nonparametric test ) 不依赖总体分布的具体形式,对总体分布 不作严格限制 ,不对参数,而是对分布进行比较 的假设检验方法(卡方检验)。
非参数检验 (nonparametric test) 对总体的分布没有特定的假设, 对总体的分布没有特定的假设, 不是用样本观测指标的实测值直接构造统计 量进行检验, 不是用样本观测指标的实测值直接构造统计 量进行检验, 通过将样本实际数据排序编秩后,对秩次进 行比较。或者是根据某种特征计数,然后比 较不同特征的个数。 通过将样本实际数据排序编秩后,对秩次进 行比较。或者是根据某种特征计数,然后比 较不同特征的个数。
比较两 / 三个班级同学的身高 先让三个班的同学站在一起,按高矮排队后连续报 数 先让三个班的同学站在一起,按高矮排队后连续报 数 每个班分别将自己班上同学所报数的数字相加,然 后再除以班级的人数 每个班分别将自己班上同学所报数的数字相加,然 后再除以班级的人数 如果三个班同学的身高相近,其结果是三个班所报 数字 ( 即身高的秩次 ) 的平均数应该是很接近的。 如果三个班同学的身高相近,其结果是三个班所报 数字 ( 即身高的秩次 ) 的平均数应该是很接近的。 如果各班的平均数相差很大,则有理由相信其中某 个班同学的身高比其它班高。 如果各班的平均数相差很大,则有理由相信其中某 个班同学的身高比其它班高。 这就是秩和检验的思想。构造的统计量为秩和统计 量。 这就是秩和检验的思想。构造的统计量为秩和统计 量。
秩检验 秩检验主要适用于以下情况: 数值变量资料:严重偏离正态分布或者分布未知。 数值变量资料:完全随机设计中方差不齐。 有序分类资料(等级资料) 注:但数据满足参数检验的条件时,若采用秩检验, 会降低统计效能 ( 1- ) 。
配对设计差值比较的符号秩检验 1 、由 Wilcoxon 1945 年提出,又称 Wilcoxon 符 号秩检验 2 、常用于检验差值的总体中位数是否等于零。
例 为比较定量骨超声测定仪与磁共振成像仪 对原发性骨质疏松性椎体骨折诊断结果是否有差别, 某医师分别对 16 例伴有脊椎压缩性骨折绝经妇女, 采用两法检测硬度( Stiffness ) (%) ,结果见表 12-1 第( 2 )、( 3 )栏。问:两法检测结果是否 有差别?
例 建立检验假设和确定检验水准 H0 :两种方法测得结果相同,即差值总体中位数等于零 H1 :两种方法测得结果不同,即差值总体中位数不等于零 =0.05
2. 计算检验统计量 T 值 1) 求每对数据差值 2) 按差值绝对值从小到大编秩 ( 名次 ) 3) 在秩次前冠以差值符号,以示标记 4) 编秩时若遇差值等于零,舍去不计,并从观察单位数中 减去零的个数 5) 遇有差值的绝对值相等,符号不同,取其平均秩次。
例题 12.1 骨硬度 (%) 观察对象 骨超生磁共振差值正秩次 负秩次
2. 计算检验统计量 T 值 6) 分别求秩和,差值为正的秩次和以 T+ 表示,差值为负的 秩次和以 T- 表示。可任取 T+ 或 T- 作为检验统计量 T ,本例 取 T=22
3. 确定 P 值和做出推断结论 1 ) 当 n≤50 时,查 T 界值表, 若 T 落在秩和上界值或下界值范围外或恰等于界值时则; 若 T 落在上、下界值范围内,则。 本例: T=22 ,查 T 界值表 (附表 ), T 落在 双尾的界值范围外,得, 按 水准,拒绝 H 0 两种方法测定伴有脊椎压缩性骨折绝经妇女病人的骨 硬度( Stiffness ) (%) 不同,差别有统计学意义。
正态近似法 1 、 时 2 、公式 3 、对相同 秩次数的 校正公式 tj :第 j 个相同差值的个数( j=1 , 2 , … , k ),假定差值中有 2 个 5 、 2 个 20 , 则 t1=2 , t2=2 ,则 = 12 。
基本思想 假定两组测定结果相同 1 )变量差值的秩次的总体分布对称,这时差值秩次的总体 中位数为 0 。 2 )若 H 0 成立,则样本中差值秩次为正或为负的秩和应相近, T 值偏离平均秩和也就不会太大,即超出按检验水准所列界 值范围的可能性就不应该很大。 反之,若 ,则按检验水准,拒绝 H 0 ,认为差值秩次的 总体中位数为零的可能性较小。
例 某医师测得甲乙两组 28 名妇女大腿内侧皮下脂肪厚 度( mm )如下:问两组妇女的大腿内侧皮下脂肪厚度是否 不同? 甲组 乙组 , 问题 : 1 、资料类型 2 、研究设计类型 3 、统计描述指标 4 、统计推断方法
Mann-Whiter U 检验的基本原理 例 12.2 缺氧条件下猫和兔的生存时间是否有差别 Ho :猫和兔的缺氧生存时间总体分布相同 H1 :猫和兔的缺氧生存时间总体分布不同 U 值的定义和计算 两组数据混合从小到大排序编秩: 原始数据 >21 组别 A B A A B B A B A 前 B 个数 U=5 B 前 A 个数 U’=11
假设所有 A 组数据均小于 B 组数据 两组数据混合从小到大排序编秩: 原始数据 >21 组别 A A A A B B B B A 前 B 个数 U=0 B 前 A 个数 U’=n 1 X n 2 =16 假设所有 B 组数据均大于 A 组数据 原始数据 >21 组别 B B B B A A A A A 前 B 个数 U= n 1 X n 2 =16 B 前 A 个数 U’= 0 U 的取值范围: 0 - n 1 X n 2 0 - 16 U/ n 1 X n 2 :A 总体的随机观察值超过 B 总体的随机观察值的概率
Mann-Whiter U 检验的基本思想 : U 分布的确定: 各含 4 个观察值的两组数据( n 1 = 4 , n 2 = 4 ) 总排列数: 8 ! /(4 ! 4 ! ) = 70 H 0 成立时,每一种排列的概率相等,为 1/70 不同 U 值的概率 U 频数 概率 P
单侧尾部概率的计算: U 频数 概率 P 累计概率 U 频数 概率 P 双侧尾部概率的计算=单侧尾部概率 X2 查表法
例 某医师测得甲乙两组 28 名妇女大腿内侧皮下脂肪厚 度( mm )如下:问两组妇女的大腿内侧皮下脂肪厚度是否 不同? 甲组 乙组 ,
Mann-Whiter U 检验: 建立检验假设确定检验水准 H o :甲乙两组妇女大腿内侧皮下脂肪厚度总体分布相同 H 1 :甲乙两组妇女大腿内侧皮下脂肪厚度总体分布不同
计算检验统计量 1 、甲乙两组数据混合排队编秩: 实测值 组 秩 B 前 实测值 组 秩 B 前 实测值 组 秩 B 前 别 A 别 A 别 A 1.8 A B B B A A B A A B A A B B A A A A A A B A B A A A A A 20
计算统计量 U : U=B 前 A 的个数 =59.5 确定 P 值做出统计推断: n 1 Xn 1 =19X9=171 中位数= 171/2=85.5 U 0.05 =45 U 0.05 按 的检验水准,不拒绝 H 0 。尚不能认为乙组大腿内 侧皮下脂肪厚度有超过甲组的倾向。 大样本时,用正态近似法。
Kruskal-Walls 秩和检验
对于单因素完全随机设计的资料: 如果观测指标是数值型变量(也可以是 等级变量),当正态性和等方差性得不到满 足时,可以使用 Kruskal - Walls 秩和检验, 对其分布进行比较。 如果观测指标是数值型变量(也可以是 等级变量),当正态性和等方差性得不到满 足时,可以使用 Kruskal - Walls 秩和检验, 对其分布进行比较。 Kruskal-Walls 秩和检验是一种非参数检 验。 Kruskal-Walls 秩和检验是一种非参数检 验。
Kruskal-Wallis 秩和检验
例 用 Kruskal-Wallis 秩和检验的统计分析。
SPSS
非参数检验的效率 进行非参数检验时没有对总体的分布类型进 行假设,所以备择假设的范围太广,不宜计 算检验效能。 进行非参数检验时没有对总体的分布类型进 行假设,所以备择假设的范围太广,不宜计 算检验效能。
假设检验 两组数值变量比 较 正态性、等方差假设 正态性、等方差假设 t- 检验 t- 检验 正态性假设成立、不等方差 正态性假设成立、不等方差 调整的 t- 检验 调整的 t- 检验 正态性、等方差假设不成立 正态性、等方差假设不成立 Wilcoxon 秩和检 验 Wilcoxon 秩和检 验 在正态性、等方差假设成立时 t- 检验的效率 是好的。 在正态性、等方差假设成立时 t- 检验的效率 是好的。
假设检验 多组数值变量比较 正态性、等方差假设 正态性、等方差假设 方差分析 方差分析 正态性、等方差假设不成立 正态性、等方差假设不成立 Kruskal-Wallis 秩和检验 Kruskal-Wallis 秩和检验
单向有序分类变量的秩和检验- 两样本 正常人和慢性支气管炎病人痰液的白细胞比较 结果 正常人 病人 合计 秩次 平均秩次 秩和 T1 T2 - - ×8.5 + - ×30 ++ - ×54.5 +++ - 合计
1. 建立检验假设 H 0 两组痰液中此类白细胞总体分布相同 H 1 两组痰液中此类白细胞总体分布不同 2. 编秩 3. 求秩和并确定检验统计量 查表或公式 4. 确定 p 值和做出统计结论 5.SPSS 命令: Nonparametric tests-2 independent samples-Mann Whitney U Z 统计量
单向有序分类变量的秩和检验- 多个样本 A 、 B 、 C 三种药物治疗单纯性慢性支气管炎,问三种药物 的总体疗效是否不同 疗效 A B C 合计 秩次 平均秩次 秩和 T1 T2 T3 治愈 - 显效 - 好转 - 无效 合计
1. 建立检验假设 H 0 三种药物疗效的总体分布相同 H 1 三种药物疗效的总体分布不同或不全相同 2. 编秩 3. 求秩和并确定检验统计量 H 查表或公式 4. 确定 p 值和做出统计结论 5.SPSS 命令: Nonparametric tests-K independent samples-Kruskal Wallis H 统计量