第八章 X2 检验 卫生(医学)统计学 普通高等教育 “ 十一五 ” 国家级规划教材
X 2 检验用途 1 、推断两个或两个以上的总体率或总体构 成比 之间有无差别; 2 、推断两种属性或两个变量之间有无关联 性; 3 、频数分布的拟合优度检验。
X 2 检验类型 1 、四格表资料X 2 检验; 2 、配对计数资料X 2 检验; 3 、行 × 列( R×C )表资料X 2 检验; 4 、行 × 列( R×C )列联表X 2 检验。
四格表资料X 2 检验 一、用途: 推断两个总体率有无差异 。 表 8.1 两组人尿棕色素阳性率比较 组 别 阳性数 阴性数 合计 阳性率 % 铅中毒 29 ( ) 7 ( ) 对照组 9 ( ) 8 ( ) 合 计 注:括号内为理论频数
检验基本思想 值的计算方法(通用公式): 式中 A 为实际数, T 为理论数,根据 H 0 的假设推 算出来。 为 R 行 C 列的理论数; n R 为 T 所在行合计数 ; n C 为 T 所在列合计数。 X2X2
从 值计算公式可以看出, 检验是检验实际分 布和理论分布的吻合程度。若 H 0 假设成立,则实际 分布( A) 和理论分布 (T) 相差不大, 值应较小;若 H 0 假设不成立,则实际分布( A) 和理论分布 (T) 相差 较大, 值应较大。另外 值的大小尚与格子数 (自由度)有关,格子数越多, 值越大。 可以根据 分布原理,由 值确定 P 值,从而作出 推论。 V=( 行数 -1)( 列数 -1)
四格表资料 X 2 检验专用公式: 式中 : a 、 b 、 c 、 d 为四个实际数,其中 a 、 c 为阳性数, b 、 d 为阴性数, n 为总例数。
X 2 检验过程 1 、建立假设 H 0 : π 1 = π 2 H 1 : π 1 ≠π 2 α = 、计算 X 2 值 ( 1 ) 用基本公式计算 T 11 = (38×36) / 73 = T 12 = = T 21 = 38 - = T 22 = = 17.74
(2) 用专用公式计算 a=29 、 b=7 、 c=9 、 d=28 、 n=73
3 、查 X 2 界值表确定 P 值 按= 1 ,查附表 8 , X 2 界值表得: X , 1 =3.84 、 X , 1 =6.63 、 X , 1 =7.88 X 2 >7.88, P< 、推断结论 P<0.005, 按 α = 0.05 ,拒绝 H 0 ,接受 H 1 ,可认为 两总体阳性率有差别,铅中毒病人尿棕色素阳性率高 于正常人,说明铅中毒有尿棕色素增高现象。
四格表资料 X 2 检验的校正 1 、四格表资料检验条件: ( 1 ) 当 n≥40 且所有 T≥5, 用普通 X 2 检验,若 P≈ ,改用 四格表确切概率法(直接计算概率法); ( 2 )当 n≥40 ,但 1≤T<5 时, 用校正的 X 2 检验; (3) 、当 n<40 或 T<1 时,用四格表确切概率法。
2 、校正公式: (1) 、基本公式: (2) 、专用公式:
表 8.3 穿新旧两种防护服工人的皮肤炎患病率比较 ━━━━━━━━━━━━━━━━━━━━━━━ 防护服种类 阳性数 阴性数 合计 患病率 (%) ─────────────────────────────── 新 1(3.84) 旧 ─────────────────────────────── 合计 ━━━━━━━━━━━━━━━━━━━━━━ 例 8.2
1 、建立假设 H 0 : π 1 = π 2 H 1 : π 1 ≠π 2 α = 、计算 X 2 值 因 T 11 =3.84<5, 故需要使用校正公式 用专用公式: a=1 、 b=14 、 c=10 、 d=18
3 、查X 2 表确定 P 值 V = 1 , X , 1 =3.84 ,X 2 = 、推断结论 P>0.05 ,按 α = 0.05 水准,接受 H 0 ,尚不能认为两组患病率有 差别。 ( 如不校正,X 2 =4.33, X , 1 =3.84 , P<0.05 ,结论相 反。 )
四格表的确切概率法 一、应用范围 1 、当四格表的 T<1 或 n<40 时; 2 、用四格表 X 2 检验所得的概率接近检验水准时 二、四格表确切概率法的基本思想 (一)四格表中的 |A - T| 值有两个特点 1 、各格相等 ; 2 、依次增减四格表中某格数据,在周边合计数不 变条件下,可列出各种组合的四格表。
(二)四格表确切概率法的基本思想 在周边合计数不变条件下,列出各种组合的四格 表,然后计算所有 |A - T| 值等于及大于样本 |A - T| 值 的四格表的 P 值,将其相加,即得到检验概率 P 。 双侧检验: 对所有 |A - T| 值等于及大于样本 |A - T| 值的四格表 P 值相加; 单侧检验: 按检验目的,取阳性数增大或减小一侧 的 |A - T| 值等于及大于样本 |A - T| 值四格表;
四格表概率 P 的计算公式 (a+b)!(c+d)!(a+c)!(b+d)! P = ──────────── a!b!c!d!n!
例 8.8 表 8.9 两型慢性布氏病的 PHA 皮试反应 ━━━━━━━━━━━━━━━━━━━ 分型 阳性数 阴性数 合计 阳性率 (%) ─────────────────── 活动型 1(2.4) 14(12.6) 稳定型 3(1.6) 7(8.4) ─────────────── 合计 ━━━━━━━━━━━━━━━━━━━
各种组合的四格表: (1) (2) (3) (4) (5) |A-T| 值: P(i) 样本四格表
计算 P 值: 15!10!4!21! P(1) = ────── = !15!4!6!25! 15!10!4!21! P(2) = ────── = !14!3!7!25! 15!10!4!21! P(5) = ────── = !11!0!10!25! P = P(1) + P(2) + P(5) =
∵ P = >0.05 ,∴ 在 α = 0.05 水准上,不拒绝 H 0 , 故尚不能两型患者的反应阳性率有差别。 1 、当 T>5 (所有格子),且 n>40 时,应用 或 四格表检验小结
2 、当 1 40 时,用 ( 1 ) 或 ( 2 )或改用确切概率计算法
3 、当 T<1 或 n<40 时, 不能用X 2 检验的所有计算公式, 只能应用确 切概率计算法。 4 、当四格表有一个格子的实际数为 0 时,也 不能用X 2 检验法, 可以采用确切概率法。
配对四格表资料的 X 2 检验 一、 用途: 用于配对计数资料的检验: ( 1 )两种方法有无差别; ( 2 )两种方法有无关联(计数资料相关分析)。
二、配对的形式 1 、同一个样品,用两种方法处理的结果; 2 、同一个病例用两种方法诊断或检查的结果; 3 、匹配的一对病例和对照是否存在某种病因 ; 4 、配对的两个对象分别接受不同处理的结果。 配对计数资料经整理后,得出四个数据: a :甲乙两者均为阳性; b :甲阳性而乙阴性; c :甲阴性而乙阳性; d :甲乙两者均为阴性。
表 8.4 两种血清学检验结果比较 甲法 乙 法 合计 + - + 45 ( a ) 22 ( b ) 67 - 6 ( c ) 20 ( d ) 26 合计 这是配对设计计数资料,表中两法的差别是由 b 和 c 两 格数据来反映。总体中 b 和 c 对应的数据可用 B 和 C 表示。
H 0 : 两总体阳性检出率相等,即 B=C ; H 1 : 两总体阳性检出率不等,即 B≠C ; α=0.05 X 2 =, v=1 若 b+c<40: X 2 =, v=1
V=1 ,查界值表得: =7.88 , >, P<0.005 按 α=0.05 水准拒绝 H 0 ,接受 H 1 ,故可认为甲乙两法 的血清学阳性检出率不同。参照结果,说明甲法的 阳性检出率较高。 注意:当 a 和 d 的数字特别大而 b 和 c 的数字较小时, 即使检验结果有统计学意义,而实际意义也不大。 故配对四格表 X 2 检验一般用于检验样本含量不太大 的资料。
行 × 列( R×C )表的X 2 检验 一、用途: 1 、推断两个或以上的总体率(或构成比)有 无差异。 2 、推断两个分类变量间有无关联性 ( 计数资料 相关分析 ) 二、检验公式: V= (行 -1 )(列 -1 )
三、应用举例 (一)多个样本率的比较 表 8.4 某省三个地区花生的黄曲霉毒素 B 污染情 ━━━━━━━━━━━━━━━━━━━━━ 地区 未污染 污染 合计 污染率 (%) ───────────────────── 甲 乙 丙 ───────────────────── 合计 ━━━━━━━━━━━━━━━━━━━━━
1 、 建立假设 H 0 : π1 = π2 = π3 H 1 : π1≠π2≠π3 (三个率不等或不全相等) α = 、计算 X 2 值
3 、查 X 2 表确定 P 值 自由度 V = ( 行数 -1)( 列数 -1) = (3-1)(2-1) = 2 查 X 2 界值表得 : X , 2 =10.60 X 2 = 17.91> X , 2 =10.60 P< 、推断结论 ∵ P<0.005 , ∴ 在 α = 0.05 水准上,拒绝 H 0 ,接受 H 1 ,可认为三个地区的污染率不等或不全相等,有地区 差异。
(二)样本构成比比较 表 8.6 鼻咽癌患者与眼科病人血型构成比较 组别 A 型 B 型 O 型 AB 型 合计 鼻咽癌患者 眼科病人 合 计
H 0 : 鼻咽癌患者与眼科病人血型总体构成比相同 H 1 : 鼻咽癌患者与眼科病人血型总体构成比不同或不 全相同 α=0.05 按公式 计算 X 2 =2.56 V=(2-1)(4-1)=3 , , , 0.5>P>0.25 按 α=0.05 水准不拒绝 H 0 ,故尚不能认为鼻咽癌患者与 眼科病人血型构成比有差别,即尚不能认为血型与鼻咽 癌发病有关。
( 三 ) 双向有序分类资料的关联性检验 1 、 2×2 列联表资料的关联性检验 表 8.4 两种血清学检验结果比较 甲法 乙 法 合计 + - + 45 ( a ) 22 ( b ) 67 - 6 ( c ) 20 ( d ) 26 合计
H 0 : 甲、乙两种方法无相关 H 1 : 甲、乙两种方法有相关 α=0.05 v=1,, >, P<0.005 。 按 α=0.05 检验水准,拒绝 H 0, 接受 H 1, 可以认为甲、乙 两种方法有相关。
2 、 R×C 列联表资料的关联性检验 表 8.7 不同期次矽肺患者肺门密度级别分布 矽肺期次 肺门密度级别 合计 ﹢ ﹢﹢ ﹢﹢﹢ Ⅰ Ⅱ Ⅲ 合计
1 、 建立假设 H 0 : 矽肺期别与肺门密度级别无关 H 1 : 矽肺期别与肺门密度级别有关 α = 、计算值 rs =
3 、查 X 2 表确定 P 值 V = (3-1)(3-1)=4 查 X 2 界值表得: X , 4 =14.86 , X 2 > X , 4 , P<0.005 。 4 、推断结论 P 0, 可认为肺门密度级别有随着矽肺期别增高而增加的趋 势。
行 × 列表 X 2 检验注意事项 1 、不宜有 1/5 以上格子理论数小于 5 ,或有一个 理论数小于 1 。 ★理论数太小的处理方法: ( 1 )增加样本的含量 ( 2 )删除理论数太小的行和列 ( 3 )合理合并理论数太小的行或列 第( 2 )和第( 3 )种处理方法损失信息和损 害随机性,故不宜作为常规处理方法。
2 、对于单向有序行列表,行 × 列表的 X 2 检验只说 明各组的效应在构成比上有无差异,如果要比较各 组的效应有无差别,需应用秩和检验。例: ──────────────────────────── 治愈 显效 无效 死亡 合计 ──────────────────────────── 治疗组 a1 b1 c1 d1 N1 对照组 a1 b2 c2 d2 N2 ──────────────────────────── 合计 a b c d N ──────────────────────────── X 2 检验: 只说明两组的四种疗效在总治疗人数所 占比例有无差别; 秩和检验: 说明两组疗效有无差别。 ☆解决此问题方法: X 2 分割法。
3 、当三个及以上率(或构成比)比较,结 论拒绝 H 0 时, 只能总的说有差别,但不能说明它 们彼此间都有差别,或某两者间有差别。 ☆解决此问题方法: X 2 分割法。 X 2 分割法原理:把原行 × 列表分割为若干个分割 表(四格表), 各分割表的自由度之和等于原行 × 列表的自由度,其 X 2 值之和约等于原行 × 列表的 X 2 值。
X 2 分割方法: ( 1 )把率(或构成比)相差最小的样本分割出 来 ( 四格表 ) ,计算 X 2 值; ( 2 )差异无显著性时,把它合并为一个样本, 再把它与另一较相近的样本比较; ( 3 )差异有显著性时,作出结论,再把它与另 一较相近的样本比较; ( 4 )如此进行下去直到结束。
表 8.6 X 2 分割计算 ─────────────────────────── 地区 未污染 污染 合计 污染率 (%) X 2 值 P ─────────────────────────── 乙 >0.05 丙 ────────────────────────── 合计 ────────────────────────── 乙 + 丙 <0.05 甲 ────────────────────────── 合计 ━━━━━━━━━━━━━━━━━━━━━━