1051 检验 Chi-Square Test 第七章
1052 Content test of fourfold data test of paired fourfold data Fisher probabilities in fourfold data test of R×C table Multiple comparison of sample rates test of goodness of fit
1053
目的: 推断两个总体率或构成比之间有无差别 多个总体率或构成比之间有无差别 多个样本率的多重比较 两个分类变量之间有无关联性 频数分布拟合优度的检验。 检验统计量: 应用:计数资料
1055 第一节 四格表资料的 检验
1056 目的:推断两个总体率(构成比)是 否有差别 (和 u 检验等价) 要求:两样本的两分类个体数排列成四 格表资料
1057 ( 1 ) 分布是一种连续型分布:按分布的密度函数可给出自 由度 =1 , 2 , 3 , …… 的一簇分布曲线 (图 7-1 )。 ( 2 ) 分布的一个基本性质是可加性: 如果两个独立的 随机变量 X 1 和 X 2 分别服从自由度 ν 1 和 ν 2 的分布, 即 ,那么它们的和( X 1 +X 2 )服从自由度 ( ν 1 +ν 2 )的 分布,即 ~ 。 一、 检验的基本思想 1 . 分布
1058
9 2 . 检验的基本思想 例 7-1 某院欲比较异梨醇口服液(试验组)和 氢氯噻嗪 + 地塞米松(对照组)降低颅内压的疗效。 将 200 例颅内压增高症患者随机分为两组,结果见 表 7-1 。问两组降低颅内压的总体有效率有无差别?
10510 表 7-1 两组降低颅内压有效率的比较
10511 本例资料经整理成图 7-2 形式,即有两 个处理组,每个处理组的例数由发生数和 未发生数两部分组成。表内有 四个 基本数据,其余数据均由此四个数据推算 出来的,故称四格表资料。
10512 图 7-2 四格表资料的基本形式
10513 基本思想:可通过 检验的基本公式 来理解。 式中, A 为实际频数( actual frequency ), T 为理论频数( theoretical frequency )。
10514 理论频数由下式求得: 式中, T RC 为第 R 行 C 列的理论频数 n R 为相应的行合计 n C 为相应的列合计
10515 理论频数 是根据检验假设 ,且用合 并率来估计 而定的。 如上例,无效假设是试验组与对照组降低颅内压的 总体有效率相等,均等于合计的有效率 87% 。那么 理论上,试验组的 104 例颅内压增高症患者中有效 者应为 104(174/200)=90.48 ,无效者为 104(26/200)=13.52 ;同理,对照组的 96 例颅内压增 高症患者中有效者应为 96(174/200)=83.52 ,无效者 为 96(26/200)=12.48 。
10516 检验统计量 值反映了实际频数与理 论频数的吻合程度。 若检验假设 H 0 :π 1 =π 2 成立,四个格子的实际频 数 A 与理论频数 T 相差不应该很大,即统计量 不应该很大。如果 值很大,即相对应的 P 值很小, 若 ,则反过来推断 A 与 T 相差太大,超出了抽 样误差允许的范围,从而怀疑 H 0 的正确性,继而 拒绝 H 0 ,接受其对立假设 H 1 ,即 π 1 ≠π 2 。
10517 由公式( 7-1 )还可以看出: 值的大小还取决于 个数的多少(严格地说是自由度 ν 的大小)。由于各 皆是正值,故自由度 ν 愈大, 值也会愈大;所以只有考虑 了自由度 ν 的影响, 值才能正确地反映实际频数 A 和理论频 数 T 的吻合程度。 检验的自由度取决于可以自由取值的格子 数目,而不是样本含量 n 。四格表资料只有 两行两列, =1 ,即在周边合计数固定的情况 下, 4 个基本数据当中只有一个可以自由取 值。
10518 ( 1 ) 建立检验假设,确定检验水平。 H 0 :π 1 =π 2 即试验组与对照组降低颅内压的总体有效率相等 H 1 :π 1 ≠ π 2 即试验组与对照组降低颅内压的总体有效率不相等 α=0.05 。 3. 假设检验步骤
10519 ( 2 )求检验统计量值
10520
10521 二、四格表资料检验的专用公式
10522 分布是一连续型分布,而四格表 资料属离散型分布,由此计算得的统计 量 的抽样分布亦呈离散性质。为改善 统计量 分布的连续性,则需行连续性 校正。
10523 三、四格表资料检验的校正公式
10524 四格表资料 检验公式选择条件: ,专用公式; ,校正公式; ,直接计算概率。 连续性校正仅用于 的四格表资料,当 时,一 般不作校正。
10525 例 7-2 某医师欲比较胞磷胆碱与 神经节苷酯治疗脑血管疾病的疗效, 将 78 例脑血管疾病患者随机分为两组, 结果见表 7-2 。问两种药物治疗脑血管 疾病的有效率是否相等?
10526 表 7-2 两种药物治疗脑血管疾病有效率的比较
10527 本例 ,故用四格表 资料 检验的校正公式 , 查 界值表得 。按 检验水准不拒绝 ,尚不能认为两 种药物治疗脑血管疾病的有效率不等。
10528 本资料若不校正时, 结论与之相反。
10529 第二节 配对四格表资料的 检验
10530 与计量资料推断两总体均数是否 有差别有成组设计和配对设计一样, 计数资料推断两个总体率(构成比) 是否有差别也有成组设计和配对设计, 即四格表资料和配对四格表资料。
10531 例 7-3 某实验室分别用乳胶凝集 法和免疫荧光法对 58 名可疑系统红斑 狼疮患者血清中抗核抗体进行测定, 结果见表 7-3 。问两种方法的检测结果 有无差别?
10532 表 7-3 两种方法的检测结果
10533 上述配对设计实验中,就每个对子而 言,两种处理的结果不外乎有四种可能 : ①两种检测方法皆为阳性数 (a) ; ②两种检测方法皆为阴性数 (d) ; ③免疫荧光法为阳性,乳胶凝集法为 阴性数 (b) ; ④乳胶凝集法为阳性,免疫荧光法为 阴性数 (c) 。
10534 其中, a, d 为两法观察结果一致的两种情况, b, c 为两法观察结果不一致的两种情况 。 检验统计量为
10535 注意: 本法一般用于样本含量不太大的资料。因 为它仅考虑了两法结果不一致的两种情况 (b, c) , 而未考虑样本含量 n 和两法结果一致的两种情况 (a, d) 。所以,当 n 很大且 a 与 d 的数值很大(即 两法的一致率较高), b 与 c 的数值相对较小时, 即便是检验结果有统计学意义,其实际意义往 往也不大。
10536 检验步骤:
10537 第三节 四格表资料的 Fisher 确切概率法
10538 条件: 理论依据: 超几何分布 (非 检验 的范畴 )
10539 例 7-4 某医师为研究乙肝免疫球蛋 白预防胎儿宫内感染 HBV 的效果,将 33 例 HBsAg 阳性孕妇随机分为预防注射组 和非预防组,结果见表 7-4 。问两组新生 儿的 HBV 总体感染率有无差别?
10540 表 7-4 两组新生儿 HBV 感染率的比较
10541 一、基本思想 在四格表周边合计数固定不变的条 件下,计算表内 4 个实际频数变动时的 各种组合之概率 ;再按检验假设用 单侧或双侧的累计概率 ,依据所取 的检验水准 做出推断。
.各组合概率 P i 的计算 在四格表周边合计数 不变的条件下,表内 4 个实际频数 a,b,c,d 变 动的组合数共有 “ 周边合计中最小数 +1” 个。 如例 7-4 ,表内 4 个实际频数变动的组合数共 有 9+1=10 个,依次为:
10543 各组合的概率 P i 服从超几何分布,其和为 1 。 计算公式为 !为阶乘符号
.累计概率的计算 ( 单、双侧检验不同 )
10545
10546
10547 二、检验步骤( )
10548
10549 表 7-5 例 7-4 的 Fisher 确切概率法计算表
10550 例 7-5 某单位研究胆囊腺癌、腺瘤 的 P 53 基因表达,对同期手术切除的胆 囊腺癌、腺瘤标本各 10 份,用免疫组化 法检测 P 53 基因,资料见表 7-6 。问胆囊 腺癌和胆囊腺瘤的 P 53 基因表达阳性率 有无差别 ?
10551 表 7-6 胆囊腺癌与胆囊腺瘤 P53 基因表达阳性率的比较
10552 本例 a+b+c+d=10 ,由表 7-7 可看出,四格表内 各种组合以 i=4 和 i=5 的组合为中心呈对称分布。 表 7-7 例 7-5 的 Fisher 确切概率法计算表 * 为现有样本
10553 ( 1 )计算现有样本的 D* 和 P* 及各组合下四格表的 D i 。 本例 D*=50 , P*= 。 ( 2 )计算满足 D i ≥ 50 条件的各组合下四格表的概率 P i 。 ( 3 )计算同时满足 D i ≥50 和 P i ≤P* 条件的四格表的累 计概率。本例为 P 7 和 P 8 , ( 4 )计算双侧累计概率 P 。 P > 0.05 ,按 α=0.05 检验水准不拒绝 H 0 ,尚不能认 为胆囊腺癌与胆囊腺瘤的 P 53 基因表达阳性率不等。
10554 注意:
10555 第四节 行 × 列表资料的 检验
10556 行 × 列表资料 ① 多个样本率比较时,有 R 行 2 列,称为 R ×2 表; ② 两个样本的构成比比较时,有 2 行 C 列,称 2×C 表; ③ 多个样本的构成比比较,以及双向无序分类资料 关联性检验时,有行列,称为 R ×C 表。
10557 检验统计量
10558 一、多个样本率的比较
10559 例 7-6 某医师研究物理疗法、药物治疗和外用 膏药三种疗法治疗周围性面神经麻痹的疗效,资料 见表 7-8 。问三种疗法的有效率有无差别? 表 7-8 三种疗法有效率的比较
10560 检验步骤:
10561 二、样本构成比的比较
10562 例 7-7 某医师在研究血管紧张素 I 转化酶 (ACE) 基 因 I/D 多态(分 3 型)与 2 型糖尿病肾病 (DN) 的关系 时,将 249 例 2 型糖尿病患者按有无糖尿病肾病分为 两组,资料见表 7-9 。问两组 2 型糖尿病患者的 ACE 基因型总体分布有无差别? 表 7-9 DN 组与无 DN 组 2 型糖尿病患者 ACE 基因型分布的比较
10563 检验步骤
10564 三、双向无序分类资料的关联性检验 表中两个分类变量皆为无序 分类变量的行 列表资料,又称为双向 无序 表资料。
10565 注意 : 双向无序分类资料为两个或 多个样本,做差别检验(例 7-7 );若 为单样本,做关联性检验。
10566 例 7-8 测得某地 5801 人的 ABO 血型和 MN 血型结 果如表 7-10 ,问两种血型系统之间是否有关联? 表 7-10 某地 5801 人的血型 (单样本,做关联性检验)
10567 表 7-10 资料,可用行 × 列表资料 检验来推 断两个分类变量之间有无关系(或关联);若有 关系,可计算 Pearson 列联系数 C 进一步分析关系 的密切程度: 列联系数 C 取值范围在 0 ~ 1 之间。 0 表示完 全独立; 1 表示完全相关;愈接近于 0 ,关系愈不 密切;愈接近于 1 ,关系愈密切。
10568 检验步骤
10569 由于列联系数 C= ,数值较小,故认为两 种血型系统间虽然有关联性,但关系不太密切。
10570 四、行 × 列表资料 检验的 注意事项
. 行列表中的 各格 T ≥ 1 ,并且 1 ≤ T < 5 的格子数不宜超过 1/5 格子总数,否则可 能产生偏性。处理方法有三种: 增大样本含量以达到增大理论频数的 目的,属首选方法,只是有些研究无法 增大样本含量,如同一批号试剂已用完 等。
10572 根据专业知识,删去理论频数太小的行或列, 或将理论频数太小的行或列与性质相近的邻 行或邻列合并。这样做会损失信息及损害样 本的随机性。 注意 :不同年龄组可以合并,但不同血型就 不能合并。 改用双向无序 R×C 表的 Fisher 确切概率法 (可用 SAS 软件实现)。
10573
10574
10575 第五节 多个样本率间的多重比较
10576
10577 分割法
10578 一、基本思想 因分析目的不同, k 个样本率两两比较的次数不同,故重 新规定的检验水准的估计方法亦不同。通常有两种情况:
10579
10580
10581
10582 二、 多个实验组间的两两比较
10583 例 7-9 对例 7-6 中表 7-8 的资料进行 两两比较,以推断是否任两种疗法治疗 周围性面神经麻痹的有效率均有差别?
10584 检验步骤 本例为 3 个实验组间的两两比较
10585 表 7-12 三种疗法有效率的两两比较
10586
10587 三、各实验组与同一个对照组的比较
10588 例 7-10 以表 7-8 资料中的药物治疗组为对 照组,物理疗法组与外用膏药组为试验组,试 分析两试验组与对照组的总体有效率有无差别? 本例为各实验组与同一对照组的比较
10589
10590
10591 第七节 频数分布拟合优度的 检验
10592 医学研究实践中,常需推断某现象频数分 布是否符合某一理论分布。如正态性检验就是 推断某资料是否符合正态分布的一种检验方法, 但只适用于正态分布。 Pearson 值能反映实际频数和理论频数的 吻合程度,故 检验可用于推断频数分布的拟 合优度,且应用广泛。如正态分布,二项分布, Poisson 分布,负二项分布等 。
10593 例 7-12 观察某克山病区克山病患者 的空间分布情况,调查者将该地区划分 为 279 个取样单位,统计各取样单位历年 累计病例数,资料见表 7-15 的第 (1) 、 (2) 栏,问此资料是否服从 Poisson 分布?
10594 表 7-15 Poisson 分布的拟合与检验 * : X≥8 的概率:
10595
10596
10597
练习题 P156 一、最佳选择题 全做 三、计算分析题 第 3 、 5 、 7 、 10 题