卡方检验
二项分布中,我们应用正态近似法介绍了 两个率的u检验。但在观察例数不足够大或拟 对多个率进行比较时,u检验就不适宜了,因 为直接对多个样本率作两两间的u检验有可能 加大第一类误差( 如同直接对多个样本均数 作两两间的t检验)。X2 检验(chi-square test)可 解决此问题。 X2 检验是一种用途较广的假设检验方法, 适用于分类变量资料( 计量资料 ) 。它能推断 两个及多个总体率或总体构成比之间的有无 差异 ,两个属性或变量之间有无关联性 ,以 及频数分布的拟合优度检验等。
χ2检验的用途: 1. 推断多个总体率之间有无差别 2. 推断几组总体构成比之间有无差别 3. 两个变量之间有无关联性 4. 频数分布的拟合优度检验
四格表资料的χ2检验 在医学资料中,常常需要比较两个样本率之间的差异有无显著性,如推断某人群男与女的某种疾病的患病率是否相等,即该病是否与性别有关。这类资料由4个数据构成:男与女的患病人数和未患病人数,统计学称这类资料为四格表资料。 首先复习一下χ2检验的几种计算方法。 一. 通用公式法 二. 专用公式法 三. 四格表χ2值的校正 四. 精确概率法 五. 配对资料的χ2检验
一. 通用公式法 χ2= 其中为A实际频数,T为理论频数,,nR是行和,nC是列和,n是四格数之和。
例1 某护士为了解过氧乙酸和乙醇两种消毒方法对HBV血清中HBsAg的消毒效果,做了两种方法的比较试验,结果如下: 两种消毒方法对消毒效果的比较 42.06 126 73 62 合计 28.13 64 46 27 80%乙醇 56.45 35 0.5%过氧乙酸 消除率 未消除 消除 方法
nR合计 R C (a+c)/N a+b+c+d b+c a+c c/(c+d) c+d d c R2 a/(a+b) a+b b a R1 率 nC合计 C2 C1 C
二 专用公式法 以上计算χ2统计量的公式对任意行×列表都适合,而对于四格表资料,可以用其简化公式 χ2= 例1(续) χ2=
三. 四格表χ2值的校正 (continuity correction) 由于χ2界值表是 一 连续分布:χ2分布计算出来的,但原始 数据属计数资料是离散的,由此计算出来的χ2值也是离散的,特 别是四格表,有时若不校正,所求χ2值偏大,所得概率p值偏低。 ①n≥40,且T≥5时,可用未校正的值 ②1≤T<5,且n≥40时,宜用校正χ2值或用精确概率计算法 ③T<1或n<40时,宜用精确概率计算法 校正公式
例2 某矿石粉厂当生产一种矿石粉石时,在数天内即有部分工人患职业性皮肤炎,在生产季节开始,随机抽取15名车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,检查两组工人的皮肤炎患病率,结果如下: 穿新旧两种防护服工人的皮肤炎患病率比较 理论频数T11=15*11/43=3.84, 1<T11<5且n=43>40,所以宜用χ2值的校正公式 χ2=2.94 查χ2界值表得0.10>p>0.05,按α=0.05水平不拒绝H0,尚不能认为穿不同防护服的皮肤炎患病率有差别。 若不校正,χ2=4.33 p<0.05 防护服种类 阳性例数 阴性例数 合计 患病率 新 1 14 15 6.7 旧 10 18 28 35.7 11 32 43 25.6
理论值 小于5
皮尔逊 X2
四.确切概率法(Fisher’s exact probability) 不作介绍。 例2:某医生用新旧两种药物治疗某病患者 13人 ,结果如下表 ,问新药的效果是否优于 旧药? 级别 治愈 未愈 合计 治愈率 旧药 6 1 7 14.3 新药 5 83.3 13 53.8
五. 配对资料的χ2检验 在前面已介绍了配对设计的t检验,配对设计的t检验是对于计量资料(观察值),将两种处理分别施于条件相同的两个受试对象,或施于同一受试对象某种处理前后某指标的变化,比较两总体均数的差异。若是对于计数资料,我们
用配对资料的χ2检验。如把每一份标本 平分为两份,分别用两种方法进行化验, 比较此两种化验方法的结果是否有本质 不同 ,或分别采用甲乙两种方法对同一 批病人进行检查,比较此两种检查方法 的结果是否有本质不同;此时要用我们 用配对χ2检验。
例3 有205份咽喉涂抹标本,把每份标本依同样的条件分别接种于甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长的情况,观察结果如下,问两种培养基的结果有无差别? 两种白喉杆菌培养基培养结果比较 乙种培养法 甲种培养法 合计 + - 36 34 70 135 169 205
分析:我们可以用上节的方法计算χ2值来判断两种处理的结果有无相关关系(有无联系) χ2= =84.22 相关 但是我们现在的目的是比较两法结果的差异,如果将两法的阳性率36/205与70/205作比较(用前节方法)是不正确的,因为理论频数是在两法结果相互独立假设下推算出来的,比较两法结果有无差别,要着眼于两法结果不一致的部分。检验统计量 当b+c≥40时 χ2= 当b+c<40时 χ2= ν=1
H0:甲法阳性乙法阴性例数与甲法阴性乙法阳性例数,即总体B=C χ2=32.03 查χ2界值表 p<0.01,拒绝H0,认为两法培养效果不一样,乙法优于甲法。
行×列表的χ2检验 前面介绍的四格表只有2行2列,只能对2个率或2类构成比作出比较。在医学研究中有时要比较几个率,如:要比较某市重污染区、一般市区和农村三个地区的出生婴儿的致畸率。有时要分析几组多类构成的构成比是否相同,如:以母乳、牛乳、混合三种不同方式喂养的新生儿体重增长的构成是否一致。有时要推断2个分类变量是否有关联,如:研究冠心病与眼底动脉硬化的关系。
行×列表的χ2值计算 χ2= χ2= ν=(R-1)(C-1)
1. 多个率比较 例4 研究复方哌唑嗪对高血压病治疗效果的临床试验并与复方降压片和安慰剂作对照,结果如下表,问三种药物效果有无差别? 三种药物治疗高血压病的有效率比较 60.78 102 40 62 合计 21.88 32 25 7 安慰剂 66.67 30 10 20 复方降压片 87.50 5 35 复方哌唑嗪 有效率% 无效 有效 组别
H0:三种药物的总体有效率相同,即π1=π2=π3 H1:π1 π2 π3不全相等 α=0.05 χ2= ν=2 查χ2界值表得 p<0.005 按α=0.05水平拒绝H0,认为三种药物的治疗效果不全相同。
附:行×列表的X2分割 在行X列表的X2检验中,若P<0.05,我们 拒绝无效假设H0,只能作出总体上有显著性 意义的总的结论,而不能对每两两之间有无 显著性差异作出结论。若要进行两两比较, 还需要把行X列表进行分割,才能对每两两之 间有无显著性差异作出结论。行X列表进行分 割可分为多组间的两两比较和多个实验组与 一对照组比较两种。
例3(续) 哌唑嗪组与降压片组的有效率接近,将此2组合并,得到2个分割表: 分割表1 分割表2 组别 有效 无效 计 哌唑嗪 35 5 40 用药组 55 15 70 降压片 20 10 30 安慰剂 7 25 32 合计 62 102 χ21=4.419 χ22=29.615
可以得出χ21+χ22=34.034约等于原来的χ2=32.74,两者不相等是由于分割表中理论频数的数值与总表中理论频数不同所致。 即有结论,哌唑嗪、降压片与安慰剂的有效率均不相同。
例4 1979年某地爆发松毛虫病,333例患者按年龄以14岁为界分成2组,资料如表,试考察两组病人病变类型的构成比有无差别? 2.多个构成比比较 例4 1979年某地爆发松毛虫病,333例患者按年龄以14岁为界分成2组,资料如表,试考察两组病人病变类型的构成比有无差别? 某地两组松毛虫病患者型别构成比较 年龄分组 皮炎型 骨关节炎型 软组织炎型 混合型 合计 儿童组 50 48 18 72 188 成人组 105 10 7 23 145 155 58 25 95 333 H0:两组患者中患各型松毛虫病的构成比相同 H1:两组患者中患各型松毛虫病的构成比不同 α=0.05 χ2=70.14 查表得p<0.005,拒绝H0,认为两组患者中患各型松毛虫病的构成比不同。
3.双向有序且属性不同的 分类资料的关联性检验 例5 某矿工医院探讨矽肺不同期次患者的胸部平片密度变化,492例患者资料整理如下,问矽肺患者肺门密度的增加与期次有无差别?
H0:矽肺期次与肺门密度级别无关,即各期矽肺构成比相同且各级肺门密度构成比相同 H1:矽肺期次与肺门密度级别有关 α=0.05 χ2=163.01 ν=4 查表得p<0.005,拒绝H0, 认为矽肺期次与肺门密度级别有关。
3.双向有序且属性相同的分类资料的一致性检验 SPSS中通过计算卡帕系数(Kappa), 来进行一致性检验,它是评价判断一致性(agreement)程度的指标,适用于行与列有相同的分类。 例如用来检验两个评估人对同一对象进行评估时,是否具有相同的态度,1表示两个人评估结果完全一致,0表示两个人评估结果是由于随机因素造成。Kappa值越大,表示一致程度越好,一般Kappa值大于0.75,说明一致程度已相当满意,若小于0.4,则不满意。
例 应用核素法和对比法检测147例冠心病 患者心脏室壁收缩运动的符合情况,结果 如下,问这两种方法测定结果是否一致?
本例两个分组变量的本质都是“测定 结果”,故其专业属性是相同的,并且测 定结果的类别划分也是相同的顺序,即正 常、减弱、异常。对于这种资料,研究者 既关心两变量之间是否存在相关性,而且 还关心这两种方法测定结果的一致性如何, 一致性检验计算Kappa统计量 pa — p e Kappa = 1 — p e pa 和 p e 分别为实际观察、期望观察一致的比例。
注意事项 1. 行×列表的χ2检验要求理论频数不宜太小,要 求不宜有1/5以上的格子的理论频数小于5,或有一个理论频数小于1。 1. 行×列表的χ2检验要求理论频数不宜太小,要 求不宜有1/5以上的格子的理论频数小于5,或有一个理论频数小于1。 2. 如果以上条件不能满足,可采用: l 增加样本含量 l 删去某行或某列 l 合理地(医学上合理性)合并部分性质相近的行或 列 l 用精确概率法 3. 多个率或构成比比较的χ2检验,结论为拒绝H0时,仅表示几组有差别,并非任2组之间都有差别。若要了解之,可进行χ2表的分割。
频数分布拟合优度的χ2检验 在医学实际工作中常需要考察一个样本的频数分布是否符合某种概率模型规定的理论分布,如果符合就可将它按该理论分布来处理。
例6 某地爆发流行细菌性痢疾,为了分析这次爆发流行是否存在家庭内成员间的传播,共调查了四口之家288户,数据如下,试检验能否用二项分布模型来拟合这一组实际资料。
分析:如果能够拟合,表明家庭成员发病与否是独立、等概率的。 H0:此次流行不存在家庭内成员间的传播 估计二项分布的总体率π: π=发病总人数/调查总人数 =0.18576
χ2=81.00 ν=4-1=3, 查表得p<0.05 拒绝H0,认为本次调查的四口之家内发病人数的分布不符合二项分布,此次流行可能存在家庭成员间的传播。