资 料 连续型资料 离散型资料 大样本 小样本
第五章 χ2检验
一、χ2检验的定义 二、χ2检验与连续型资料假设检验的区别 三、χ2检验的用途
一、χ2检验的定义 χ2 检验(Chi-square test) 对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。
χ2检验与测量数据假设检验的区别(1) 测量数据的假设检验,其数据属于连续变量,而χ2检验的数据属于点计而来的间断变量。
χ2检验与测量数据假设检验的区别(2) 测量数据所来自的总体要求呈正态分布,而χ2检验的数据所来自的总体分布是未知的。
χ2检验与测量数据假设检验的区别(3) 测量数据的假设检验是对总体参数或几个总体参数之差所进行的假设检验,而χ2 检验在多数情况下不是对总体参数的检验,而是对总体分布的假设检验。
二、χ2检验与连续型资料假设检验的区别 检验对象 总体 数据资料 连续型资料假设检验 χ2 检验 连续型资料 离散型资料 正态分布 总体分布是未知的 对总体参数或几个总体参数之差 不是对总体参数的检验,而是对总体分布的假设检验
三、χ2检验的用途 适合性检验 独立性检验 同质性检验
适合性检验(吻合度检验) 是指对样本的理论数先通过一定的理论分布推算出来,然后用实际观测值与理论数相比较,从而得出实际观测值与理论数之间是否吻合。因此又叫吻合度检验。
独立性检验 是指研究两个或两个以上的计数资料或属性资料之间是相互独立的或者是相互联系的假设检验,通过假设所观测的各属性之间没有关联,然后证明这种无关联的假设是否成立。
同质性检验 在连续型资料的假设检验中,对一个样本方差的同质性检验,也需进行χ2 检验。
第一节: χ2检验的原理与方法 χ2检验的基本原理 χ2检验统计量的基本形式 χ2值的特点 χ2检验的基本步骤 χ2检验的注意事项
原理 χ2检验就是统计样本的实际观测值与理论推算值之间的偏离程度。 χ2检验就是统计样本的实际观测值与理论推算值之间的偏离程度。 实际观测值与理论推算值之间的偏离程度就决定其χ2值的大小。理论值与实际值之间偏差越大, χ2值就越大,越不符合;偏差越小,χ2值就越小,越趋于符合;若两值完全相等时, χ2值就为0,表明理论值完全符合。 原理
理论值 观测值 Ⅰ Ⅱ Ⅲ
χ2检验统计量的基本形式 (Oi-Ei)2 χ2= ∑ Ei O--实际观察的频数(observational frequency) E--无效假设下的期望频数(expectation frequency)
抽样误差? 实质性变化? 876只羔羊性别调察 性别 观察值(O) 理论值(E) O-E 公 母 428 448 438 -10 +10 合计 876 实质性变化? 抽样误差?
要回答这个问题,首先需要确定一个统计量,将其用来表示实际观测值与理论值偏离的程度;然后判断这一偏离程度是否属于抽样误差,即进行显著性检验。 判断实际观测值与理论值偏离的程度,最简单的办法是求出实际观测值与理论值的差数。
羔羊性别观察值与理论值 性别 观察值(O) 理论值(E) O-E 公 母 428 448 438 -10 +10 合计 876 由于差数之和正负相消,并不能反映实际观测值与理论值相差的大小。
∑(O-E)2 为了避免正、负相抵消的问题,可将实际观测值与理论值的差数平方后再相加,也就是计算: O--实际观察的频数 为了避免正、负相抵消的问题,可将实际观测值与理论值的差数平方后再相加,也就是计算: ∑(O-E)2 O--实际观察的频数 E--无效假设下的期望频数
羔羊性别观测值与理论值 性别 观测值(O) 理论值(E) O-E (O-E)2 公 母 428 448 438 -10 +10 100 合计 876
值越大,观测值与理论值相差也就越大,反之越小。
奖学金 200元 70元 一等 三等 10元 10元 14% 5% 实际得到190元 实际得到60元 谁的贡献大?
这两组观测值与理论值的偏离程度是不相同的 等级 观测值(O) 理论(E) O-E (O-E)2 一等 三等 190 60 200 70 -10 100 两组差数虽然相同,但其差数占理论值的比重不同。 这两组观测值与理论值的偏离程度是不相同的
为了弥补这一不足,可先将实际观测值与理论值的差数平方,即(O-E)2,再用差数的平方除以相应的理论值,将之化为相对数,从而来反映(O-E)2 的比重,最后将各组求和,这个总和就是χ2 。
羔羊性别观测值与理论值 性别 观测值(O) 理论值(E) O-E (O-E)2 /E 公 母 428 448 438 -10 +10 0.2283 合计 876 0.4566 χ2值就等于各组观测值和理论值差的平方与理论值之比,再求其和。 (Oi-Ei)2 χ2= ∑ Ei
χ2值的特点 可加性 非负值 随O和E而变化 χ2= ∑ (Oi-Ei)2 Ei
χ2值与概率P成反比, χ2值越小,P值越大,说明实际值与理论值之差越小,样本分布与假设的理论分布越相一致;
基本步骤 1.提出无效假设H0 观测值与理论值的差异由抽样误差引起,即观测值=理论值。同时给出相就的备择假设HA :观测值与理论值的差值不等于0,即观测值≠理论值 2.确定显著水平α 一般确定为0.05或0.01
3.计算样本的χ2值 4.进行统计推断 H0 HA χ2 < χ2α P > α χ2 > χ2α P < α
χ2检验的注意事项 1、任何一组的理论次数Ei 都必须大于5,如果Ei ≤5,则需要合并理论组或增大样本容量以满足Ei >5 2、在自由度=1时,需进行连续性矫正,其矫正的χ2c为: ( Oi-Ei - 0.5 )2 χ2= ∑ Ei
χ2分布是连续型变量的分布,每个不同的自由度都有一个相应的χ2分布曲线,所以其分布是一组曲线。
由于检验的对象-次数资料是间断性的,而χ2分布是连续型的,检验计算所得的χ2值只是近似地服从χ2分布,所以应用连续型的χ2分布的概率检验间断性资料所得的χ2值就有一定的偏差。 由次数资料算得的χ2均有偏大的趋势,即概率偏低。当df=1,尤其是小样本时,必须作连续性矫正。 χ2c = ∑ ( Oi-Ei - 0.5 )2 Ei
第二节:适合性检验 定义 适合性检验 比较观测数与理论数是否符合的假设检验。
用 途 遗传学中用以检验实际结果是否符合遗传规律 样本的分布与理论分布是否相等 孟德尔分离规律 自由组合定律 样本的分布与理论分布是否相等 适合性检验的df由于受理论值的总和等于观测值总和这一条件的约束,故df=n-1
鲤鱼遗传试验F2观测结果 体色 青灰色 红色 总数 F2观测尾数 1503 99 1602 (1) H0:鲤鱼体色F2分离符合3:1比率; HA:鲤鱼体色F2分离不符合3:1比率;
在无效假设H0正确的前提下,青灰色的理论数为: (2)取显著水平α=0.05 (3)计算统计数χ2 : df= k-1 = 2-1 =1 需要连续性校正 在无效假设H0正确的前提下,青灰色的理论数为: Ei =1602×3/4=1201.5 红色理论数为: Ei =1602×1/4=400.5
χ2= ∑ ( Oi-Ei - 0.5 )2 Ei i=1 2 = + (1503-1201.5 - 0.5 )2 1201.5 (99-400.5 - 0.5 )2 400.5 =75.41+226.22=301.63 (4)查χ2值表,当df=1时,χ20.05 =3.84。现实得χ2c =301.63>χ20.05 ,故应否定H0 ,接受HA ,即认为鲤鱼体色F2分离不符合3:1比率。
在遗传学中,有许多显、隐性比率可以划分为两组的资料,如欲测其与某种理论比率的适合性,则χ2值可用下表中的简式进行计算:
检验两组资料与某种理论比率符合度的χ2值公式 χ2计算公式 理论比率(显性:隐性) 1:1 2:1 3:1 15:1 9:7 r:1 r:m
例 大豆花色遗传试验F2观测结果 289 81 208 F2观测株数 总数 花色 (1) H0 :大豆花色F2分离符合3:1比率; HA :大豆花色F2分离不符合3:1比率; (2)取显著水平α =0.05 (3)计算统计数χ2值:
(4)查值表,进行推断 χ2< χ20.05 df =1 P>0.05 接受H0 ,即大豆花色F2分离符合3:1比率
对于资料组数多于两组的值,还可以通过下面简式进行计算: Oi -第 i 组的实际观测数 pi -第 i 组的理论比率 n-总次数
豌豆 F2代,共556粒 315 101 108 32 ? 此结果是否符合自由组合规律 根据自由组合规律,理论分离比为:
方法一 豌豆杂交实验F2分离结果 黄圆 黄皱 绿圆 绿皱 实际观测数O 理论频数P 理论数E O-E (O-E)2/E 315 9/16 312.75 2.25 0.016 101 3/16 104.25 -3.25 0.101 108 3.75 0.135 32 1/16 34.75 -2.75 0.218 (1) H0 :豌豆F2分离符合9:3:3:1的自由组合规律; HA :豌豆F2分离不符合9:3:3:1的自由组合规律; (2)取显著水平α =0.05
χ2< χ20.05 (3)计算统计数χ2值: χ2 =0.016+0.101+0.135+0.218=0.470 (4)查值表,进行推断: df =4-1=3 P>0.05 接受H0 ,即豌豆F2分离符合9:3:3:1的自由组合规律。
方法二 315 101 108 32 χ2 =0.016+0.101+0.135+0.218=0.470
第三节:独立性检验 独立性检验的定义 2×2 列联表的独立性检验 2×c列联表的独立性检验 r×c列联表的独立性检验
独立性检验(independence test) 又叫列联表(contigency table)χ2检验,它是研究两个或两个以上因子彼此之间是独立还是相互影响的一类统计方法。
(一)2×2列联表的独立性检验 设A,B是一个随机试验中的两个事件,其中A可能出现r1 、r2个结果,B可能出现c1、c2个结果,两因子相互作用形成4格数,分别以O11 、O12 、O21 、O22表示,下表是2×2列联表的一般形式
2×2列联表的一般形式 行 c1 c2 r1 r2 O11 O21 O12 O22 R1= O11 + O12 R2= O21 + O22 总和 r1 r2 O11 O21 O12 O22 R1= O11 + O12 R2= O21 + O22 C1= O11 + O21 C2= O12 + O22 T
检验步骤 1.提出无效假设H0 :事件A和事件B无关, 同时给出HA :事件A和事件B有关联关系; 2.给出显著水平α 4.确定自由度,df=(r-1)(c-1),进行推断。 χ2 >χ2α P < α H0 HA χ2 <χ2α P >α H0 HA
给药方式与给药效果的2×2列联表 给药方式 有效 无效 总数 有效率 口服 注射 58 64 40 31 98(R1) 95(R2) 59.2% 67.4% 122(C1) 71(C2) 193(T) 1.H0 :给药方式与给药效果相互独立。 HA :给药方式与给药效果有关联。 2.给出显著水平α=0.05
3.根据H0,运用概率乘法法则:事件A与事件B同时出现的概率为:P(AB)=P(A)P(B) 理论频数Ei=理论频率×总数 = (98/193 ×122/193) ×193 =(98 × 122)/193=61.95 即Eij=Ri×Cj/T=行总数×列总数/总数
给药方式与给药效果的2×2列联表 E11= R1 × C1/T=61.95 E12= R1 × C2/T=36.05 有效 无效 总数 口服 注射 58(61.95) 64(60.05) 40(36.05) 31(34.95) 98(R1) 95(R2) 122(C1) 71(C2) 193(T)
计算χ2值:由于df=(r-1)(c-1)=(2-1)(2-1)=1,故所计算的χ2值需进行连续性矫正: 给药方式 有效 无效 总数 口服 注射 58(61.95) 64(60.05) 40(36.05) 31(34.95) 98(R1) 95(R2) 122(C1) 71(C2) 193(T) 计算χ2值:由于df=(r-1)(c-1)=(2-1)(2-1)=1,故所计算的χ2值需进行连续性矫正:
4. 查χ2表,当df=1时, χ20. 05 =3. 841,而χ2c =0. 863< χ20. 05 , P>0 4.查χ2表,当df=1时, χ20.05 =3.841,而χ2c =0.863< χ20.05 , P>0.05,应接受H0 ,拒绝HA ,说明给药方式与给药效果相互独立.
2 × 2列联表的χ2检验可利用以下简式而不必计算理论次数: T/2-为矫正数
给药方式 有效 无效 总数 口服 注射 58 64 40 31 98(R1) 95(R2) 122(C1) 71(C2) 193(T)
(二)2×c列联表的独立性检验 2×c列联表的一般形式 1 2 C 合计 O11 O21 O12 O22 O1c O2c R1 R2 C1 行 列 1 2 C 合计 O11 O21 O12 O22 O1c O2c R1 R2 C1 C2 Cc T 由于df=(2-1)(c-1) ≥2,故计算值时不需作连续性矫正
例子 三种农药毒杀烟蚜的死亡情况 甲 乙 丙 合计 死亡数 未死亡数 37 150 49 100 23 57 109 307 187 149 检测甲、乙、丙三种农药对烟蚜的毒杀效果,结果如下,使分析这三种农药对烟蚜的毒杀效果是否一致? 三种农药毒杀烟蚜的死亡情况 甲 乙 丙 合计 死亡数 未死亡数 37 150 49 100 23 57 109 307 187 149 80 416
1. H0 :对烟蚜毒杀效果与农药无关,农药类型间互相独立; HA :二者有关 2.取显著水平α=0.05 3.统计数的计算
理论值的计算: 甲 乙 丙 合计 死亡数 未死亡数 37(49.00) 150(138.00) 49(39.04) 100(109.96) 23(20.96) 57(59.04) 109 307 187 149 80 416 χ2值的计算:
(4)查χ2值表,进行推断 查χ2表,当df=(2-1)(3-1)=2时, χ20.05 =5.99,现实得χ2=7.694>χ20.05 ,则拒绝H0 ,接受HA ,说明三种农药对烟蚜的毒杀效果不一致。
简便计算公式 甲 乙 丙 合计 死亡数 未死亡数 37(49.00) 150(138.00) 49(39.04) 100(109.96) 23(20.96) 57(59.04) 109 307 187 149 80 416
1 2 C 合计 r O11 O21 Or1 O12 O22 Or2 O1c O2c Orc R1 R2 Rc C1 C2 Cc T 行 列 1 2 C 合计 r O11 O21 Or1 O12 O22 Or2 O1c O2c Orc R1 R2 Rc C1 C2 Cc T r×c列联表是指r≥3、c ≥3的计数资料,上表是r×c列联表的一般形式。df=(r-1)(c-1)>1,故不需进行连续性矫正。
r×c列联表的计算公式: i = 1, 2,…, r j = 1, 2, …, c
例 某医院用碘及治疗地方性甲状腺肿,不同年龄的治疗效果列于下表,试检验不同年龄的治疗效果有无差异? 不同年龄用碘剂治疗甲状腺肿效果比较 某医院用碘及治疗地方性甲状腺肿,不同年龄的治疗效果列于下表,试检验不同年龄的治疗效果有无差异? 不同年龄用碘剂治疗甲状腺肿效果比较 年龄(岁) 治愈 显效 好转 无效 合计 11~30 31~50 50以上 67 32 10 9 23 11 20 5 4 91 79 49 109 43 53 14 219
1. H0 :治疗效果与年龄无关; HA :治疗效果与年龄有关,即不同年龄治疗效果不同; 2.给出显著水平α=0.01
3.计算统计数χ2 : 年龄(岁) 治愈 显效 好转 无效 合计 11~30 31~50 50以上 67 32 10 9 23 11 20 5 4 91 79 49 109 43 53 14 219
4. 查χ2表,当df=(3-1)×(4-1)=6时,χ20. 01=16. 81,所以χ2=46. 988>χ20. 01, P<0 4.查χ2表,当df=(3-1)×(4-1)=6时,χ20.01=16.81,所以χ2=46.988>χ20.01, P<0.01,应拒绝H0 ,接受HA,说明治疗效果与年龄有关。
在治疗效果与年龄有关的基础上,可以将下面的3×4列联表做成3个2×4列联表,测验2个年龄段疗效的差异: 11~30岁与31~50岁两个年龄段疗效的比较 11~30岁与50岁以上两个年龄段疗效的比较 31~50岁与50岁以上两个年龄段疗效的比较
(1) 11~30岁与31~50岁两个年龄段疗效的比较 年龄(岁) 治愈 显效 好转 无效 合计 11~30 31~50 67 32 9 23 10 20 5 4 91 79 99 30 170
(2) 11~30岁与50岁以上两个年龄段疗效的比较 年龄(岁) 治愈 显效 好转 无效 合计 11~30 50以上 67 10 9 11 23 5 91 49 77 20 33 140
(3) 31~50岁与50岁以上两个年龄段疗效的比较 年龄(岁) 治愈 显效 好转 无效 合计 31~50 50以上 32 10 23 11 20 4 5 79 49 42 34 43 9 128
df=(2-1) ×(4-1)=3 χ20.05=7.81 χ20.01=11.34 11~30岁与31~50岁两个年龄段疗效的比较 χ2= 21.202(极显著) 11~30岁与50岁以上两个年龄段疗效的比较 χ2= 38.37(极显著) 31~50岁与50岁以上两个年龄段疗效的比较 χ2= 9.574(显著)
小结 χ2检验 适合性检验 独立性检验 显隐性 两组资料 多组资料 2×2列联表 2×c列联表 r×c列联表
显隐性 两组资料 r : m 多组资料
2×2列联表 2×c列联表 r×c列联表