卡方检验.

Slides:



Advertisements
Similar presentations
卡方检验. 内容 卡方检验入门 1 配对设计两样本率比较的 χ2 检验 2 行列表资料的分析 3 确切概率法 4.
Advertisements

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
练一练: 在数轴上画出表示下列各数的点, 并指出这些点相互间的关系: -6 , 6 , -3 , 3 , -1.5, 1.5.
第八章 X2 检验 卫生(医学)统计学 普通高等教育 “ 十一五 ” 国家级规划教材. X 2 检验用途 1 、推断两个或两个以上的总体率或总体构 成比 之间有无差别; 2 、推断两种属性或两个变量之间有无关联 性; 3 、频数分布的拟合优度检验。
第十七章 分类资料的统计推断.
龙星课程—肿瘤生物信息学上机课程 曹莎
资 料 连续型资料 离散型资料 大样本 小样本.
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
作者:熊林平.
PET-CT-SUVmax与鼻咽癌放疗过程中原发灶 径线变化的关系
第七章 非参数统计 非参数统计(亦称非参数检验),是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。 主要特点
第十一章 两变量关联性分析.
研究中心:河北医科大学第四医院 ***科 主要研究者:**** 申办者:********公司 CRO:********公司
紧扣课程标准 关注社会热点 —苏教版教材新增内容复习建议 南京市南湖第一中学 马 峰.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
完全随机设计多样本资料秩和检验.
财经法规与会计职业道德 (3) 四川财经职业学院.
医学统计学 主讲人:信息部 林雪君.
计数资料的统计推断 (2 学时) 吴成秋 公共卫生学院预防医学系
第一篇:静力学 1 、研究的主要问题:力,力系的简化原理 及物体在力系作用下的平衡问题。 2 、研究方法:对物体(或物体系)进行受
面向海洋的开放地区——珠江三角洲 山东省高青县实验中学:郑宝田.
第 八 章 t 检 验.
发展心理学 王 荣 山.
成才之路 · 地理 人教版 · 必修3 路漫漫其修远兮 吾将上下而求索.
§5.3 定积分的换元法 和分部积分法 一、 定积分的换元法 二、 定积分的分部积分法 三、 小结、作业.
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
初中数学八年级下册 (苏科版) 10.4 探索三角形 相似的条件(2).
第七章 财务报告 主讲老师:王琼 上周知识回顾.
辅导课程六.
统计软件应用 6 主讲人 陶育纯 SPSS统计分析 统计软件应用 6 主讲人 陶育纯 教案.
第十章 方差分析.
绿色圃中小学教育网 比例 比例的意义 绿色圃中小学教育网
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习3 主讲人 陶育纯 医学统计学方法 实习3 主讲人 陶育纯 流行病与卫生统计学教研室
28.1 锐角三角函数(2) ——余弦、正切.
第七章 参数估计 7.3 参数的区间估计.
医学统计学方法 实习3 主讲人 陶育纯 医学统计学方法 实习3 主讲人 陶育纯
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
实数与向量的积.
两组两分类资料检验.
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
完全随机设计多组资料的比较 赵耐青 卫生统计教研室.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第九节 赋值运算符和赋值表达式.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
九年义务教育五年制小学教科书 数 学 第 十 册 《比例的意义和基本性质》 新野县城关镇南关小学:邹汉苗.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第一节 不定积分的概念与性质 一、原函数与不定积分的概念 二、不定积分的几何意义 三、基本积分表 四、不定积分的性质 五、小结 思考题.
第4课时 绝对值.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第四节 多个样本均数的两两比较 多个样本均数的两两比较又称多重比较(multiple comparison),其目的是推断究竟哪些总体均数之间存在差别。
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
难点:连续变量函数分布与二维连续变量分布
欢迎大家来到我们的课堂 §3.1.1两角差的余弦公式 广州市西关外国语学校 高一(5)班 教师:王琦.
单样本检验.
BAFF在活动性SLE患者T细胞中的表达:
Sssss.
MTOR典型案例征集大赛 标题: 医院: 科室: 姓名: 邮箱: 2015 年 月 日.
Presentation transcript:

卡方检验

二项分布中,我们应用正态近似法介绍了 两个率的u检验。但在观察例数不足够大或拟 对多个率进行比较时,u检验就不适宜了,因 为直接对多个样本率作两两间的u检验有可能 加大第一类误差( 如同直接对多个样本均数 作两两间的t检验)。X2 检验(chi-square test)可 解决此问题。 X2 检验是一种用途较广的假设检验方法, 适用于分类变量资料( 计量资料 ) 。它能推断 两个及多个总体率或总体构成比之间的有无 差异 ,两个属性或变量之间有无关联性 ,以 及频数分布的拟合优度检验等。

χ2检验的用途: 1. 推断多个总体率之间有无差别 2. 推断几组总体构成比之间有无差别 3. 两个变量之间有无关联性 4. 频数分布的拟合优度检验

四格表资料的χ2检验 在医学资料中,常常需要比较两个样本率之间的差异有无显著性,如推断某人群男与女的某种疾病的患病率是否相等,即该病是否与性别有关。这类资料由4个数据构成:男与女的患病人数和未患病人数,统计学称这类资料为四格表资料。 首先复习一下χ2检验的几种计算方法。 一.        通用公式法 二. 专用公式法 三. 四格表χ2值的校正 四. 精确概率法 五. 配对资料的χ2检验

一. 通用公式法 χ2= 其中为A实际频数,T为理论频数,,nR是行和,nC是列和,n是四格数之和。

例1 某护士为了解过氧乙酸和乙醇两种消毒方法对HBV血清中HBsAg的消毒效果,做了两种方法的比较试验,结果如下: 两种消毒方法对消毒效果的比较 42.06 126 73 62 合计 28.13 64 46 27 80%乙醇 56.45 35 0.5%过氧乙酸 消除率 未消除 消除 方法

nR合计 R C (a+c)/N a+b+c+d b+c a+c c/(c+d) c+d d c R2 a/(a+b) a+b b a R1 率 nC合计 C2 C1 C

二 专用公式法 以上计算χ2统计量的公式对任意行×列表都适合,而对于四格表资料,可以用其简化公式 χ2= 例1(续) χ2=

三. 四格表χ2值的校正 (continuity correction) 由于χ2界值表是 一 连续分布:χ2分布计算出来的,但原始 数据属计数资料是离散的,由此计算出来的χ2值也是离散的,特 别是四格表,有时若不校正,所求χ2值偏大,所得概率p值偏低。 ①n≥40,且T≥5时,可用未校正的值 ②1≤T<5,且n≥40时,宜用校正χ2值或用精确概率计算法 ③T<1或n<40时,宜用精确概率计算法 校正公式

例2 某矿石粉厂当生产一种矿石粉石时,在数天内即有部分工人患职业性皮肤炎,在生产季节开始,随机抽取15名车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,检查两组工人的皮肤炎患病率,结果如下: 穿新旧两种防护服工人的皮肤炎患病率比较 理论频数T11=15*11/43=3.84, 1<T11<5且n=43>40,所以宜用χ2值的校正公式 χ2=2.94 查χ2界值表得0.10>p>0.05,按α=0.05水平不拒绝H0,尚不能认为穿不同防护服的皮肤炎患病率有差别。 若不校正,χ2=4.33 p<0.05 防护服种类 阳性例数 阴性例数 合计 患病率 新 1 14 15 6.7 旧 10 18 28 35.7 11 32 43 25.6

理论值 小于5

皮尔逊 X2

四.确切概率法(Fisher’s exact probability) 不作介绍。 例2:某医生用新旧两种药物治疗某病患者 13人 ,结果如下表 ,问新药的效果是否优于 旧药? 级别 治愈 未愈 合计 治愈率 旧药 6 1 7 14.3 新药 5 83.3 13 53.8

五. 配对资料的χ2检验 在前面已介绍了配对设计的t检验,配对设计的t检验是对于计量资料(观察值),将两种处理分别施于条件相同的两个受试对象,或施于同一受试对象某种处理前后某指标的变化,比较两总体均数的差异。若是对于计数资料,我们

用配对资料的χ2检验。如把每一份标本 平分为两份,分别用两种方法进行化验, 比较此两种化验方法的结果是否有本质 不同 ,或分别采用甲乙两种方法对同一 批病人进行检查,比较此两种检查方法 的结果是否有本质不同;此时要用我们 用配对χ2检验。

例3 有205份咽喉涂抹标本,把每份标本依同样的条件分别接种于甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长的情况,观察结果如下,问两种培养基的结果有无差别? 两种白喉杆菌培养基培养结果比较 乙种培养法 甲种培养法 合计   + - 36 34 70 135 169 205

分析:我们可以用上节的方法计算χ2值来判断两种处理的结果有无相关关系(有无联系) χ2= =84.22 相关 但是我们现在的目的是比较两法结果的差异,如果将两法的阳性率36/205与70/205作比较(用前节方法)是不正确的,因为理论频数是在两法结果相互独立假设下推算出来的,比较两法结果有无差别,要着眼于两法结果不一致的部分。检验统计量 当b+c≥40时 χ2= 当b+c<40时 χ2= ν=1

H0:甲法阳性乙法阴性例数与甲法阴性乙法阳性例数,即总体B=C χ2=32.03 查χ2界值表 p<0.01,拒绝H0,认为两法培养效果不一样,乙法优于甲法。

行×列表的χ2检验 前面介绍的四格表只有2行2列,只能对2个率或2类构成比作出比较。在医学研究中有时要比较几个率,如:要比较某市重污染区、一般市区和农村三个地区的出生婴儿的致畸率。有时要分析几组多类构成的构成比是否相同,如:以母乳、牛乳、混合三种不同方式喂养的新生儿体重增长的构成是否一致。有时要推断2个分类变量是否有关联,如:研究冠心病与眼底动脉硬化的关系。

     行×列表的χ2值计算 χ2= χ2= ν=(R-1)(C-1)

1. 多个率比较 例4 研究复方哌唑嗪对高血压病治疗效果的临床试验并与复方降压片和安慰剂作对照,结果如下表,问三种药物效果有无差别? 三种药物治疗高血压病的有效率比较 60.78 102 40 62 合计 21.88 32 25 7 安慰剂 66.67 30 10 20 复方降压片 87.50 5 35 复方哌唑嗪 有效率% 无效 有效 组别

H0:三种药物的总体有效率相同,即π1=π2=π3 H1:π1 π2 π3不全相等 α=0.05 χ2= ν=2 查χ2界值表得 p<0.005 按α=0.05水平拒绝H0,认为三种药物的治疗效果不全相同。

附:行×列表的X2分割 在行X列表的X2检验中,若P<0.05,我们 拒绝无效假设H0,只能作出总体上有显著性 意义的总的结论,而不能对每两两之间有无 显著性差异作出结论。若要进行两两比较, 还需要把行X列表进行分割,才能对每两两之 间有无显著性差异作出结论。行X列表进行分 割可分为多组间的两两比较和多个实验组与 一对照组比较两种。

例3(续) 哌唑嗪组与降压片组的有效率接近,将此2组合并,得到2个分割表: 分割表1 分割表2   组别 有效 无效 计 哌唑嗪 35 5 40 用药组 55 15 70 降压片 20 10 30 安慰剂 7 25 32 合计 62 102 χ21=4.419 χ22=29.615

可以得出χ21+χ22=34.034约等于原来的χ2=32.74,两者不相等是由于分割表中理论频数的数值与总表中理论频数不同所致。 即有结论,哌唑嗪、降压片与安慰剂的有效率均不相同。

例4 1979年某地爆发松毛虫病,333例患者按年龄以14岁为界分成2组,资料如表,试考察两组病人病变类型的构成比有无差别? 2.多个构成比比较 例4 1979年某地爆发松毛虫病,333例患者按年龄以14岁为界分成2组,资料如表,试考察两组病人病变类型的构成比有无差别? 某地两组松毛虫病患者型别构成比较 年龄分组 皮炎型 骨关节炎型 软组织炎型 混合型 合计 儿童组 50 48 18 72 188 成人组 105 10 7 23 145 155 58 25 95 333 H0:两组患者中患各型松毛虫病的构成比相同 H1:两组患者中患各型松毛虫病的构成比不同 α=0.05 χ2=70.14 查表得p<0.005,拒绝H0,认为两组患者中患各型松毛虫病的构成比不同。

3.双向有序且属性不同的 分类资料的关联性检验 例5 某矿工医院探讨矽肺不同期次患者的胸部平片密度变化,492例患者资料整理如下,问矽肺患者肺门密度的增加与期次有无差别?

H0:矽肺期次与肺门密度级别无关,即各期矽肺构成比相同且各级肺门密度构成比相同 H1:矽肺期次与肺门密度级别有关 α=0.05 χ2=163.01 ν=4 查表得p<0.005,拒绝H0, 认为矽肺期次与肺门密度级别有关。

3.双向有序且属性相同的分类资料的一致性检验 SPSS中通过计算卡帕系数(Kappa), 来进行一致性检验,它是评价判断一致性(agreement)程度的指标,适用于行与列有相同的分类。 例如用来检验两个评估人对同一对象进行评估时,是否具有相同的态度,1表示两个人评估结果完全一致,0表示两个人评估结果是由于随机因素造成。Kappa值越大,表示一致程度越好,一般Kappa值大于0.75,说明一致程度已相当满意,若小于0.4,则不满意。

例 应用核素法和对比法检测147例冠心病 患者心脏室壁收缩运动的符合情况,结果 如下,问这两种方法测定结果是否一致?

本例两个分组变量的本质都是“测定 结果”,故其专业属性是相同的,并且测 定结果的类别划分也是相同的顺序,即正 常、减弱、异常。对于这种资料,研究者 既关心两变量之间是否存在相关性,而且 还关心这两种方法测定结果的一致性如何, 一致性检验计算Kappa统计量 pa — p e Kappa = 1 — p e pa 和 p e 分别为实际观察、期望观察一致的比例。

注意事项 1. 行×列表的χ2检验要求理论频数不宜太小,要 求不宜有1/5以上的格子的理论频数小于5,或有一个理论频数小于1。 1. 行×列表的χ2检验要求理论频数不宜太小,要 求不宜有1/5以上的格子的理论频数小于5,或有一个理论频数小于1。 2.   如果以上条件不能满足,可采用: l       增加样本含量 l       删去某行或某列 l       合理地(医学上合理性)合并部分性质相近的行或 列 l       用精确概率法 3. 多个率或构成比比较的χ2检验,结论为拒绝H0时,仅表示几组有差别,并非任2组之间都有差别。若要了解之,可进行χ2表的分割。

频数分布拟合优度的χ2检验 在医学实际工作中常需要考察一个样本的频数分布是否符合某种概率模型规定的理论分布,如果符合就可将它按该理论分布来处理。

例6 某地爆发流行细菌性痢疾,为了分析这次爆发流行是否存在家庭内成员间的传播,共调查了四口之家288户,数据如下,试检验能否用二项分布模型来拟合这一组实际资料。

分析:如果能够拟合,表明家庭成员发病与否是独立、等概率的。 H0:此次流行不存在家庭内成员间的传播 估计二项分布的总体率π: π=发病总人数/调查总人数 =0.18576

χ2=81.00 ν=4-1=3, 查表得p<0.05 拒绝H0,认为本次调查的四口之家内发病人数的分布不符合二项分布,此次流行可能存在家庭成员间的传播。