卡方检验.

Slides:

Advertisements

Similar presentations

卡方检验. 内容卡方检验入门 1 配对设计两样本率比较的 χ2 检验 2 行列表资料的分析 3 确切概率法 4.

Advertisements

第五节函数的微分一、微分的定义二、微分的几何意义三、基本初等函数的微分公式与微分运算法则四、微分形式不变性五、微分在近似计算中的应用六、小结.

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.

2.5 函数的微分一、问题的提出二、微分的定义三、可微的条件四、微分的几何意义五、微分的求法六、小结.

练一练：在数轴上画出表示下列各数的点，并指出这些点相互间的关系： -6 ， 6 ， -3 ， 3 ， -1.5, 1.5.

第八章 X2 检验卫生（医学）统计学普通高等教育 “ 十一五 ” 国家级规划教材. Ｘ 2 检验用途 1 、推断两个或两个以上的总体率或总体构成比之间有无差别； 2 、推断两种属性或两个变量之间有无关联性； 3 、频数分布的拟合优度检验。

第十七章分类资料的统计推断.

龙星课程—肿瘤生物信息学上机课程曹莎

资料连续型资料离散型资料大样本小样本.

圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.

作者：熊林平.

PET-CT-SUVmax与鼻咽癌放疗过程中原发灶径线变化的关系

第七章非参数统计非参数统计（亦称非参数检验），是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。主要特点

第十一章两变量关联性分析.

研究中心：河北医科大学第四医院 ***科主要研究者：**** 申办者：********公司 CRO：********公司

紧扣课程标准关注社会热点 —苏教版教材新增内容复习建议南京市南湖第一中学马峰.

6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.

完全随机设计多样本资料秩和检验.

财经法规与会计职业道德（3）四川财经职业学院.

医学统计学主讲人：信息部林雪君.

计数资料的统计推断（2 学时）吴成秋公共卫生学院预防医学系

第一篇：静力学 1 、研究的主要问题：力，力系的简化原理及物体在力系作用下的平衡问题。 2 、研究方法：对物体（或物体系）进行受

面向海洋的开放地区——珠江三角洲山东省高青县实验中学：郑宝田.

第八章 t 检验.

发展心理学王荣山.

成才之路 · 地理人教版 · 必修3 路漫漫其修远兮吾将上下而求索.

§5.3 定积分的换元法和分部积分法一、定积分的换元法二、定积分的分部积分法三、小结、作业.

第三篇医学统计学方法. 第三篇医学统计学方法医学统计学方法实习2 主讲人陶育纯医学统计学方法实习2 主讲人陶育纯流行病与卫生统计学教研室

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

初中数学八年级下册（苏科版） 10.4 探索三角形相似的条件（2）.

第七章财务报告主讲老师：王琼上周知识回顾.

辅导课程六.

统计软件应用 6 主讲人陶育纯 SPSS统计分析统计软件应用 6 主讲人陶育纯教案.

第十章方差分析.

绿色圃中小学教育网比例比例的意义绿色圃中小学教育网

第三篇医学统计学方法. 第三篇医学统计学方法医学统计学方法实习3 主讲人陶育纯医学统计学方法实习3 主讲人陶育纯流行病与卫生统计学教研室

28.1 锐角三角函数(2) ——余弦、正切.

第七章参数估计 7.3 参数的区间估计.

医学统计学方法实习3 主讲人陶育纯医学统计学方法实习3 主讲人陶育纯

习题一、概率论 1.已知随机事件A，B，C满足在下列三种情况下，计算（1）A，B，C相互独立（2）A，B独立，A，C互不相容

抽样和抽样分布基本计算 Sampling & Sampling distribution

实数与向量的积.

两组两分类资料检验.

模型分类问题 Presented by 刘婷婷苏琬琳.

概率统计主讲教师叶宏山东大学数学院.

线性代数厦门大学线性代数教学组 2019年4月24日6时8分 / 45.

5.2 常用统计分布一、常见分布二、概率分布的分位数三、小结.

WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了，与其他文章的区别是什么？ 2.Charging Control的手段是什么？ 3.Power Reigon是什么东西？

完全随机设计多组资料的比较赵耐青卫生统计教研室.

成绩是怎么算出来的？ 16级第一学期半期考试成绩班级姓名语文数学英语政治历史地理物理化学生物总分 1 张三1 115

第九节赋值运算符和赋值表达式.

§6.7 子空间的直和一、直和的定义二、直和的判定三、多个子空间的直和.

九年义务教育五年制小学教科书数学第十册《比例的意义和基本性质》新野县城关镇南关小学：邹汉苗.

相关与回归非确定关系在宏观上存在关系，但并未精确到可以用函数关系来表达。青少年身高与年龄，体重与体表面积非确定关系：

第一节不定积分的概念与性质一、原函数与不定积分的概念二、不定积分的几何意义三、基本积分表四、不定积分的性质五、小结思考题.

第4课时绝对值.

第一部分：概率产生随机样本：对分布采样均匀分布其他分布伪随机数很多统计软件包中都有此工具如在Matlab中：rand

第四节多个样本均数的两两比较多个样本均数的两两比较又称多重比较(multiple comparison)，其目的是推断究竟哪些总体均数之间存在差别。

第15讲特征值与特征向量的性质主要内容：特征值与特征向量的性质.

§5.2 抽样分布　　确定统计量的分布——抽样分布，是数理统计的基本问题之一．采用求随机向量的函数的分布的方法可得到抽样分布．由于样本容量一般不止2或 3(甚至还可能是随机的)，故计算往往很复杂，有时还需要特殊技巧或特殊工具．　　由于正态总体是最常见的总体，故本节介绍的几个抽样分布均对正态总体而言．

第二节函数的极限一、函数极限的定义二、函数极限的性质三、小结思考题.

正弦、余弦函数的性质华容一中伍立华 2017年2月24日.

第三节随机区组设计的方差分析随机区组设计资料的总平方和可以分解为三项：（10.10）.

难点：连续变量函数分布与二维连续变量分布

欢迎大家来到我们的课堂 §3.1.1两角差的余弦公式广州市西关外国语学校高一(5)班教师：王琦.

单样本检验.

BAFF在活动性SLE患者T细胞中的表达:

MTOR典型案例征集大赛标题：医院：科室：姓名：邮箱： 2015 年月日.

Presentation transcript:

卡方检验

二项分布中，我们应用正态近似法介绍了两个率的u检验。但在观察例数不足够大或拟对多个率进行比较时，u检验就不适宜了，因为直接对多个样本率作两两间的u检验有可能加大第一类误差（如同直接对多个样本均数作两两间的t检验）。X2 检验（chi-square test)可解决此问题。 X2 检验是一种用途较广的假设检验方法，适用于分类变量资料( 计量资料 ) 。它能推断两个及多个总体率或总体构成比之间的有无差异，两个属性或变量之间有无关联性，以及频数分布的拟合优度检验等。

χ2检验的用途： 1．推断多个总体率之间有无差别 2．推断几组总体构成比之间有无差别 3．两个变量之间有无关联性 4．频数分布的拟合优度检验

四格表资料的χ2检验在医学资料中，常常需要比较两个样本率之间的差异有无显著性，如推断某人群男与女的某种疾病的患病率是否相等，即该病是否与性别有关。这类资料由4个数据构成：男与女的患病人数和未患病人数，统计学称这类资料为四格表资料。首先复习一下χ2检验的几种计算方法。一．通用公式法二. 专用公式法三. 四格表χ2值的校正四. 精确概率法五. 配对资料的χ2检验

一. 通用公式法 χ2= 其中为A实际频数，T为理论频数，，nR是行和，nC是列和，n是四格数之和。

例1 某护士为了解过氧乙酸和乙醇两种消毒方法对HBV血清中HBsAg的消毒效果，做了两种方法的比较试验，结果如下：两种消毒方法对消毒效果的比较 42.06 126 73 62 合计 28.13 64 46 27 80%乙醇 56.45 35 0.5%过氧乙酸消除率未消除消除方法

nR合计 R C (a+c)/N a+b+c+d b+c a+c c/(c+d) c+d d c R2 a/(a+b) a+b b a R1 率 nC合计 C2 C1 C

二专用公式法以上计算χ2统计量的公式对任意行×列表都适合，而对于四格表资料，可以用其简化公式 χ2= 例1（续） χ2=

三. 四格表χ2值的校正 (continuity correction) 由于χ2界值表是一连续分布：χ2分布计算出来的，但原始数据属计数资料是离散的，由此计算出来的χ2值也是离散的，特别是四格表，有时若不校正，所求χ2值偏大，所得概率p值偏低。 ①n≥40，且T≥5时，可用未校正的值 ②1≤T<5，且n≥40时，宜用校正χ2值或用精确概率计算法 ③T<1或n<40时，宜用精确概率计算法校正公式

例2 某矿石粉厂当生产一种矿石粉石时，在数天内即有部分工人患职业性皮肤炎，在生产季节开始，随机抽取15名车间工人穿上新防护服，其余仍穿原用的防护服，生产进行一个月后，检查两组工人的皮肤炎患病率，结果如下：穿新旧两种防护服工人的皮肤炎患病率比较理论频数T11=15*11/43=3.84, 1<T11<5且n=43>40，所以宜用χ2值的校正公式 χ2=2.94 查χ2界值表得0.10>p>0.05，按α=0.05水平不拒绝H0，尚不能认为穿不同防护服的皮肤炎患病率有差别。若不校正，χ2=4.33 p<0.05 防护服种类阳性例数阴性例数合计患病率新 1 14 15 6.7 旧 10 18 28 35.7 11 32 43 25.6

理论值小于5

皮尔逊 X2

四.确切概率法（Fisher’s exact probability）不作介绍。例2：某医生用新旧两种药物治疗某病患者 13人，结果如下表，问新药的效果是否优于旧药？级别治愈未愈合计治愈率旧药 6 1 7 14.3 新药 5 83.3 13 53.8

五. 配对资料的χ2检验在前面已介绍了配对设计的t检验，配对设计的t检验是对于计量资料（观察值），将两种处理分别施于条件相同的两个受试对象，或施于同一受试对象某种处理前后某指标的变化，比较两总体均数的差异。若是对于计数资料，我们

用配对资料的χ2检验。如把每一份标本平分为两份，分别用两种方法进行化验，比较此两种化验方法的结果是否有本质不同，或分别采用甲乙两种方法对同一批病人进行检查，比较此两种检查方法的结果是否有本质不同；此时要用我们用配对χ2检验。

例3 有205份咽喉涂抹标本，把每份标本依同样的条件分别接种于甲、乙两种白喉杆菌培养基上，观察白喉杆菌生长的情况，观察结果如下，问两种培养基的结果有无差别？两种白喉杆菌培养基培养结果比较乙种培养法甲种培养法合计 + - 36 34 70 135 169 205

分析：我们可以用上节的方法计算χ2值来判断两种处理的结果有无相关关系（有无联系） χ2= =84.22 相关但是我们现在的目的是比较两法结果的差异，如果将两法的阳性率36/205与70/205作比较（用前节方法）是不正确的，因为理论频数是在两法结果相互独立假设下推算出来的，比较两法结果有无差别，要着眼于两法结果不一致的部分。检验统计量当b+c≥40时 χ2= 当b+c<40时 χ2= ν=1

H0：甲法阳性乙法阴性例数与甲法阴性乙法阳性例数，即总体B=C χ2=32.03 查χ2界值表 p<0.01，拒绝H0，认为两法培养效果不一样，乙法优于甲法。

行×列表的χ2检验前面介绍的四格表只有2行2列，只能对2个率或2类构成比作出比较。在医学研究中有时要比较几个率，如：要比较某市重污染区、一般市区和农村三个地区的出生婴儿的致畸率。有时要分析几组多类构成的构成比是否相同，如：以母乳、牛乳、混合三种不同方式喂养的新生儿体重增长的构成是否一致。有时要推断2个分类变量是否有关联，如：研究冠心病与眼底动脉硬化的关系。

行×列表的χ2值计算 χ2= χ2= ν=(R-1)(C-1)

1. 多个率比较例4 研究复方哌唑嗪对高血压病治疗效果的临床试验并与复方降压片和安慰剂作对照，结果如下表，问三种药物效果有无差别？三种药物治疗高血压病的有效率比较 60.78 102 40 62 合计 21.88 32 25 7 安慰剂 66.67 30 10 20 复方降压片 87.50 5 35 复方哌唑嗪有效率% 无效有效组别

H0：三种药物的总体有效率相同，即π1=π2=π3 H1：π1 π2 π3不全相等 α=0.05 χ2= ν=2 查χ2界值表得 p<0.005 按α=0.05水平拒绝H0，认为三种药物的治疗效果不全相同。

附：行×列表的X2分割在行X列表的X2检验中，若P<0.05，我们拒绝无效假设H0，只能作出总体上有显著性意义的总的结论，而不能对每两两之间有无显著性差异作出结论。若要进行两两比较，还需要把行X列表进行分割，才能对每两两之间有无显著性差异作出结论。行X列表进行分割可分为多组间的两两比较和多个实验组与一对照组比较两种。

例3（续）哌唑嗪组与降压片组的有效率接近，将此2组合并，得到2个分割表：分割表1 分割表2 组别有效无效计哌唑嗪 35 5 40 用药组 55 15 70 降压片 20 10 30 安慰剂 7 25 32 合计 62 102 χ21=4.419 χ22=29.615

可以得出χ21+χ22=34.034约等于原来的χ2=32.74，两者不相等是由于分割表中理论频数的数值与总表中理论频数不同所致。即有结论，哌唑嗪、降压片与安慰剂的有效率均不相同。

例4 1979年某地爆发松毛虫病，333例患者按年龄以14岁为界分成2组，资料如表，试考察两组病人病变类型的构成比有无差别？ 2．多个构成比比较例4 1979年某地爆发松毛虫病，333例患者按年龄以14岁为界分成2组，资料如表，试考察两组病人病变类型的构成比有无差别？某地两组松毛虫病患者型别构成比较年龄分组皮炎型骨关节炎型软组织炎型混合型合计儿童组 50 48 18 72 188 成人组 105 10 7 23 145 155 58 25 95 333 H0：两组患者中患各型松毛虫病的构成比相同 H1：两组患者中患各型松毛虫病的构成比不同 α=0.05 χ2=70.14 查表得p<0.005，拒绝H0，认为两组患者中患各型松毛虫病的构成比不同。

3．双向有序且属性不同的分类资料的关联性检验例5 某矿工医院探讨矽肺不同期次患者的胸部平片密度变化，492例患者资料整理如下，问矽肺患者肺门密度的增加与期次有无差别？

H0：矽肺期次与肺门密度级别无关，即各期矽肺构成比相同且各级肺门密度构成比相同 H1：矽肺期次与肺门密度级别有关 α=0.05 χ2=163.01 ν=4 查表得p<0.005，拒绝H0，认为矽肺期次与肺门密度级别有关。

3．双向有序且属性相同的分类资料的一致性检验 SPSS中通过计算卡帕系数（Kappa）, 来进行一致性检验，它是评价判断一致性（agreement）程度的指标，适用于行与列有相同的分类。例如用来检验两个评估人对同一对象进行评估时，是否具有相同的态度，1表示两个人评估结果完全一致，0表示两个人评估结果是由于随机因素造成。Kappa值越大，表示一致程度越好，一般Kappa值大于0.75，说明一致程度已相当满意，若小于0.4，则不满意。

例应用核素法和对比法检测147例冠心病患者心脏室壁收缩运动的符合情况，结果如下，问这两种方法测定结果是否一致？

本例两个分组变量的本质都是“测定结果”，故其专业属性是相同的，并且测定结果的类别划分也是相同的顺序，即正常、减弱、异常。对于这种资料，研究者既关心两变量之间是否存在相关性，而且还关心这两种方法测定结果的一致性如何，一致性检验计算Kappa统计量 pa — p e Kappa = 1 — p e pa 和 p e 分别为实际观察、期望观察一致的比例。

注意事项 1．行×列表的χ2检验要求理论频数不宜太小，要求不宜有1/5以上的格子的理论频数小于5，或有一个理论频数小于1。 1．行×列表的χ2检验要求理论频数不宜太小，要求不宜有1/5以上的格子的理论频数小于5，或有一个理论频数小于1。 2．如果以上条件不能满足，可采用： l 增加样本含量 l 删去某行或某列 l 合理地（医学上合理性）合并部分性质相近的行或列 l 用精确概率法 3．多个率或构成比比较的χ2检验，结论为拒绝H0时，仅表示几组有差别，并非任2组之间都有差别。若要了解之，可进行χ2表的分割。

频数分布拟合优度的χ2检验在医学实际工作中常需要考察一个样本的频数分布是否符合某种概率模型规定的理论分布，如果符合就可将它按该理论分布来处理。

例6 某地爆发流行细菌性痢疾，为了分析这次爆发流行是否存在家庭内成员间的传播，共调查了四口之家288户，数据如下，试检验能否用二项分布模型来拟合这一组实际资料。

分析：如果能够拟合，表明家庭成员发病与否是独立、等概率的。 H0：此次流行不存在家庭内成员间的传播估计二项分布的总体率π： π=发病总人数/调查总人数 =0.18576

χ2=81.00 ν=4-1=3，查表得p<0.05 拒绝H0，认为本次调查的四口之家内发病人数的分布不符合二项分布，此次流行可能存在家庭成员间的传播。