第八章 X2 检验 卫生(医学)统计学 普通高等教育 “ 十一五 ” 国家级规划教材. X 2 检验用途 1 、推断两个或两个以上的总体率或总体构 成比 之间有无差别; 2 、推断两种属性或两个变量之间有无关联 性; 3 、频数分布的拟合优度检验。

Slides:



Advertisements
Similar presentations
2 和 5 的倍数的特征 运动热身 怎样找一个数的倍数? 从小到大写出 2 的倍数( 10 个): 写出 5 的倍数( 6 个) 2 , 4 , 6 , 8 , 10 , 12 , 14 , 16 , 18 , 20 5 , 10 , 15 , 20 , 25 , 30.
Advertisements

卡方检验. 内容 卡方检验入门 1 配对设计两样本率比较的 χ2 检验 2 行列表资料的分析 3 确切概率法 4.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
XX啤酒营销及广告策略.
第十七章 分类资料的统计推断.
作者:熊林平.
证券投资技术分析.
第十一章 两变量关联性分析.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
卡方检验.
完全随机设计多样本资料秩和检验.
医学统计学 主讲人:信息部 林雪君.
计数资料的统计推断 (2 学时) 吴成秋 公共卫生学院预防医学系
第 八 章 t 检 验.
§5.3 定积分的换元法 和分部积分法 一、 定积分的换元法 二、 定积分的分部积分法 三、 小结、作业.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
第三节 函数的求导法则 一 函数的四则运算的微分法则 二 反函数的微分法则 三 复合函数的微分法则及微分 形式不变性 四 微分法小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第三章 导数与微分 习 题 课 主要内容 典型例题.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
北师大版七年级数学 5.5 应用一元一次方程 ——“希望工程”义演 枣庄市第三十四中学 曹馨.
探索三角形相似的条件(2).
初中数学八年级下册 (苏科版) 10.4 探索三角形 相似的条件(2).
海洋存亡 匹夫有责 ——让我们都来做环保小卫士 XX小学三(3)班.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
元素替换法 ——行列式按行(列)展开(推论)
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
统计软件应用 6 主讲人 陶育纯 SPSS统计分析 统计软件应用 6 主讲人 陶育纯 教案.
第十章 方差分析.
绿色圃中小学教育网 比例 比例的意义 绿色圃中小学教育网
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习3 主讲人 陶育纯 医学统计学方法 实习3 主讲人 陶育纯 流行病与卫生统计学教研室
医学统计学方法 实习3 主讲人 陶育纯 医学统计学方法 实习3 主讲人 陶育纯
抽样和抽样分布 基本计算 Sampling & Sampling distribution
两组两分类资料检验.
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
用计算器开方.
实体描述呈现方法的研究 实验评估 2019/5/1.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第六章 Excel的应用 一、Excel的单元格与区域 1、单元格:H8, D7, IV26等 2、区域:H2..D8, HS98:IT77
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
3.1.2 空间向量的数量积运算 1.了解空间向量夹角的概念及表示方法. 2.掌握空间向量数量积的计算方法及应用.
九年义务教育五年制小学教科书 数 学 第 十 册 《比例的意义和基本性质》 新野县城关镇南关小学:邹汉苗.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第4课时 绝对值.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第四节 多个样本均数的两两比较 多个样本均数的两两比较又称多重比较(multiple comparison),其目的是推断究竟哪些总体均数之间存在差别。
分数再认识三 真假带分数的练习课.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
§2 方阵的特征值与特征向量.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
难点:连续变量函数分布与二维连续变量分布
Statistical Methods in Medicine
基于列存储的RDF数据管理 朱敏
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
本底对汞原子第一激发能测量的影响 钱振宇
§4.5 最大公因式的矩阵求法( Ⅱ ).
二、配对样本t检验 配对设计(paired design)定义:将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理,称为随机配对设计。
一元一次方程的解法(-).
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
假设检验.
9.3多项式乘多项式.
Presentation transcript:

第八章 X2 检验 卫生(医学)统计学 普通高等教育 “ 十一五 ” 国家级规划教材

X 2 检验用途 1 、推断两个或两个以上的总体率或总体构 成比 之间有无差别; 2 、推断两种属性或两个变量之间有无关联 性; 3 、频数分布的拟合优度检验。

X 2 检验类型 1 、四格表资料X 2 检验; 2 、配对计数资料X 2 检验; 3 、行 × 列( R×C )表资料X 2 检验; 4 、行 × 列( R×C )列联表X 2 检验。

四格表资料X 2 检验 一、用途: 推断两个总体率有无差异 。 表 8.1 两组人尿棕色素阳性率比较 组 别 阳性数 阴性数 合计 阳性率 % 铅中毒 29 ( ) 7 ( ) 对照组 9 ( ) 8 ( ) 合 计 注:括号内为理论频数

检验基本思想 值的计算方法(通用公式): 式中 A 为实际数, T 为理论数,根据 H 0 的假设推 算出来。 为 R 行 C 列的理论数; n R 为 T 所在行合计数 ; n C 为 T 所在列合计数。 X2X2

从 值计算公式可以看出, 检验是检验实际分 布和理论分布的吻合程度。若 H 0 假设成立,则实际 分布( A) 和理论分布 (T) 相差不大, 值应较小;若 H 0 假设不成立,则实际分布( A) 和理论分布 (T) 相差 较大, 值应较大。另外 值的大小尚与格子数 (自由度)有关,格子数越多, 值越大。 可以根据 分布原理,由 值确定 P 值,从而作出 推论。 V=( 行数 -1)( 列数 -1)

四格表资料 X 2 检验专用公式: 式中 : a 、 b 、 c 、 d 为四个实际数,其中 a 、 c 为阳性数, b 、 d 为阴性数, n 为总例数。

X 2 检验过程 1 、建立假设 H 0 : π 1 = π 2 H 1 : π 1 ≠π 2 α = 、计算 X 2 值 ( 1 ) 用基本公式计算 T 11 = (38×36) / 73 = T 12 = = T 21 = 38 - = T 22 = = 17.74

(2) 用专用公式计算 a=29 、 b=7 、 c=9 、 d=28 、 n=73

3 、查 X 2 界值表确定 P 值 按= 1 ,查附表 8 , X 2 界值表得: X , 1 =3.84 、 X , 1 =6.63 、 X , 1 =7.88 X 2 >7.88, P< 、推断结论 P<0.005, 按 α = 0.05 ,拒绝 H 0 ,接受 H 1 ,可认为 两总体阳性率有差别,铅中毒病人尿棕色素阳性率高 于正常人,说明铅中毒有尿棕色素增高现象。

四格表资料 X 2 检验的校正 1 、四格表资料检验条件: ( 1 ) 当 n≥40 且所有 T≥5, 用普通 X 2 检验,若 P≈ ,改用 四格表确切概率法(直接计算概率法); ( 2 )当 n≥40 ,但 1≤T<5 时, 用校正的 X 2 检验; (3) 、当 n<40 或 T<1 时,用四格表确切概率法。

2 、校正公式: (1) 、基本公式: (2) 、专用公式:

表 8.3 穿新旧两种防护服工人的皮肤炎患病率比较 ━━━━━━━━━━━━━━━━━━━━━━━ 防护服种类 阳性数 阴性数 合计 患病率 (%) ─────────────────────────────── 新 1(3.84) 旧 ─────────────────────────────── 合计 ━━━━━━━━━━━━━━━━━━━━━━ 例 8.2

1 、建立假设 H 0 : π 1 = π 2 H 1 : π 1 ≠π 2 α = 、计算 X 2 值 因 T 11 =3.84<5, 故需要使用校正公式 用专用公式: a=1 、 b=14 、 c=10 、 d=18

3 、查X 2 表确定 P 值 V = 1 , X , 1 =3.84 ,X 2 = 、推断结论 P>0.05 ,按 α = 0.05 水准,接受 H 0 ,尚不能认为两组患病率有 差别。 ( 如不校正,X 2 =4.33, X , 1 =3.84 , P<0.05 ,结论相 反。 )

四格表的确切概率法 一、应用范围 1 、当四格表的 T<1 或 n<40 时; 2 、用四格表 X 2 检验所得的概率接近检验水准时 二、四格表确切概率法的基本思想 (一)四格表中的 |A - T| 值有两个特点 1 、各格相等 ; 2 、依次增减四格表中某格数据,在周边合计数不 变条件下,可列出各种组合的四格表。

(二)四格表确切概率法的基本思想 在周边合计数不变条件下,列出各种组合的四格 表,然后计算所有 |A - T| 值等于及大于样本 |A - T| 值 的四格表的 P 值,将其相加,即得到检验概率 P 。 双侧检验: 对所有 |A - T| 值等于及大于样本 |A - T| 值的四格表 P 值相加; 单侧检验: 按检验目的,取阳性数增大或减小一侧 的 |A - T| 值等于及大于样本 |A - T| 值四格表;

四格表概率 P 的计算公式 (a+b)!(c+d)!(a+c)!(b+d)! P = ──────────── a!b!c!d!n!

例 8.8 表 8.9 两型慢性布氏病的 PHA 皮试反应 ━━━━━━━━━━━━━━━━━━━ 分型 阳性数 阴性数 合计 阳性率 (%) ─────────────────── 活动型 1(2.4) 14(12.6) 稳定型 3(1.6) 7(8.4) ─────────────── 合计 ━━━━━━━━━━━━━━━━━━━

各种组合的四格表: (1) (2) (3) (4) (5) |A-T| 值: P(i) 样本四格表

计算 P 值: 15!10!4!21! P(1) = ────── = !15!4!6!25! 15!10!4!21! P(2) = ────── = !14!3!7!25! 15!10!4!21! P(5) = ────── = !11!0!10!25! P = P(1) + P(2) + P(5) =

∵ P = >0.05 ,∴ 在 α = 0.05 水准上,不拒绝 H 0 , 故尚不能两型患者的反应阳性率有差别。 1 、当 T>5 (所有格子),且 n>40 时,应用 或 四格表检验小结

2 、当 1 40 时,用 ( 1 ) 或 ( 2 )或改用确切概率计算法

3 、当 T<1 或 n<40 时, 不能用X 2 检验的所有计算公式, 只能应用确 切概率计算法。 4 、当四格表有一个格子的实际数为 0 时,也 不能用X 2 检验法, 可以采用确切概率法。

配对四格表资料的 X 2 检验 一、 用途: 用于配对计数资料的检验: ( 1 )两种方法有无差别; ( 2 )两种方法有无关联(计数资料相关分析)。

二、配对的形式 1 、同一个样品,用两种方法处理的结果; 2 、同一个病例用两种方法诊断或检查的结果; 3 、匹配的一对病例和对照是否存在某种病因 ; 4 、配对的两个对象分别接受不同处理的结果。 配对计数资料经整理后,得出四个数据: a :甲乙两者均为阳性; b :甲阳性而乙阴性; c :甲阴性而乙阳性; d :甲乙两者均为阴性。

表 8.4 两种血清学检验结果比较 甲法 乙 法 合计 + - + 45 ( a ) 22 ( b ) 67 - 6 ( c ) 20 ( d ) 26 合计 这是配对设计计数资料,表中两法的差别是由 b 和 c 两 格数据来反映。总体中 b 和 c 对应的数据可用 B 和 C 表示。

H 0 : 两总体阳性检出率相等,即 B=C ; H 1 : 两总体阳性检出率不等,即 B≠C ; α=0.05 X 2 =, v=1 若 b+c<40: X 2 =, v=1

V=1 ,查界值表得: =7.88 , >, P<0.005 按 α=0.05 水准拒绝 H 0 ,接受 H 1 ,故可认为甲乙两法 的血清学阳性检出率不同。参照结果,说明甲法的 阳性检出率较高。 注意:当 a 和 d 的数字特别大而 b 和 c 的数字较小时, 即使检验结果有统计学意义,而实际意义也不大。 故配对四格表 X 2 检验一般用于检验样本含量不太大 的资料。

行 × 列( R×C )表的X 2 检验 一、用途: 1 、推断两个或以上的总体率(或构成比)有 无差异。 2 、推断两个分类变量间有无关联性 ( 计数资料 相关分析 ) 二、检验公式: V= (行 -1 )(列 -1 )

三、应用举例 (一)多个样本率的比较 表 8.4 某省三个地区花生的黄曲霉毒素 B 污染情 ━━━━━━━━━━━━━━━━━━━━━ 地区 未污染 污染 合计 污染率 (%) ───────────────────── 甲 乙 丙 ───────────────────── 合计 ━━━━━━━━━━━━━━━━━━━━━

1 、 建立假设 H 0 : π1 = π2 = π3 H 1 : π1≠π2≠π3 (三个率不等或不全相等) α = 、计算 X 2 值

3 、查 X 2 表确定 P 值 自由度 V = ( 行数 -1)( 列数 -1) = (3-1)(2-1) = 2 查 X 2 界值表得 : X , 2 =10.60 X 2 = 17.91> X , 2 =10.60 P< 、推断结论 ∵ P<0.005 , ∴ 在 α = 0.05 水准上,拒绝 H 0 ,接受 H 1 ,可认为三个地区的污染率不等或不全相等,有地区 差异。

(二)样本构成比比较 表 8.6 鼻咽癌患者与眼科病人血型构成比较 组别 A 型 B 型 O 型 AB 型 合计 鼻咽癌患者 眼科病人 合 计

H 0 : 鼻咽癌患者与眼科病人血型总体构成比相同 H 1 : 鼻咽癌患者与眼科病人血型总体构成比不同或不 全相同 α=0.05 按公式 计算 X 2 =2.56 V=(2-1)(4-1)=3 , , , 0.5>P>0.25 按 α=0.05 水准不拒绝 H 0 ,故尚不能认为鼻咽癌患者与 眼科病人血型构成比有差别,即尚不能认为血型与鼻咽 癌发病有关。

( 三 ) 双向有序分类资料的关联性检验 1 、 2×2 列联表资料的关联性检验 表 8.4 两种血清学检验结果比较 甲法 乙 法 合计 + - + 45 ( a ) 22 ( b ) 67 - 6 ( c ) 20 ( d ) 26 合计

H 0 : 甲、乙两种方法无相关 H 1 : 甲、乙两种方法有相关 α=0.05 v=1,, >, P<0.005 。 按 α=0.05 检验水准,拒绝 H 0, 接受 H 1, 可以认为甲、乙 两种方法有相关。

2 、 R×C 列联表资料的关联性检验 表 8.7 不同期次矽肺患者肺门密度级别分布 矽肺期次 肺门密度级别 合计 ﹢ ﹢﹢ ﹢﹢﹢ Ⅰ Ⅱ Ⅲ 合计

1 、 建立假设 H 0 : 矽肺期别与肺门密度级别无关 H 1 : 矽肺期别与肺门密度级别有关 α = 、计算值 rs =

3 、查 X 2 表确定 P 值 V = (3-1)(3-1)=4 查 X 2 界值表得: X , 4 =14.86 , X 2 > X , 4 , P<0.005 。 4 、推断结论 P 0, 可认为肺门密度级别有随着矽肺期别增高而增加的趋 势。

行 × 列表 X 2 检验注意事项 1 、不宜有 1/5 以上格子理论数小于 5 ,或有一个 理论数小于 1 。 ★理论数太小的处理方法: ( 1 )增加样本的含量 ( 2 )删除理论数太小的行和列 ( 3 )合理合并理论数太小的行或列 第( 2 )和第( 3 )种处理方法损失信息和损 害随机性,故不宜作为常规处理方法。

2 、对于单向有序行列表,行 × 列表的 X 2 检验只说 明各组的效应在构成比上有无差异,如果要比较各 组的效应有无差别,需应用秩和检验。例: ──────────────────────────── 治愈 显效 无效 死亡 合计 ──────────────────────────── 治疗组 a1 b1 c1 d1 N1 对照组 a1 b2 c2 d2 N2 ──────────────────────────── 合计 a b c d N ──────────────────────────── X 2 检验: 只说明两组的四种疗效在总治疗人数所 占比例有无差别; 秩和检验: 说明两组疗效有无差别。 ☆解决此问题方法: X 2 分割法。

3 、当三个及以上率(或构成比)比较,结 论拒绝 H 0 时, 只能总的说有差别,但不能说明它 们彼此间都有差别,或某两者间有差别。 ☆解决此问题方法: X 2 分割法。 X 2 分割法原理:把原行 × 列表分割为若干个分割 表(四格表), 各分割表的自由度之和等于原行 × 列表的自由度,其 X 2 值之和约等于原行 × 列表的 X 2 值。

X 2 分割方法: ( 1 )把率(或构成比)相差最小的样本分割出 来 ( 四格表 ) ,计算 X 2 值; ( 2 )差异无显著性时,把它合并为一个样本, 再把它与另一较相近的样本比较; ( 3 )差异有显著性时,作出结论,再把它与另 一较相近的样本比较; ( 4 )如此进行下去直到结束。

表 8.6 X 2 分割计算 ─────────────────────────── 地区 未污染 污染 合计 污染率 (%) X 2 值 P ─────────────────────────── 乙 >0.05 丙 ────────────────────────── 合计 ────────────────────────── 乙 + 丙 <0.05 甲 ────────────────────────── 合计 ━━━━━━━━━━━━━━━━━━━━━━