1051 检验 Chi-Square Test 第七章. 1052 Content test of fourfold data test of paired fourfold data Fisher probabilities in fourfold data test of R×C table Multiple.

Slides:



Advertisements
Similar presentations
第十三章 医学统计学方法的基本概念和基本步骤
Advertisements

理念是教育的灵魂 行动是成功的保证 咸阳底张学区小学段 课程改革研讨报告 2011年4月.
主题8 对教学设计与实施的评价 讲课教师:关坤
消防知识进校园 珠海市公安消防局 贾博.
文艺类说明文阅读.
庆生会+特色厨房.
墨子選 非攻.
野薑花有機生態教育農場 主講人 林進財.
《天津市建设工程监理企业信用评价办法》 介绍.
張偉豪 三星統計服務有限公司 執行長 Amos 亞洲一哥
一條美麗的銀蠹魚 從水經注裡游出來-──亞弦 讓晶瑩剔透的文字,停駐在我們心中-淺談新詩教學
人體的奧妙 姓名:林佩儀 班級:六年4班 指導老師:趙美華老師.
工业区位因素 胶州二中 高绪军.
初级会计实务 第二章 负债(三) 主讲人:杨菠.
長平之戰是戰國後期一場決定性戰役,秦將白起充分利用地利之便,採後退誘敵、合圍殲滅的戰術。
作者简介: 闻一多(1899-1946) ,湖北浠水人,前新月派诗人和新格律诗理论的奠基者,著名的诗人、学者、民主战士。 其新歌创作的主要成就是两部诗《红烛》(1923)《死水》(1928) 浓烈而真挚的爱国情思是其诗歌的灵魂。 朱自清曾称赞闻一多是五四时期“唯一的爱国诗人”。 闻一多诗歌理论的核心是讲究“三美”:
基本医疗、医疗保险 相关政策简介.
——解读《国务院办公厅关于继续深入开展 “安全生产年”活动的通知》
第三课:我国政府是人民的政府 3.2政府的责任:对人民负责.
幼托教師的在職教育訓練 第三組 498i0052蕭羽婷 498i0053 顏于淨 498i0058 黃祺婷 498i0059 林怡均
校园信息管理系统 河北科技大学网络中心 2000/4/10.
第一节 工业的区位因素与区位选择 【考点1】工业的区位因素 1.常见的工业区位因素 (1)自然因素:土地、原料、动力、水源等。 (2)社会经济因素:交通、劳动力、市场、政府政策、工农业基础、个人偏好、环境等。 2.影响不同工业部门的主导因素 列表分析不同的工业部门在区位选择时需要考虑的主导因素:
眼睛的守護者.
商用統計學 Chapter 12 類別資料分析.
第一章 国际私法的概念 第一节 国际私法的调整对象 第二节 国际私法的范围 第三节 国际私法的性质 第四节 国际私法的名称
99年成語200題庫(21-40).
第九课 第二框 世界多极化:不可逆转.
《钢铁是怎样炼成的》 语段精读.
保良局方王錦全小學 學校健康促進經驗分享    盧淑宜校長.
走過光陰 ── 眷村 三平 2號 何苡瑄.
近代化 小农经济,铁犁牛耕 古老 男耕女织,肩挑背驮 中国 君主专制,文化专制 农耕文明 闭关锁国,天朝上国 近代 西方 工业文明 经济工业化/城市化 政治民主化/法治化 思想理性化/科学化.
财经法规与会计职业道德 (13) 四川财经职业学院.
徵收苗栗市福全段147、1588及文心段10、11地號等4筆土地之
低碳生活,从小事做起 编辑人:刘瑞兴 指导老师:麦文燕 吴霞 编辑地址;岭南师范学院附属中学 编辑时间:
第四课 恪守职业道德 我爱岗 我敬业.
讲 义 大家好!根据局领导的指示,在局会计科和各业务科室的安排下,我给各位简要介绍支付中心的工作职能和集中支付的业务流程。这样使我们之间沟通更融洽,便于我们为预算单位提供更优质的服务。 下面我主要从三方面介绍集中支付业务,一是网上支付系统,二是集中支付业务流程及规定等,
造成近視的原因 一、外在環境:佔百分之七十 1. 飲食失調: __偏食引起。 __甜食過多。 __酸鹼度不平衡。  人體是弱鹼性,攝取過多酸性食物,也會近視。
第七章 诉讼参加人.
第八章了解法律制度自觉遵守法律.
高中历史多媒体课件 高中历史多媒体课件 隋唐时期政治经济概况. 高中历史多媒体课件 高中历史多媒体课件 隋唐时期政治经济概况.
中国人民公安大学经费管理办法(试行) 第一章总则 第四条:“一支笔” “一支笔”--仅指单位主要负责人。负责对本 单位的经费进行审核审批。
一、考试范围 二、考试要求 三、近几年中考题型及解答技巧 四、近来复习中出现的问题 五、采取的措施 六、中考热点复习
必修三 稳态与环境 第5章生态系统及其稳定性 第5节 生态系统的稳定性.
近代中国经济结构的变动.
基本概念 適合度檢定 獨立性檢定 齊一性檢定 多項比例值之假設檢定 結論.
目 錄 壹、緣由 貳、問題解析 參、問題歸納 肆、因應對策 伍、評鑑獎勵 陸、追蹤考核 1.
人口迁移与人口流动.
第八章 财务分析与评价.
思想政治选考数据分析 绍兴市教育教学研究院 骆新华 2016、9、14.
吳福明教授 排球運動發展簡史 編制.
地球在宇宙中 史苏丹.
一條美麗的銀蠹魚 從水經注裡游出來-──亞弦 讓晶瑩剔透的文字,停駐在我們心中-淺談新詩教學
公共事務學系.
第四章 存货 第一节 存货基础 第二节 原材料 第三节 其他存货 第四节 存货期末计量.
糖尿病肾病的护理 陈佳莉.
4-7 生物的演化.
排列组合 1. 两个基本原理 分类加法计数原理 分步乘法计数原理.
第三节 常见天气系统.
劉仁沛教授 國立台灣大學農藝學研究所生物統計組 國立台灣大學流行病學與預防醫學研究所 國家衛生研究院生物統計與生物資訊組
微信商城系统操作说明 色卡会智能门店.
成 本 会 计 学 第六章 产品成本计算的基本方法.
中国农业科学院博士后学术论坛 博士后基金申请的经验及体会 中国农业科学院生物技术研究所 秦 华 博士
聚合型第一種:隱沒帶、島弧 例子:臺灣東方的琉球海溝、南美洲智利海溝. 聚合型第一種:隱沒帶、島弧 例子:臺灣東方的琉球海溝、南美洲智利海溝.
107學年度第1期 學生重補修說明會.
第七章 假设检验 §7.1 假设检验的基本思想与概念 §7.2 正态总体参数假设检验 §7.3 其它分布参数的假设检验
2.2 数轴.
2012年惠州市医用耗材及检验试剂集中采购供应商申报文件制作及注意事项
大綱 一.受試者之禮券/禮品所得稅規範 二.範例介紹 三.自主管理 四.財務室提醒.
Part 3 初等統計與理論.
7 間斷隨機變數及其常用的機率分配  學習目的.
Presentation transcript:

1051 检验 Chi-Square Test 第七章

1052 Content test of fourfold data test of paired fourfold data Fisher probabilities in fourfold data test of R×C table Multiple comparison of sample rates test of goodness of fit

1053

目的: 推断两个总体率或构成比之间有无差别 多个总体率或构成比之间有无差别 多个样本率的多重比较 两个分类变量之间有无关联性 频数分布拟合优度的检验。 检验统计量: 应用:计数资料

1055 第一节 四格表资料的 检验

1056 目的:推断两个总体率(构成比)是 否有差别 (和 u 检验等价) 要求:两样本的两分类个体数排列成四 格表资料

1057 ( 1 ) 分布是一种连续型分布:按分布的密度函数可给出自 由度 =1 , 2 , 3 , …… 的一簇分布曲线 (图 7-1 )。 ( 2 ) 分布的一个基本性质是可加性: 如果两个独立的 随机变量 X 1 和 X 2 分别服从自由度 ν 1 和 ν 2 的分布, 即 ,那么它们的和( X 1 +X 2 )服从自由度 ( ν 1 +ν 2 )的 分布,即 ~ 。 一、 检验的基本思想 1 . 分布

1058

9 2 . 检验的基本思想 例 7-1 某院欲比较异梨醇口服液(试验组)和 氢氯噻嗪 + 地塞米松(对照组)降低颅内压的疗效。 将 200 例颅内压增高症患者随机分为两组,结果见 表 7-1 。问两组降低颅内压的总体有效率有无差别?

10510 表 7-1 两组降低颅内压有效率的比较

10511 本例资料经整理成图 7-2 形式,即有两 个处理组,每个处理组的例数由发生数和 未发生数两部分组成。表内有 四个 基本数据,其余数据均由此四个数据推算 出来的,故称四格表资料。

10512 图 7-2 四格表资料的基本形式

10513 基本思想:可通过 检验的基本公式 来理解。 式中, A 为实际频数( actual frequency ), T 为理论频数( theoretical frequency )。

10514 理论频数由下式求得: 式中, T RC 为第 R 行 C 列的理论频数 n R 为相应的行合计 n C 为相应的列合计

10515 理论频数 是根据检验假设 ,且用合 并率来估计 而定的。 如上例,无效假设是试验组与对照组降低颅内压的 总体有效率相等,均等于合计的有效率 87% 。那么 理论上,试验组的 104 例颅内压增高症患者中有效 者应为 104(174/200)=90.48 ,无效者为 104(26/200)=13.52 ;同理,对照组的 96 例颅内压增 高症患者中有效者应为 96(174/200)=83.52 ,无效者 为 96(26/200)=12.48 。

10516 检验统计量 值反映了实际频数与理 论频数的吻合程度。 若检验假设 H 0 :π 1 =π 2 成立,四个格子的实际频 数 A 与理论频数 T 相差不应该很大,即统计量 不应该很大。如果 值很大,即相对应的 P 值很小, 若 ,则反过来推断 A 与 T 相差太大,超出了抽 样误差允许的范围,从而怀疑 H 0 的正确性,继而 拒绝 H 0 ,接受其对立假设 H 1 ,即 π 1 ≠π 2 。

10517 由公式( 7-1 )还可以看出: 值的大小还取决于 个数的多少(严格地说是自由度 ν 的大小)。由于各 皆是正值,故自由度 ν 愈大, 值也会愈大;所以只有考虑 了自由度 ν 的影响, 值才能正确地反映实际频数 A 和理论频 数 T 的吻合程度。 检验的自由度取决于可以自由取值的格子 数目,而不是样本含量 n 。四格表资料只有 两行两列, =1 ,即在周边合计数固定的情况 下, 4 个基本数据当中只有一个可以自由取 值。

10518 ( 1 ) 建立检验假设,确定检验水平。 H 0 :π 1 =π 2 即试验组与对照组降低颅内压的总体有效率相等 H 1 :π 1 ≠ π 2 即试验组与对照组降低颅内压的总体有效率不相等 α=0.05 。 3. 假设检验步骤

10519 ( 2 )求检验统计量值

10520

10521 二、四格表资料检验的专用公式

10522 分布是一连续型分布,而四格表 资料属离散型分布,由此计算得的统计 量 的抽样分布亦呈离散性质。为改善 统计量 分布的连续性,则需行连续性 校正。

10523 三、四格表资料检验的校正公式

10524 四格表资料 检验公式选择条件: ,专用公式; ,校正公式; ,直接计算概率。 连续性校正仅用于 的四格表资料,当 时,一 般不作校正。

10525 例 7-2 某医师欲比较胞磷胆碱与 神经节苷酯治疗脑血管疾病的疗效, 将 78 例脑血管疾病患者随机分为两组, 结果见表 7-2 。问两种药物治疗脑血管 疾病的有效率是否相等?

10526 表 7-2 两种药物治疗脑血管疾病有效率的比较

10527 本例 ,故用四格表 资料 检验的校正公式 , 查 界值表得 。按 检验水准不拒绝 ,尚不能认为两 种药物治疗脑血管疾病的有效率不等。

10528 本资料若不校正时, 结论与之相反。

10529 第二节 配对四格表资料的 检验

10530 与计量资料推断两总体均数是否 有差别有成组设计和配对设计一样, 计数资料推断两个总体率(构成比) 是否有差别也有成组设计和配对设计, 即四格表资料和配对四格表资料。

10531 例 7-3 某实验室分别用乳胶凝集 法和免疫荧光法对 58 名可疑系统红斑 狼疮患者血清中抗核抗体进行测定, 结果见表 7-3 。问两种方法的检测结果 有无差别?

10532 表 7-3 两种方法的检测结果

10533 上述配对设计实验中,就每个对子而 言,两种处理的结果不外乎有四种可能 : ①两种检测方法皆为阳性数 (a) ; ②两种检测方法皆为阴性数 (d) ; ③免疫荧光法为阳性,乳胶凝集法为 阴性数 (b) ; ④乳胶凝集法为阳性,免疫荧光法为 阴性数 (c) 。

10534 其中, a, d 为两法观察结果一致的两种情况, b, c 为两法观察结果不一致的两种情况 。 检验统计量为

10535 注意: 本法一般用于样本含量不太大的资料。因 为它仅考虑了两法结果不一致的两种情况 (b, c) , 而未考虑样本含量 n 和两法结果一致的两种情况 (a, d) 。所以,当 n 很大且 a 与 d 的数值很大(即 两法的一致率较高), b 与 c 的数值相对较小时, 即便是检验结果有统计学意义,其实际意义往 往也不大。

10536 检验步骤:

10537 第三节 四格表资料的 Fisher 确切概率法

10538 条件: 理论依据: 超几何分布 (非 检验 的范畴 )

10539 例 7-4 某医师为研究乙肝免疫球蛋 白预防胎儿宫内感染 HBV 的效果,将 33 例 HBsAg 阳性孕妇随机分为预防注射组 和非预防组,结果见表 7-4 。问两组新生 儿的 HBV 总体感染率有无差别?

10540 表 7-4 两组新生儿 HBV 感染率的比较

10541 一、基本思想 在四格表周边合计数固定不变的条 件下,计算表内 4 个实际频数变动时的 各种组合之概率 ;再按检验假设用 单侧或双侧的累计概率 ,依据所取 的检验水准 做出推断。

.各组合概率 P i 的计算 在四格表周边合计数 不变的条件下,表内 4 个实际频数 a,b,c,d 变 动的组合数共有 “ 周边合计中最小数 +1” 个。 如例 7-4 ,表内 4 个实际频数变动的组合数共 有 9+1=10 个,依次为:

10543 各组合的概率 P i 服从超几何分布,其和为 1 。 计算公式为 !为阶乘符号

.累计概率的计算 ( 单、双侧检验不同 )

10545

10546

10547 二、检验步骤( )

10548

10549 表 7-5 例 7-4 的 Fisher 确切概率法计算表

10550 例 7-5 某单位研究胆囊腺癌、腺瘤 的 P 53 基因表达,对同期手术切除的胆 囊腺癌、腺瘤标本各 10 份,用免疫组化 法检测 P 53 基因,资料见表 7-6 。问胆囊 腺癌和胆囊腺瘤的 P 53 基因表达阳性率 有无差别 ?

10551 表 7-6 胆囊腺癌与胆囊腺瘤 P53 基因表达阳性率的比较

10552 本例 a+b+c+d=10 ,由表 7-7 可看出,四格表内 各种组合以 i=4 和 i=5 的组合为中心呈对称分布。 表 7-7 例 7-5 的 Fisher 确切概率法计算表 * 为现有样本

10553 ( 1 )计算现有样本的 D* 和 P* 及各组合下四格表的 D i 。 本例 D*=50 , P*= 。 ( 2 )计算满足 D i ≥ 50 条件的各组合下四格表的概率 P i 。 ( 3 )计算同时满足 D i ≥50 和 P i ≤P* 条件的四格表的累 计概率。本例为 P 7 和 P 8 , ( 4 )计算双侧累计概率 P 。 P > 0.05 ,按 α=0.05 检验水准不拒绝 H 0 ,尚不能认 为胆囊腺癌与胆囊腺瘤的 P 53 基因表达阳性率不等。

10554 注意:

10555 第四节 行 × 列表资料的 检验

10556 行 × 列表资料 ① 多个样本率比较时,有 R 行 2 列,称为 R ×2 表; ② 两个样本的构成比比较时,有 2 行 C 列,称 2×C 表; ③ 多个样本的构成比比较,以及双向无序分类资料 关联性检验时,有行列,称为 R ×C 表。

10557 检验统计量

10558 一、多个样本率的比较

10559 例 7-6 某医师研究物理疗法、药物治疗和外用 膏药三种疗法治疗周围性面神经麻痹的疗效,资料 见表 7-8 。问三种疗法的有效率有无差别? 表 7-8 三种疗法有效率的比较

10560 检验步骤:

10561 二、样本构成比的比较

10562 例 7-7 某医师在研究血管紧张素 I 转化酶 (ACE) 基 因 I/D 多态(分 3 型)与 2 型糖尿病肾病 (DN) 的关系 时,将 249 例 2 型糖尿病患者按有无糖尿病肾病分为 两组,资料见表 7-9 。问两组 2 型糖尿病患者的 ACE 基因型总体分布有无差别? 表 7-9 DN 组与无 DN 组 2 型糖尿病患者 ACE 基因型分布的比较

10563 检验步骤

10564 三、双向无序分类资料的关联性检验 表中两个分类变量皆为无序 分类变量的行 列表资料,又称为双向 无序 表资料。

10565 注意 : 双向无序分类资料为两个或 多个样本,做差别检验(例 7-7 );若 为单样本,做关联性检验。

10566 例 7-8 测得某地 5801 人的 ABO 血型和 MN 血型结 果如表 7-10 ,问两种血型系统之间是否有关联? 表 7-10 某地 5801 人的血型 (单样本,做关联性检验)

10567 表 7-10 资料,可用行 × 列表资料 检验来推 断两个分类变量之间有无关系(或关联);若有 关系,可计算 Pearson 列联系数 C 进一步分析关系 的密切程度: 列联系数 C 取值范围在 0 ~ 1 之间。 0 表示完 全独立; 1 表示完全相关;愈接近于 0 ,关系愈不 密切;愈接近于 1 ,关系愈密切。

10568 检验步骤

10569 由于列联系数 C= ,数值较小,故认为两 种血型系统间虽然有关联性,但关系不太密切。

10570 四、行 × 列表资料 检验的 注意事项

. 行列表中的 各格 T ≥ 1 ,并且 1 ≤ T < 5 的格子数不宜超过 1/5 格子总数,否则可 能产生偏性。处理方法有三种:  增大样本含量以达到增大理论频数的 目的,属首选方法,只是有些研究无法 增大样本含量,如同一批号试剂已用完 等。

10572  根据专业知识,删去理论频数太小的行或列, 或将理论频数太小的行或列与性质相近的邻 行或邻列合并。这样做会损失信息及损害样 本的随机性。 注意 :不同年龄组可以合并,但不同血型就 不能合并。  改用双向无序 R×C 表的 Fisher 确切概率法 (可用 SAS 软件实现)。

10573

10574

10575 第五节 多个样本率间的多重比较

10576

10577 分割法

10578 一、基本思想 因分析目的不同, k 个样本率两两比较的次数不同,故重 新规定的检验水准的估计方法亦不同。通常有两种情况:

10579

10580

10581

10582 二、 多个实验组间的两两比较

10583 例 7-9 对例 7-6 中表 7-8 的资料进行 两两比较,以推断是否任两种疗法治疗 周围性面神经麻痹的有效率均有差别?

10584 检验步骤 本例为 3 个实验组间的两两比较

10585 表 7-12 三种疗法有效率的两两比较

10586

10587 三、各实验组与同一个对照组的比较

10588 例 7-10 以表 7-8 资料中的药物治疗组为对 照组,物理疗法组与外用膏药组为试验组,试 分析两试验组与对照组的总体有效率有无差别? 本例为各实验组与同一对照组的比较

10589

10590

10591 第七节 频数分布拟合优度的 检验

10592 医学研究实践中,常需推断某现象频数分 布是否符合某一理论分布。如正态性检验就是 推断某资料是否符合正态分布的一种检验方法, 但只适用于正态分布。 Pearson 值能反映实际频数和理论频数的 吻合程度,故 检验可用于推断频数分布的拟 合优度,且应用广泛。如正态分布,二项分布, Poisson 分布,负二项分布等 。

10593 例 7-12 观察某克山病区克山病患者 的空间分布情况,调查者将该地区划分 为 279 个取样单位,统计各取样单位历年 累计病例数,资料见表 7-15 的第 (1) 、 (2) 栏,问此资料是否服从 Poisson 分布?

10594 表 7-15 Poisson 分布的拟合与检验 * : X≥8 的概率:

10595

10596

10597

练习题 P156 一、最佳选择题 全做 三、计算分析题 第 3 、 5 、 7 、 10 题