调查设计.

Slides:



Advertisements
Similar presentations
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
第三节 微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出 实例 : 正方形金属薄片受热后面积的改变量.
病例对照研究 case - control study 也称回顾性研究 ( retrospective study )
第五章 病例对照研究 (Case-control study) 流行病学教研组 流行病与卫生统计学教研室.
第十四章 调查设计.
临床科研要览 赵树铭 中国人民解放军重庆血站 第三军医大学第一附属医院输血科.
预防医学系 吉林大学公共卫生学院.
第一篇 人群健康研究中的流行 病学原理与方法.
队列研究 放射医学与公共卫生学院 许锬.
病例对照研究 Case-control Study.
临床科研试验设计方法.
(Epidemiology in community health nursing)
第十二章 队列研究 邹焰.
流行病学研究中的偏倚及其控制.
现况研究.
队 列 研 究 (Cohort Study) 临床流行病学与循证医学教研室.
(cross-sectional study)
第二章 研究设计与评价.
队 列 研 究 Cohort study wn.
描述性研究 descriptive study
研究中心:河北医科大学第四医院 ***科 主要研究者:**** 申办者:********公司 CRO:********公司
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
病例对照研究 case-control study
队列研究.
抽样概述 含义:指的是从组成某个社会事物总体的所有元素、也就是所有最基本单位中,按照一定的方式选择或抽取一部分元素的过程和方法
第四章 队 列 研 究 (cohort study) 流行病学教研组 流行病与卫生统计学教研室.
第五章 病例对照研究 (case-control study)
研究设计 入门.
非实验性研究.
糖尿病流行病学.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
队 列 研 究 前瞻性研究(prospective study)、 发生率研究(incidence study)、
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
第四章 队列研究 (cohort study)
预 防 医 学 Preventive Medicine 预防医学教研室
管理信息结构SMI.
病因探索 (Quest the cause of disease)
第四章 抽样设计 本章主要内容: 抽样调查概述 随机抽样技术 非随机抽样技术 抽样误差与样本量.
第十章 方差分析.
预 防 医 学 Preventive Medicine 预防医学教研室
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习3 主讲人 陶育纯 医学统计学方法 实习3 主讲人 陶育纯 流行病与卫生统计学教研室
第七章 参数估计 7.3 参数的区间估计.
医学统计学方法 实习3 主讲人 陶育纯 医学统计学方法 实习3 主讲人 陶育纯
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
项目名称:XXXXXXXXXXXX 研究科室:XXX 主要研究者:XXX 日期:xxxx年XX月XX日.
第七章 抽樣與抽樣分配.
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
Review 統 計 方 法 的 順 序 確定目的 蒐集資料 整理資料 分析資料 推論資料 (變量,對象) (方法:普查,抽樣)
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
第4章 护理研究设计 主讲教师:罗健.
用计算器开方.
6.4 你有信心吗?.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
Biases and Their Control
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
第四章 描述性研究 descriptive study 卫生系 陈鹏
第九章 偏倚及其控制 Biases and Their Control
队列研究 (cohort study).
基于列存储的RDF数据管理 朱敏
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
Presentation transcript:

调查设计

调 查(survey) 概念:研究者未作任何干预措施而对研究对象所作的调查。 特点:研究者不能人为对研究对象施加干预措施(或随机分组)和控制某些影响因素,只是客观记录(观察)某因素的存在与否对疾病的危害或转归情况。

一、调查设计的内容 1、研究目的 总目标 具体目标 具体指标

一、调查设计的内容 2、调查方法 (1) 按调查的目的:描述性研究和分析性研究; (2) 按资料的性质:定性调查和定量调查; (3) 按资料的来源:现场调查和利用现有资料两种;

一、调查设计的内容 2、调查方法 (4) 按调查的涉及面:普查和抽样调查; 普查(census): 对某总体中全部个体进行调查。 (4)  按调查的涉及面:普查和抽样调查; 普查(census): 对某总体中全部个体进行调查。 优点:取得总体参数,没有抽样误差;全面了解总体分布特征。 缺点:工作量大,费时费力;调查质量难以保证,系统误差大。 抽样调查(sampling study):从总体中随机抽取部分样本的调查。 优点:费用少,速度快,正确性高。 缺点:调查设计、实施及资料分析较复杂。

一、调查设计的内容 2、调查方法 (5) 按调查的内容发生的时间:横断面调查和纵向调查; (5)  按调查的内容发生的时间:横断面调查和纵向调查; (6)  按调查方式:面对面调查和非面对面调查(信访、电话采访等)。 (7)  抽样调查可分为概率抽样和非概率抽样调查; 概率抽样又可分为简单随机抽样、系统抽样、分层随机抽样和整群抽样; 非概率抽样又可分为方便抽样、配额抽样、滚雪球抽样等。

一、调查设计的内容 3、 调查对象 明确、严格执行方案、入选标准、排除标准。 4、 调查指标和变量 主观指标和客观指标; 3、  调查对象 明确、严格执行方案、入选标准、排除标准。 4、  调查指标和变量 主观指标和客观指标; 计数、计量、等级指标;

一、调查设计的内容 5、 调查工具和调查表 调查表—软件Epi data、标准化 5、  调查工具和调查表 调查表—软件Epi data、标准化 问卷(questionnaire): 分为开放型和封闭型两类问题。 (1)  开放型:主要是问答题和填充题,问卷中不给可能答案的提示。 适用于探索性调查,不熟知的事物,敏感问题,调查意见和态度,适用于设计者不了解答案或答案难于一一列出。 优点:有原始语言,可更生动; 缺点:分析困难,不便汇总,而且在调查中可能遗漏信息。 (2)   封闭型:主要是选择题和是非题。 主要适用于简单问题,要求各个供选择的答案之间互斥。 优点:答案标准化,易记录,易分析,拒答率低,汇总方便; 缺点:乏味,所提供的答案可能有诱导偏性,容易随便选择答案,容易圈错。

一、调查设计的内容 6、  调查员 7、  样本含量:计算方法略。 8、 伦理道德:隐私、敏感问题。匿名和保密。

二、现况调查 现况调查:指对某地某事的当前情况进行调查, 也称横断面调查(cross-sectional study) 或描述性调查(descriptive study)。

二、现况调查 抽样方法 1、概率抽样(probability sampling) 就是在抽样中必须使该总体中的每一个个体都有已知的或可计算的和非零的概率被抽样抽中。 2、非概率抽样(non-probability sampling) 是指各个个体被抽样抽中的概率是未知的和无法计算的。是探索性的调查方法。

二、现况调查--概率抽样 (1)简单随机抽样(simple random sampling):在某个总体中以完全随机的方法抽取一部分个体组成样本。 优点:简单,计算抽样误差方法-一般的率和均数的标准误的计算方法。 缺点:操作困难-随机编号,个体分散。 (2)系统抽样(systematic sampling):指随机地每间隔若干个个体抽取一个个体的抽样方法。 优点:简便易行,容易得到一个按比例分配的样本,抽样误差小。 缺点:在某些特殊情况下可能有偏性。

二、现况调查--概率抽样 (3)分层抽样(stratified sampling):就是把总体分成几层,然后从每一层中作随机抽样的方法。分层的原则是层间差别越大越好,层内差别越小越好。 (4)整群抽样(cluster sampling):是以个体的聚集单位为抽样框架,从中随机抽取一部分聚集单位。 优点:抽样和调查都很方便,易于组织,容易控制质量,省时、省力和省钱。 缺点:抽样误差较大,特别是群间差别较大时。

二、现况调查—非概率抽样 (1) 配额抽样(quota sampling)是一种实用的非概率抽样方法。就是要求样本中个体的构成在指定的几个特征方面的(分配额度)比例完全与总体一样,如某地少数民族占30%,则抽样后样本少数民族亦占30%。 (2)“滚雪球”(Snowballing) 抽样和识别(Judgement)抽样:是非概率的抽样方法,当缺少目标总体中全部个体的名单,无法构成抽样框架时采用。 “滚雪球”抽样:将相识的人引入样本,使样本象滚雪球似的逐渐扩大。 识别抽样:是指研究者尽可能找到和识别所要调查的个体。

三、队列研究 (一)概念 队列研究(cohort study)是一种“由因寻果”的纵向前瞻性观察研究。 根据观察开始时有无暴露史,研究者将没有出现研究疾病或其它结局的研究人群分为暴露人群和非暴露人群,并随访观察一定时期,旨在比较两组人群的疾病“发病”率有无差异,从而得出暴露与结局有无关联的推断。

三、队列研究 (二)类型 (1)前瞻性队列研究 (2)回顾性队列研究 前瞻性队列研究(prospective cohort study),其观察起点是“现在”, 研究人群将被随访观察一定时期,从而得到观察结局。 特点是结果一定没有发生。 优点是研究者能按自己的意愿定义研究因素、直接获取资料甚至包括混杂因素的信息。 (2)回顾性队列研究 回顾性队列研究(retrospective cohort study),其观察“起点”是过去,研究人群根椐过去某时点的暴露与否分组, 从已有的记录中由那时追溯至“今”,从而得到观察结局。 特点是观察开始时暴露与结局均已出现。 优点为节省人力、物力与时间。 缺点是研究者在确定暴露因素、研究人群、研究结局时受到已有记录的限制,对混杂因素亦无法实施控制,易发生偏倚。

三、队列研究 优点 (三)优缺点 1、研究者可直接观察或测量研究因素和结局,所以资料翔实。 2、因结局发生在后,故对暴露资料的收集是无偏倚的;在前瞻性队列研究中,亦可收集已知混杂因素的信息。 3、可直接计算发病率、相对危险度等度量疾病与病因关联的指标。 4、由于病因出现在前,疾病发生在后,因果现象发生的时间顺序合理,可证实病因假说。当暴露为稀有事件时,研究结论更为可靠。 5、可获得多种结局资料。

三、队列研究 缺点 (三)优缺点 1.研究耗费时间、人力、经费。 2.当观察结局为非常见事件(如某病发病率很低)时,需要的样本量相当大, 实际工作中不易做到。 3.容易产生的几种偏倚:研究常常需要追踪随访较长一段时间,研究对象不易保持依从性;因得知研究目的而中途改变态度;因观察时间长而失访率增加。 4.在观察开始时,暴露已被严格定义,在观察期研究者不易对暴露重新定义或增加有意义的新暴露因素。

三、队列研究 (四)设计与实施的有关问题 研究对象的选择 1.暴露人群的选择 分为特殊暴露人群和一般暴露人群 1.暴露人群的选择 分为特殊暴露人群和一般暴露人群 2.非暴露人群的选择 做为对照,非暴露人群除在观察开始前没有受到暴露影响外,其它特征应与暴露人群尽量一致。

三、队列研究 (五)样本含量估计与调整 估计样本含量需要的4个条件: ①非暴露人群所研究疾病的发病率po; ②暴露人群所研究疾病的发病率pe; ③第一类错误的概率α; ④把握度1-β。

三、队列研究 (五)样本含量估计与调整 样本含量的估计公式为 式中: ne为估计的暴露组人数 ,n0为估计的非暴露组人数,pe为已知的暴露人群所研究疾病发病率,p0为已知的非暴露人群所研究疾病发病率, ,uα与uβ为给定的α与β对应的标准正态分布单侧界值。

三、队列研究 (五)样本含量估计与调整

三、队列研究 样本量调整 考虑观察期的失访与拒绝等因素造成样本量的减少,应给估计的样本量做必要的增加。加多少,取决于失访率的大小。 如果苯接触工人和一般人群的5年失访率估计为10%,则ne =no=16 640×1.1=18 304(人)。在此队列研究中, 各组需实际观察18 304人。

三、队列研究 (六)资料分析 1、相对危险度(relative risk, RR) 为暴露组发病(或死亡)率pe 与非暴露组发病(或死亡)率po 之比。 RR=1表示研究因素与发病(或死亡)无关;RR>1表示研究因素为危险因素; RR<1表示研究因素为保护因素。

RR 的Mantel-Haenszel 2检验 P<0.01

RR的95%可信区间

三、队列研究 (六)资料分析 2、归因危险度(attributable risk, AR) AR = pe - po

四、病例对照研究 (一)概念 病例对照研究(case control study)是一种“由果推因”的回顾性观察性研究,故又称回顾性研究(retrospective study)。 根据有无研究疾病或其它结局,将研究人群分为病例组(cases)和对照组(controls),追溯过去某些暴露情况,比较两组暴露水平有无差异,从而得出结局与暴露有无关联的推断。

四、病例对照研究研究 (二)优缺点 优点 1.与其它研究比,病例对照研究相对节省时间、人力、经费,易组织实施。 2.适于结局为稀有事件(如恶性肿瘤)的病因研究,当暴露因素较常见时,研究结论更为可靠。 3.适于 “潜伏期”较长疾病的研究。 4.可获得与结局有关的多个病因因素的资料,往往是探索不明因素的有效途径。 5.可计算比数比,以反映疾病与暴露的关联程度。当疾病发病率很低时,比数比与相对危险度相当近似。

四、病例对照研究研究 (二)优缺点 缺点 1.不适于研究人群中暴露比例很低的因素,因这需要的样本量相当大,实际工作中不易做到。 2.不能直接计算发病率。 3.有时难以判断暴露与疾病之间的时间先后关系。 4.易发生对照、病例的选择偏倚(selection bias);确定暴露的测量偏倚(measurement bias),包括回忆偏倚(recall bias)、信息偏倚(information bias)、观察者偏倚(observer bias)等等;混杂因素引起的影响“因果关系”推断的混杂偏倚(confounding bias)。 5.获得的结局是单一的。

四、病例对照研究研究 (三)设计与实施的有关问题 病例的选择 1.疾病的定义:国际或国内统一的疾病定义和诊断标准,便于比较。具有同质性。 2.病例的来源: 两个途径: 医院住院、门诊病历等: 优点: 易组织、花费少。 社区疾病监测登记、普查或抽查的人群资料等: 优点: 选择偏倚小、可得到疾病在人群中的特征,但费用高。

四、病例对照研究研究 (三)设计与实施的有关问题 对照的选择 最好是全人口的无偏随机样本、或病例本身来自的那个源人口中全体非患该病的人群的随机样本。 对照的来源:医院、社区、有关人员 (1)医院对照: 优点:易获样本,易做诊断;回忆偏倚小;与病例组有相似的选择过程;易配合;费用低。 缺点:这种对照也是病人,对医院外非所研究疾病(含健康)人群代表性差,住院病人的一些生活特征往往不同于一般人群。

四、病例对照研究研究 (三)设计与实施的有关问题 对照的来源: (2)社区人口对照:对照与病例均来自社区,且对照是随机抽取得。但不足之处是抽样复杂,费用高。 (3)病例的同事、朋友、亲戚、同胞、邻居做对照:要注意的是如果过分强调对照与病例来源的相似性,使得病例与对照在许多方面相同,甚至有潜在的相同暴露之嫌,可能会引起对暴露作用的低估。这种现象叫匹配过度(over-matching)。

四、病例对照研究研究 (四)样本含量估计与调整 估计样本含量需要的4个条件: ①研究因素引起的RR 或它的估计值比数比(odds ratio,OR)或研究因素在病例人群的暴露率p1; ②该因素在对照人群的暴露率p2; ③第一类错误的概率α; ④把握度1-β。

四、病例对照研究研究 (四)样本含量估计与调整 样本含量的估计公式为 式中,n1为估计的病例组人数,n2为估计的对照组人数,p1为已知的病例组暴露率,p2为已知的对照组暴露率, ,uα与uβ 是给定的α与β对应的标准正态分布单侧界值。

四、病例对照研究研究 (四)样本含量估计与调整

四、病例对照研究研究 样本量调整 可增加5%的观察例数,即 n1=n2=274×1.05=288(人) 在此队列研究中, 各组需实际观察288人。

四、病例对照研究研究 (五)资料分析 1、比数比(odds ratio, OR) 用来反映病例与对照在暴露上的差异,借以建立疾病与暴露因素之间的联系。当发病率很低(如小于1%)时,OR被认为与RR 很接近。OR值越大,反映疾病与暴露因素的关联越强。 OR =1表示疾病与暴露无关; OR>1表示暴露为危险因素; OR<1表示暴露为保护因素。

OR值(odds ratio)的计算和含义 OR含义:有暴露(风险)因素时病例与对照的优势比(odds1)与无暴露因素的优势比(odds0)的比值。 或:OR:病例组中有某暴露因素比例是对照组中有该因素比例的比值或优势比

OR 的Mantel-Haenszel 2检验 P<0.01

OR的95%可信区间

四、病例对照研究研究 (五)资料分析 2、归因危险度百分比 可用OR替代RR来估计归因危险度百分比AR% 。 即86%的儿童智力低下与缺铁性贫血有关。

统计人物 统计学比小说更有趣,并且喜欢啃这块“硬骨头”。尽管她为委员会的事情忙得精疲力竭,但一看到长长的、一列列的统计数据,就会高兴地崩跳起来。 弗劳伦斯•南丁格尔 (1820.5.12--1910.8.13)

南丁格尔 实施了统一的医院统计计划。制定了标准的疾病名称表,起草了医院统计报表的标准格式。 制定的医院统计的标准表格被许多大医院采用。这些医院通过决议,共同采用统一的病人入院登记表格,每年公布的统计数字也尽可能地采用南丁格尔制定的标准表格。