描述性研究 descriptive study
本章学习要点 1.描述性研究的概念及常用研究方法。 2.现况研究的概念、特点、种类。 3.抽样调查的抽样方法。 4.调查表的编制、调查变量的规定。 5.现况研究中常见的偏倚及其控制。 6.生态学研究的概念及特点。
描述性研究常用的方法有: 现况调查;生态学研究 ;纵向研究; 爆发与流行调查;筛检。 描述性研究是观察性流行病学研究中的一种类型, 主要用于描述疾病或者某种特征在时间、地点、人群中的分布以及发生、发展的规律。 描述性研究常用的方法有: 现况调查;生态学研究 ;纵向研究; 爆发与流行调查;筛检。
第一节 现况研究 一、定义 现况研究又称为横断面研究(cross-sectional study),是研究特定时点或时期和特定范围内人群中的有关变量(因素)与疾病或健康状况的关系。即在某一时点或短时间内,对一个特定人群疾病(或某些特征)及有关因素进行的调查。
二、现况研究的目的 1)掌握目标群体中疾病的患病率及其分布 状态。 2)提供病因线索。 3)利用普查或筛检可实现疾病的二级预防。 4)确定高危人群 5)进行疾病监测、预防接种效果及其他资 料质量的评价。
三、现况研究的特点与种类 (一)特点 1.一般不设对照组 2.关心的是某一特定时点或短时期内某一群体中暴露和疾病的状况或联系。 3.不能确定暴露与疾病的因果关系。 4.对固定的暴露因素可作因果推论。 5.在现在暴露水平与既往变化不大或存在良好相关性;或已知其变化规律时,可用现在的暴露状态来代替或估计过去的暴露状态。 6.定期重复可获得发病率资料
(二)现况研究的种类 在特定时间、对特定范围内的所有个体进行全面调查。 (2)普查目的: 对某些疾病早发现、早诊断、早治疗 。 1.普查(census) (1)概 念: 在特定时间、对特定范围内的所有个体进行全面调查。 (2)普查目的: 对某些疾病早发现、早诊断、早治疗 。 了解人群中疾病和健康状况的分布或 制定某生物学检验标准。
(3)普查原则: 所普查的疾病患病率不宜太低。 检测手段和方法应简易而准确 有足够的人力、物力和财力进行调查 (4)普查优缺点: 能发现人群中的全部病例。 一次调查可观察多个因素和疾病的关系,同时也是对群众的一次卫生宣教活动。 不适用于患病率很低和诊断技术复杂的疾病。 质量不易控制。
2.抽样调查(sampling survey ) 1)概念: 指从某人群总体中按一定原则抽取部分有代表性的个体(样本)进行调查,用这部分样本的调查结果推算出该人群总体某病的患病率或某些特征的情况,这是以小窥大,以局部估计总体的调查方法。
2)抽样方法: 单纯随机抽样 —— 最基本的抽样方法,将所有研究对象排列编号,利用随机数字表或抽签、计算机等抽出进入样本的号码。 分层抽样—— 用于分布不均匀的研究人群,先按不同的特征(如性别、年龄、职业等)将研究人群分为若干层,然后从每层抽取一个随机样本。要求层内变异越小越好。 “层”— 具有某种特征或共同暴露于某一因素的人群称为层。
系统抽样 —— 按照一定的顺序机械地每隔一定数量的单位抽取一个单位。 整群抽样 ——将总体分为若干群组,抽取其中部分群组作为观察单位组成样本,对被抽到的群体内的所有个体都进行调查。 多级抽样 —— 多用于大型调查,从总体中先抽取一级单元,再在抽中的一级单元中抽取范围较小的二级单元。
①对调查结果精确性的要求:精确性要求高则样本大。 3)样本大小: 样本大小的影响因素: ①对调查结果精确性的要求:精确性要求高则样本大。 ②预期的患病率:患病率高则样本小。 确定样本大小的计算: ①前人的经验 ②公式计算:
n:样本大小,S:总体标准差的估计值,P:某病现患率估计值。 (1)计量资料(均数)抽样调查样本量计算: (2)计数资料(率)抽样调查样本量计算: n:样本大小,S:总体标准差的估计值,P:某病现患率估计值。 Q=1-P;d:容许误差,d的单位与S或P一致, tα:α=0.05或0.01时的t值,t0.05=1.96,t0.01=2.58,常取d = 0.1P。α=0.05,则样本量估计公式可看作n=4S2/d2 ,或n=4PQ/(0.1P)2 = 400×Q/P 。
例1:如拟调查某地成人白细胞数量是否偏低,若抽样调查样本量至少应有多少人? 据文献,正常成人白细胞数的标准差约 1×109个/L,d = 0.1S = 0.1×109个/L, 代入公式得:
例2:需要抽样调查当地儿童蛔虫感染率,据以往经验儿童蛔虫感染率不超过30%,若规定容许误差为0.1P即3%,则样本含量至少应为多少人?
第二节 现况调查的设计与实施 一、明确调查目的和类型(本次调查要达到什么目的;普查还是抽样) 二、确定研究对象 三、确定抽样方法和样本含量
四、确定研究变量和制定调查表: 1.变量的规定 调查表所列项目就是需研究的因素。 变量可分为 疾病指标(发病、死亡), 人口学指标(性别、年龄), 相关因素(经济收入、饮食习惯、家族史等)
1)定义研究因素 概念定义——指专业上的 定义 执行定义——在概念上并不一定确切,但实际操作上可行的定义。
2)设定测量尺度 二值尺度——(0-1)变量, 列名尺度——无顺序,可分类,类与类之间界限明确。 序列尺度——有顺序,可分类,类与类之间界限不很清楚。 区间尺度——有顺序且为连续性 。
2.调查表编制 1)调查表编制注意事项 ①调查表问题的排列:先易后难,先一般后隐私 ②问句措辞要明确易懂 ③表式 “闭关式”调查表——将各种可能的答案列在调查表上由回答者选择其中一个答案。便于分类编码和资料的计算机处理 “开放式”调查表——被调查者对问题的回答不受限制。适合难于限定答案尺度的问题。 编码调查表——在每个问题的右边留出适当位置,注出标号,供编码用。适用于计算机处理资料
④应有核实被调查者回答问题是否正确的项目。多角度询问同一问题。 ⑤时间记录和调查员签名;可核查调查员的调查质量 ⑥预试 正式开始调查前应对拟好的调查表进行预试验,以确定调查表的可行性。
2)调查表的编制内容: (1)一般项目 : 为人口学资料(性别、年龄、职业等) (2)研究项目: 包括研究的疾病指标或相关因素变量 (2)研究项目: 包括研究的疾病指标或相关因素变量 调查表设计原则: 不能缺项与多项、先易后难、先一般后隐私、 多客观定量少主观感觉
五、资料收集: (1)掌握背景资料:了解该课题现有的知识水平,国内外进展。 (2)暴露测量:暴露必须有明确的定义和测量尺度。可用调查表、实验室检查、体检等手段来测量。 (3)确定收集资料的手段:可采用现场调查、信访、电话调查等。 (4)培训调查员:
六、资料分析 (1) 描述分布:对疾病发病率、患病率、死亡率等进行三间分布描述。 (1) 描述分布:对疾病发病率、患病率、死亡率等进行三间分布描述。 (2) 关联分析:可运用统计学分析、逻辑分析、专业知识的推理分析等分析影响疾病分布的因素及因素与疾病的关联性。
七、现况研究中常见的偏倚与质量控制 偏倚 —— 在流行病学研究中样本人群所测得的某变量值系统地偏离了目标人群中该变量的真实值,使研究或推论结果与真实情况之间出现了偏差。这种系统误差可以发生于研究设计、实施和分析的各个阶段,可由设计的失误、资料获取的失真、分析方法不正确或推断不符合逻辑等所引起。
(一)常见偏倚 选择偏倚 选择偏倚 无应答偏倚 幸存者偏倚等 信息偏倚 报告偏倚 回忆偏倚 测量偏倚等 混杂偏倚
二、质量控制 1)确保抽样过程的随机化原则 2)提高研究对象的依从性和受检率 3)正确选择测量工具和检测方法 4)培训好调查员,统一标准和认识 5)作好资料的复查、复核等工作 6)选择正确的统计分析方法,注意混杂因素的影响。
第三节 生态学研究 ecological study 一、定义: 以群体为观察和分析单位,通过描述不同人群中某因素的暴露状况与疾病的频率,分析该暴露因素与疾病之间的关系。
二、 基本原理: 描述某疾病或健康状况在各人群中所占的百分数或比数,以及各有关特征者在各人群中所占的百分数或比数。 从上述二类群体数据可以分析某疾病或健康状态的分布与人群中的哪个特征分布相接近,从而探索病因线索。
二、生态学研究的目的 1.提供病因线索,产生病因假设 常用于慢性病的病因学研究和环境变量与人群疾病或健康状态的关系研究。 2.评估人群干预措施的效果
二、生态学研究的种类: 1.探索性研究:观察不同群体中疾病的分布差异。 2.多群组比较研究: 比较同一时间内不同地区的 发病率及其相关因素,以探索环境与疾病的关系。 3.时间趋势研究:观察不同年龄或不同出生年代的 人群中某种状态的变动趋势与疾病的关系。 4.混合研究:将多群组比较研究与时间趋势研究结 合起来的研究方法。