第十四章 调查设计
调查研究概况 调查研究的概念、特点与适用范围 医学科学研究: 实验研究(experimental research) 调查研究(survey research) 实地观察研究(field study) 文献研究(document study)
调查研究概况 典型例子。 例14-1 Doll与Hill的吸烟与肺癌关系研究。 方法:CASE CONTROL STUDY COHORT STUDY 例14-2 反应停事件
调查研究概况 调查研究分类 从调查对象分 全面调查(普查) (overall survey) 抽样调查(sampling survey) 典型调查 (typical survey)
调查研究概况 从调查时间划分 1.病例-对照研究 (case-control study) 2.队列研究(cohort study)或前瞻性调查(prospective survey) 从抽取样本的方式分 概率抽样调查(简单随机抽样、系统抽样、分层随机抽样、整群抽样), 非概率抽样调查(偶遇抽样、判断抽样、定额抽样、雪球抽样等)
调查设计 调查设计的步骤与基本内容 1、确定研究题目 ▲题意(问题)的产生: 背景材料的来源:个人经验积累; 向有关专家请教; 文献检索。
调查设计 文献检索要点: ★有助于认识本课题的重要性; ★了解有关的既往研究工作情况; ★了解有关研究现况; ★寻找可借鉴的研究方法; ★注意有关的不同见解与争论。
调查设计 ▲题目的选定: 来源:国家立题; 个人立题。 原则:科学性原则:以科学理论为指导,符合客观规律,设计科学;创新性原则:包括探索和创造两个连续的过程,创新就是要选择前人没有解决或没有完全解决的问题;先进性原则:先进性是相对的,有国际先进,也有国内先进,更重要的是结合实际条件选择适合的先进技术;可行性原则:是指研究课题的主要技术指标实现的可能性。包括人财物的支撑条件及工作基础;意义性原则:是指课题本身的科学意义或科学价值。潜在的社会效益与经济效益。
调查设计 2、明确研究目的和意义 在掌握充分的背景材料的基础上,提出: 本课题的主要问题; 本课题的辅助问题。 一项研究的问题不宜涉及太多。 一般在前言的部分进行表述。
调查设计 3、确定研究的主要指标 研究变量:定量、分类(等级)。 分析指标:均数、标准差、率、构成比、比例比(OR、RR)、DALYs、QALYs等。 要求: 客观性强 灵敏度高 精确性好 定量指标,少用定性指标
调查设计 4、明确研究范围 总体范围:地域、时间、人群; 纳入标准 剔除标准
调查设计 5、确定研究方法 不同的研究目的选择不同的研究方法: ★描述疾病或健康的特征:抽查、病例报告 ★探讨疾病的危险因素:实验研究、队列研究、病例对照研究 ★考核防治效果:实验研究(临床试验、社区试验) 要注意设计方法的技术路线图。
调查设计 6、估计样本含量 确定样本估计的条件: ★显著性水平(α水平); ★把握度(1-β); ★其他条件:δ、率差、OR、RR。 估计方法: 经验法 查表法 公式计算法
调查设计 7、常用的抽样方法 1)单纯随机抽样 (simple random sampling) 指保证总体中的每一个个体都有同等的机会被抽出来作为样本(中奖)的抽样方法 方法是:先将100个学生编为0-99号,然后用附表17的随机数字表,从任意一个随机数字开始(比如从第一行第一列的两位数22开始),横向(也可以纵向)依次读取10个随机数字(每个都是两位数,有相同者跳过):22、17、68、65、81、68、95、23、92、35。于是编号为这10个者被抽中。
调查设计 2)系统抽样 (systematic sampling) 又称机械抽样,即先将总体的全部个体按与研究现象无关的特征排序编号,依次每隔若干号码抽取一个个体组成样本 3)分层抽样(stratified sampling) 又称分类抽样或类型抽样,先将总体全部个体按某种特征分成若干层,再从每一层内随机抽取一定数量的个体合起来组成样本。
调查设计 方式: 等比例分配(proportional allocation): 等比例分配就是各层中抽取的比例与该层在总体中的比例相同 与非等比例分配(non-proportional allocation)。
调查设计 4)整群抽样 先将总体分成若干群体,形成一个抽样框;从中随机抽取几个群体组成样本;对抽中群体的全部个体进行调查,称为整群抽样(cluster sampling)。
简单直观,是其它抽样的基础;均数(或比率)及标准误计算简便。 易理解,简便易行; 易得到按比例分配的样本;样本在总体中的分布较均匀。 单纯随机抽样 系统抽样 整群抽样 分层抽样 优点 简单直观,是其它抽样的基础;均数(或比率)及标准误计算简便。 易理解,简便易行; 易得到按比例分配的样本;样本在总体中的分布较均匀。 便于组织;节省经费;容易控制调查质量。 减少抽样误差;便于 对不同层采用不同抽样方法;可对不同层独立进行分析。 缺点 例数较多时,编号麻烦,实际工作中难以办到; 当总体变异大时,代表性不如分层抽样;样本分散,难以组织调查。 观察单位按顺序有周期趋势或单调递增(减)时易产生偏差。 样本例数一定时, 抽样误差大于单纯随机抽样(因样本未广泛散布于总体中)。 分层变量选择不当, 层内变异较大,层间均数相近,分层抽样就失去意义。 适用 范围 是其它抽样方法的基础,主要用于总体不太大的情形。 主要用于按抽样顺序个体随机分布的情形。 主要用于群间差异较小的情形。 主要用于层间差异较大的对象。
调查设计 8、调查表设计与资料收集方式 拟制调查表的基本原则: ▲项目的表达语言要精练、准确; ▲需要的项目一项都不少,不需要的项目一项都不列; ▲项目的编排要有逻辑性,先易后难,隐私的问题列于后面; ▲尽量用客观、定量的研究指标。
调查设计 调查表的格式:一览表、单一(个案)表。 调查项目: 一般(核对)项目:姓名、性别、年龄、职业、婚姻状况、民族、文化程度、住址、工作单位等; 研究(分析)项目:主要包括本研究突出体现的研究变量。
调查设计 调查项目的答案: 闭锁式:有多个固定答案可供选择; 开放式:未限定答案,可自由回答。 调查项目的计算机编码: 将答案给予适当的代码; 注意缺失值的编码。
方法 优点 缺点 主要应用范围 个别发送法 能够得到较有代表性的样本。 费时、费力、费钱;实施困难。 专题调查。 集中填答法 能够得到较有代表性的样本;能双向交流,获得更多信息;能保证质量和回收率。 一些调查对象难以集中;有“团体压力”和“相互影响”。 专题调查、 基线调查。 邮寄调查法 省时、省力、省钱,是最便宜的调查;容易组织实施;调查区域广;保密性强;无调查员偏差。 调查对象的姓名和详细地址往往不易得到;问卷的回收率较低,难保证样本的代表性;调查质量难控制。 小规模调查、 只需要简单了解状况的调查。 电话询问法 简便易行;省时、省力、省钱;可能询问到不易接触的调查对象;某些问题可能得到更坦诚的回答。 抽样总体与目标总体可能不一致;调查的内容难以深入。 热点问题或突发性问题的快速调查、 某些难以访问的特殊群体的调查。 当面访问法 调查的回答率较高;调查对象的适用范围广;能够得到较有代表性的样本;能双向交流,获得更多信息;能及时反馈补充,得到较高质量的数据。 费时、费力、费钱;匿名性差;访问员与被访者之间的互动有时会影响调查结果;对调查员的要求高。 被调查者不能自己填写(如文盲、伤残)的专题研究。
调查设计 资料收集的方式: 直接询问法:到现场直接观察、测量; 电话访问法:按调查表的内容进行电话询问; 信函调查法:将调查表邮寄给调查对象,并收回;
调查设计 调查表的制定与考评 调查表的制定 调查表的构成 1.调查表的标题 2.调查表说明 3.被访者基本情况(人口学特征, 即背景资料, 如性别、年龄、民族、家庭人口、婚姻状况、文化程度、职业 )
调查设计 4.调查主要内容 5.编码 6.作业证明的记载(姓名、访问日期、时间) 调查表制定步骤 1.设立研究工作组 2.提出调查项目,形成项目池 3.项目筛选
调查设计 4.确定每个项目的提问形式和类型 (1)直接性问答题、间接性问答题和假设性问答题。 (2)开放性问答题和封闭性问答题 5.确定每个项目的回答选项 6.预调查及初步考评 7. 修改完善
调查设计 调查表制定中应注意的问题 1.调查表说明要简单明了,打动人心 2.避免用不确切的词 3.避免提断定性问题 4.避免引导性提问 5.避免令被访者难堪和禁忌的敏感问题 6. 避免提笼统、抽象或不确切的问题
调查设计 7. 避免一问多答的问题 8.注意提问的顺序 (1)被访者容易回答且较为关心的内容先提问,专业性强的具体细节问题和敏感性问题应尽量放在后面; (2)提问的内容应从简单逐步向复杂深化,对相关联的内容应进行系统的整理,使被访者不断增加兴趣; (3)封闭性问题放在前面,开放性问题放在后面。
调查设计 调查表的考评 (一)效度考评 效度(validity) 即调查表的有效性和正确性, 亦即准确度(accuracy)。意指调查表确实测定了它打算测定的特征(而不是其它特征)以及测定的程度。一个调查表的效度越高,说明调查表的结果越能显示其所测对象的真正特征
调查设计 1.内容效度 (content validity)调查表是否包含足够的条目来反映所测内容 经验判断 2.结构效度 (construct validity) 也称构思效度或特征效度(trait validity) 理论构想和框架 因子分析 3.标准关联效度 (criterion- related validity) 也称效标效度(criterion validity)是调查表得分与某种外部标准(效标)间的关联程度,常用测量得分与效度标准之间的相关系数表示
调查设计 (二)信度考评 信度(reliability),指调查表测量结果的可靠性、稳定性和一致性,亦即精确度(precision)。一般认为信度反映测量中偶然误差引起的变异程度。 1.重测信度 (test-retest reliability) 是在一定时间间隔中运用同一调查表作重复测量所得的信度系数。也称为稳定系数,因为它说明了使用同一测量工具重复测量时个体分数的稳定性。 重测信度用两次测定间的相关系数来表示。
调查设计 2.分半信度: 分半信度(split-half reliability)是在一次测量后将条目分为等价的两部分,分别计算两部分的得分,并以其相关系数作为信度指标。这实际上考察的是指标的一致性,但因测量同一特征的指标间关系密切,故具有一致性则说明结果可信。 两部分之间的相关系数()只表明一半条目的信度,需用Spearman-Brown公式来确定整个调查表的信度(r):
调查设计 3.内部一致性信度 (internal consistent reliability) 是目前比较流行的信度评价方法,是分半信度的推广。它无需将条目分为两个部分,而是以条目之间的联系程度对信度作出估计。内部一致性信度主要有Kuder-Richardson公式和克朗巴赫α系数(Cronbach's alpha) 。前者是后者的特殊情况,仅适用于两分类条目。这里仅介绍克朗巴赫α系数:
调查设计 K为整个调查表的条目数, 为第i个条目得分的方差,为整个调查表得分的方差。
调查设计 (三)可接受性 可接受性( acceptability )是指被测定者对调查表的接受程度。 评价:接受率(调查表回收率)、调查表合格率(事先确定合格的标准,比如所有条目均有回答者)和填表所需平均时间。 调查表的可接受性主要取决于以下几个因素: 1.调查表具有简单性(simplicity),条目少且容易理解。 2.调查表内容为被测者所熟悉,认为有意义(与其生活及健康相关)。 3.调查表容易填写,看完简短的“填表说明”后即知如何完成。 4.完成调查表所需的时间较少。一般认为5-30分钟较适宜。
调查设计 考评中的几个问题 1.考评的对象与范畴 2.信度与效度的关系 3.考评标准
调查设计 9、资料的整理与统计分析 问卷接收(questionnaire receiving) 整理资料与处理数据: 问卷接收(questionnaire receiving) 问卷核查(questionnaire checking):检查资料的完整性、准确性 数据编码 数据录入:建立数据库: FOXBASE+或FOXPRO、 SAS、SPSS、EPI INFO 拟定整理表:统计表格 归纳汇总:数量分组、分类分组
调查设计 统计方法的选择 1)计量资料 ■统计描述 集中趋势:算术均数、几何均数、中位数; 离散趋势:方差、标准差、标准误等; ■统计推断 参数估计:点估计、区间估计 假设检验:u检验、t检验、F检验、秩和检验等
调查设计 2)分类(计数、等级)资料 ■统计描述 集中趋势:率、构成比、比例比; 离散趋势:率的标准误; ■统计推断 参数估计:点估计、区间估计 假设检验:X2检验、u检验、秩和检验等
调查设计 10、常用调查方法 问卷调查方法 通过问卷进行的调查统称为问卷调查 自填问卷调查 个别发送法 集中填答法、 邮寄调查法 电子邮件调查法等 他填问卷调查 访问法 电话询问法
调查设计 其它调查方法 提名小组法(nominal group) 专题小组讨论(focus group discussion) 头脑风暴法(brain storming) 特尔斐(Delphi)调查法, 深入访谈法(in-depth interview)
调查设计 11、调查的组织实施与质量控制 调查的组织与实施 (一)调查员的挑选 调查员应具备以下条件: 诚实认真、勤奋负责、谦虚耐心; 身体健康、有文化
调查设计 (二)调查员的培训 对调查员的培训可能是进行入门或常规培训,也可能是针对某一具体项目的特别培训。一般应包括以下内容: (1)本次调查研究的计划、内容、目的、方法以及与调查项目有关的其他情况,以使调查员对该研究有一个整体性的认识。 (2)抽样的基本方法。例如,如何确定访问地点、如何确定访问对象等。 (3)介绍一些基本和关键的调查访问技术。例如,如何自我介绍、如何取得被调查者的信任等。 (4)以某个调查员为对象,进行模拟调查或访问实习。 (5)讨论可能出现的问题,给出解决的办法。 (6)建立相互联系、监督和管理的方法及规定,以保证正式调查工作的顺利开展。
调查设计 调查的质量控制 (一)调查误差的种类 1.非抽样误差 在全面调查的情况下,可能产生此类误差。主要包括: 1.非抽样误差 在全面调查的情况下,可能产生此类误差。主要包括: (1)登记性误差 原因主要有记录错误、计算错误、汇总错误、理解误差、调查员与被调查者有意虚报瞒报以及调查方案的规定不明确等。 (2)系统误差 又称偏倚,原因主要有设计方案不周密、测量仪器不准确、回答问题的偏倚等。 2.抽样误差
调查设计 误差、偏倚的概念 误差(error):实际值与真值之差; 样本指标与总体指标之差 非抽样误差(系统误差):仪器未校正、测量者偏差、标准不统一(偏高或偏低)引起的误差。 偏倚:观察性研究组间不可比引起的系统误差。 抽样误差(随机误差):排除系统误差后存在的、由抽样引起的误差。
调查设计 系统误差的来源之一 1)来自被观察者(研究对象) 2)来自研究者 3)来自实验条件
调查设计 系统误差的来源之二 1)设计阶段: ▲研究对象的总体范围界定不清楚 ▲研究项目定义不明确 ▲研究指标选择不恰当 ▲研究过程中的具体环节考虑不周
调查设计 2)调查阶段 ▲调查者的工作态度与素质; ▲调查对象是否配合; ▲调查过程中的质量控制;
调查设计 3)整理与分析阶段 ▲编码过录错误; ▲汇总、计算中的重复与遗漏;
调查设计 误差的特点 系统误差:有方向性、系统性、周期性 是错误与不足,应避免 随机误差:随机性、无方向性和系统性 无法消除的机会,应减少。
调查设计 常见偏倚(bias) 偏倚是歪曲研究结果真实性和可靠性的主要原因 (一)选择偏倚 因选择研究对象的方法存在问题而使研究结果偏离真实的情况。 1、入院率偏倚 2、现患-新发病例偏倚 3、无应答偏倚
调查设计 (二)信息偏倚(错误分类偏倚) 收集研究对象的(暴露、结局)资料时引起的系统误差。 1、诊断怀疑偏倚 2、暴露怀疑偏倚 3、回忆偏倚
调查设计 (三)混杂偏倚 某因素既与所研究的疾病有联系,又与所研究的因素有关,由于该因素的存在掩盖或夸大所研究的因素与疾病之间的联系的现象。 发生在分析阶段。
调查设计 暴露因素 疾病 混杂因素 条件:1)是疾病的危险因素; 2)与所研究的暴露因素有联系; 3)不是暴露与疾病因果链中的中间环节
调查设计 常见偏倚的控制措施 (一)选择偏倚的控制 1、了解偏倚的来源,在设计中加以避免; 2、设立多组对照,多来源选择对象; 3、尽量选择新病例; 4、设法提高研究对象的应答率
调查设计 (二)信息偏倚的控制 1、盲法收集资料; 2、尽量收集客观指标的资料; 3、收集资料的范围可适当放宽; 4、严格调查设计、树立良好的科学态度
调查设计 (三)混杂偏倚的控制 1、匹配设计 2、标准化 3、分层分析 4、多因素分析
调查设计 调查的质量控制 1.设计阶段 (1)必须围绕调查的任务,从实际出发,严密设计调查的总体方案。 (2)正确划分调查范围。 (3)正确选择调查指标,明确定义调查项目和调查问题。 (4)选择恰当的调查方式,保证调查质量。 (5)广泛听取各方面专家的意见,找出方案中存在的问题,及时修改。 (6)预调查
调查设计 2.资料收集、整理与分析阶段 (1)调查问卷的登记与编码。做到不重不漏,尽量减少差错。 (2)检查资料的完整性。 (3)检查填报的正确性。检查调查问卷的指标填写有无遗漏,是否符合要求。 (4)在数据的计算机录入时,要严格控制录入质量。条件许可的话,要由两名工作人员分头作两份输入,称为“双机输入”。 (5)设计一定的计算机程序,对已录入的数据作逻辑检查