第二章研究设计与评价.

第二章研究设计与评价

目录第一节研究设计概述第二节研究设计的基本要素第三节研究取样第四节研究的效度和信度

第一节研究设计概述研究设计本身是否科学、合理和完善，直接关系到研究的进程、代价、研究结论的可靠性、科学性等。
一个好的研究设计，对研究工作具有一定的保证作用，能够收到事半功倍的效果。在进行公共管理研究之前，严密、审慎地做好研究设计工作是十分必要的。

研究设计就是研究者为了探究研究问题的解答或解释，而对未来研究工作的具体步骤和进程所做的筹划或设想。
第一节研究设计概述什么是研究设计？研究设计就是研究者为了探究研究问题的解答或解释，而对未来研究工作的具体步骤和进程所做的筹划或设想。它包括明确研究目的、设定取样方式、确定分析单元、选取研究方法和手段，以及选定时间框架等一系列内容。它还需要为以上内容制定详细而具体的操作步骤。

科学研究过程是一个系统的、有控制的、通过实验或实证检验、批判性地对自然现象和社会现象进行观察的过程。
第一节研究设计概述研究设计需要回答的问题科学研究过程是一个系统的、有控制的、通过实验或实证检验、批判性地对自然现象和社会现象进行观察的过程。这种观察过程可以分为两种：一种是在某种理论和假设的指导下对某种自然现象进行观察，以考察现象之间是否具有某种既定的关系；一种是通过自然现象的观察找出或发现现象之间可能存在的关系，据此提出某种理论或命题。

一是提出研究问题，这是科学研究过程的起点。
第一节研究设计概述科学研究过程的四个基本步骤科学研究过程包括四个基本步骤： (1)发现研究的问题； (2)提出回答问题的理论假说； (3)检验理论假说； (4)阐明结果，得出结论。决定研究质量的关键步骤有两个：一是提出研究问题，这是科学研究过程的起点。二是对理论假说的检验，因为检验过程可靠与否，直接决定着研究结论是否有效、可信，决定着研究目的能否实现。

第一节研究设计概述

研究设计必须要回答以下四个关键性的问题： (1)研究的问题是什么？ (2)为什么要研究这个（些）问题？ (3)研究假说是什么?
第一节研究设计概述研究设计的四个关键问题研究设计必须要回答以下四个关键性的问题： (1)研究的问题是什么？ (2)为什么要研究这个（些）问题？ (3)研究假说是什么? (4)如何检验研究假说? 对第(2)和第(4)个问题的回答是研究设计的关键环节。研究设计中必须对这两个问题做出详尽、可信的回答。

要想证明所选研究问题确实具有研究价值，研究人员必须在研究设计中以充分的证据说明：
第一节研究设计概述研究设计的证据支撑要想证明所选研究问题确实具有研究价值，研究人员必须在研究设计中以充分的证据说明： (1)这个问题尚未回答或已有答案有缺陷； (2)该问题具有理论意义、实践意义。支撑上述判断的基础是全面系统的文献回顾。文献回顾(literature review)的主要任务是查找文献、选择文献和批判文献。核心是批判文献，即研究人员对相关文献的关键部分进行批判性评价，既肯定其优点长处，又要指出其存在的不足，而后者则是文献回顾的重点和核心部分。

如何检验假说是研究设计中最为关键的部分，因为这一部分直接决定着研究假说是否可信，研究最终能否实现预期目的。
第一节研究设计概述科学设计的假说检验如何检验假说是研究设计中最为关键的部分，因为这一部分直接决定着研究假说是否可信，研究最终能否实现预期目的。对检验假说方法的讨论必须回答如下问题： (1)检验假说的方法和数据/案例是什么? (2)为什么要选择这个方法/数据? (3)如何实施这些方法/运用这些数据/案例?

第二节研究设计的基本要素根据研究设计需要回答的四个关键性问题，研究设计的基本要素将会涉及到研究目的、研究问题、研究变量、研究假设、分析单元、时间维度和研究方法等七个基本要素，如图所示。

第二节研究设计的基本要素

科学研究主要目的包括探索、描述和解释三种。很多研究不止一种研究目的，包含多种研究目的。
第二节研究设计的基本要素一、研究目的科学研究主要目的包括探索、描述和解释三种。很多研究不止一种研究目的，包含多种研究目的。按照研究目的分类，可以将科学研究分为探索性研究、叙述性研究、因果性研究三大类型。

探索性研究是一种所研究对象或问题进行初步了解，以获得初步印象和感性认识的，并为日后更为周密、深入的研究提供基础和方向的研究类型。
第二节研究设计的基本要素探索性研究探索性研究是一种所研究对象或问题进行初步了解，以获得初步印象和感性认识的，并为日后更为周密、深入的研究提供基础和方向的研究类型。使用这种类型的情况是：对某些研究问题，缺乏前人研究经验，对各变量之间的关系也不大清楚，又缺乏理论根据，这种情况下进行精细的研究，会出现顾此失彼或以偏概全的问题，以及浪费时间、经费与人力。

社会管理领域的很多研究都适于叙述性研究。属于这种研究类型的方式有多种，例如，问卷调查、比较研究、相关研究和发展研究等。
第二节研究设计的基本要素描述性研究描述性研究又称为叙述性研究，指为研究结果为正确描述某些总体或某种现象的特征或全貌的研究，任务是收集资料、发现情况、提供信息和从杂乱的现象中，描述出主要的规律和特征。社会管理领域的很多研究都适于叙述性研究。属于这种研究类型的方式有多种，例如，问卷调查、比较研究、相关研究和发展研究等。

解释性研究是指探寻现象背后的原因，揭示现象发生或变化的内在规律，回答为什么的科学研究类型。
第二节研究设计的基本要素解释性研究解释性研究也称为因果性研究。这种研究类型主要探索某种假设与条件因素之间的因果关系，即在认识到现象是什么以及其状况怎样的基础上，进一步弄清楚或明白事物和现象的为什么是这样。解释性研究是指探寻现象背后的原因，揭示现象发生或变化的内在规律，回答为什么的科学研究类型。

第二节研究设计的基本要素三种不同研究类型的特征

研究问题通常都是可以用一个或者一系列的问题的表述或论断（Statement）来表达。
第二节研究设计的基本要素二、研究问题研究问题通常都是可以用一个或者一系列的问题的表述或论断（Statement）来表达。研究问题要明确具体，不要宽泛，既要重点突出，又要有一定的灵活性，包容相关的问题。研究问题不能是一个概念本身，而是一个有关这个概念的问题，也就是要对这个问题寻求具体的答案，而不是笼统地讲一个概念。

第一，问题的陈述要尽可能地简单、清楚、客观，不带有价值判断或主观性，避免用价值判断性的语言；
第二节研究设计的基本要素研究问题遵循的原则第一，问题的陈述要尽可能地简单、清楚、客观，不带有价值判断或主观性，避免用价值判断性的语言；第二，问题表述中所用的词语之间的逻辑关系要清晰，让读者一目了然哪些是自变量、哪些是因变量；第三，问题的陈述中最好能让读者明了是实证研究还是理论研究，如果是实证研究，陈述中指出实证检验的案例或样本会大有益处。

变量是相对于常量而言的，常量指在一个研究中所有个体都具有相同的特征或条件。变量则是指在— 个研究中不同的个体具有不同的特征或条件。
第二节研究设计的基本要素二、研究变量研究变量（Research variable）设计使研究问题概念化、具体化和可操作化，使所研究问题在研究中可以测量，并制定可操作的研究方案的过程。变量是相对于常量而言的，常量指在一个研究中所有个体都具有相同的特征或条件。变量则是指在— 个研究中不同的个体具有不同的特征或条件。根据变量的测量程度，将变量分为：分类变量、等级变量、等距变量和等比变量四大类。

第二节研究设计的基本要素自变量、因变量、无关变量三者关系图

（一）分类（categorical）变量
第二节研究设计的基本要素（一）分类（categorical）变量分类变量也称为名义变量，是以测量类别方式进行记分的变量。例如：性别：男=1，女=0；婚姻状况：已婚=1，未婚=0；小学生家庭状况：父母双全=1，父母双亡=2，只有父在=3，只有母在=4；企业管理方式：民主管理=1，独断专行=2，放任自由=3。

等级变量也称为顺序变量，是指没有相等单位，没有绝对零点的变量。
第二节研究设计的基本要素（二）等级（ordinal）变量等级变量也称为顺序变量，是指没有相等单位，没有绝对零点的变量。例如：文化程度：文盲=1，小学=2，初中=3，高中 =4，大学=5，硕士研究生=6；博士研究生=7，博士后=8；技术职务：院士=0，教授=1，副教授=2，讲师=3，助教=4；行政职务：科级=1，处级=2，厅级 =3，副部级=4，部级=5。

等距变量是指具有相等单位但没有绝对零点的变量。
第二节研究设计的基本要素（三）等距（interval ）变量等距变量是指具有相等单位但没有绝对零点的变量。例如：情绪状态：很好=1、较好=2、一般=3、较差 =4、很差=5；市场化程度：很低=1，较低=2，一般 =3，较高=2，很高=5；创新能力：极弱=1，很弱=2，较弱=3，中等=4，较强=5，很强=6，极强=7。

例如：身高(X1)、体重(X2) 、胸围(X3) 、臀围(X4) 。
第二节研究设计的基本要素（四）等比（ratio）变量等比（ratio ）变量。等比变量是指具有相等单位又具有绝对零点的变量。等比变量属于最高级别的测量尺度变量，数值可以进行比率计算，它可以是数值型变量、货币型变量，但不能是字符型变量。这类变量往往是连续的，数值的范围无限。例如：身高(X1)、体重(X2) 、胸围(X3) 、臀围(X4) 。

公共管理研究必须有理论构思，理论构思的主要任务之一就是建立明确的研究假设。
第二节研究设计的基本要素四、研究假设公共管理研究必须有理论构思，理论构思的主要任务之一就是建立明确的研究假设。研究假设是研究者根据现有的科学理论和经验事实对所研究的问题的规律或原因做出的一种推测性论断和假定性解释，是在进行研究之前预先设想的、暂定的理论，它是对问题的尝试性解答。由于这种设想目前还未获得充分的证据,因此研究假设需要在调查研究中加以证明。

一个好的社会研究假设通常具有四个方面的特点：
第二节研究设计的基本要素一个好的社会研究假设通常具有四个方面的特点： ①科学性。假设应有—定的社会事实和理论依据，应合乎逻辑，理由充分，易于定量。科学性还表现在假说的核心概念具有严格规定的含义，具有好的概括度和清晰度，且理论体系结构严谨合理。 ②预测性。对于一定的社会行为、现象或事件的出现作试验性的合理的解释，有一定的预测性。 ③可检验性。研究假说必须是可检验的，一个原则上不可检验的陈述是没有科学价值的。 ④逻辑性。假说的表述要明确，简明扼要，用词准确，条理分明，假说命题的本身在逻辑上是无矛盾的。

分析单位（units of analysis）是研究者试图观察、描述和解释的对象，也即是在公共管理研究中被分析、描述和解释的人或事物。
第二节研究设计的基本要素五、分析单位分析单位（units of analysis）是研究者试图观察、描述和解释的对象，也即是在公共管理研究中被分析、描述和解释的人或事物。任何研究首先必须要有明确的研究分析单元，然后才能根据研究的分析单元收集资料。公共管理研究的分析单位是多种多样的，既可以是个体，也可以是某个群体或组织，或者是一个社区或者是社会产品。

作为公共管理研究分析单元的个人，通常包括：政府官员、公务员、教师、学生、农民、工人、军人、企业家等。
第二节研究设计的基本要素（一）个人（individual）个人（individual）。由于社会组织或社会活动主要是由个体成员或个人活动组成的，因此，公共管理研究在很大程度上是以个人为研究对象的。作为公共管理研究分析单元的个人，通常包括：政府官员、公务员、教师、学生、农民、工人、军人、企业家等。

在公共管理研究领域，群体是重要的研究对象和分析单元，如：工人群体、农民群体、教师群体、公务员群体、弱势群体等。
第二节研究设计的基本要素（二）群体（group）群体（group）。群体是相对于个体而言的。从心理学的角度来说，群体指由两个或两个以上成员组成的、具有共同关注的目标/任务/活动、在行为上相互作用、在心理上相互影响的人群。在公共管理研究领域，群体是重要的研究对象和分析单元，如：工人群体、农民群体、教师群体、公务员群体、弱势群体等。

第二节研究设计的基本要素（三）组织（organization）组织（organization）。组织是指为了执行一定的社会职能，完成特定的社会目标、具有明确规章制度的一个独立单位，是正式化的社会群体，组织特征包括：组织规模、组织方式、管理方式、组织行为、组织规范等。如学校、企业、医院、政府、农村、城市、维权机构、行业协会、民间公益组织、社区组织、互助组织、商会、工会、基金会等，均是公共管理研究的重要分析单位。

（四）公共产品（public goods）
第二节研究设计的基本要素（四）公共产品（public goods）公共产品(public goods)。除上述三种分析单元以外，各种类型的公共产品（或公共服务）也是公共管理研究的重要分析单元。公共产品基本特征：非竞争性；非排他性。例如行政、国防、文化、教育、科学、卫生、医疗、社会保障，以及公共政策、法律制度等公共产品，均是公共管理研究领域中重要的研究对象。

时间维度的含义主要是指应考虑研究对象的时间特性。
第二节研究设计的基本要素六、时间维度时间维度的含义主要是指应考虑研究对象的时间特性。根据研究设计中的时间维度，公共管理研究可以选择截面研究和纵向研究两种基本类型。

（一）横向研究（cross-sectional study）
第二节研究设计的基本要素（一）横向研究（cross-sectional study）横向研究（cross-sectional study）。在某一时刻点上，对某一事物或社会现象所进行的“横截面”的研究。最典型的横向研究是人口普查，它是在同一时点上对人口状况进行的横截面研究。在公共管理研究中，横向研究应用很广，它有助于分析和比较属于不同群体、不同阶层或具有不同性别、不同年龄、不同职业和不同文化程度等特征的研究对象，在一定时间和空间范围内的分布状况和特征。

（二）纵向研究（longitudinal study）
第二节研究设计的基本要素（二）纵向研究（longitudinal study）纵向研究（longitudinal study）。就是在比较长的时间内，对一个体或群体或组织的行为发展进行有系统的定期的研究，也叫做追踪研究。例如，研究政府能力的形成、发展与变化，可以从某个政府组织的组建开始，持续多年对政府能力的形成原因、形成机理及发展变化趋势进行系统考察，从而查明政府能力的发生发展的路线和规律。

（三）混合研究（integrative study）
第二节研究设计的基本要素（三）混合研究（integrative study）混合研究（integrative study），又称为“动态研究”。这就是把横向研究和纵向研究结合起来，充分考虑到研究对象和发展的关系，从而解决时间方面的两难问题。例如开始对某些追踪组测查和比较，若干年后再测查和再比较。这种方法吸收了纵向法和横断法的长处，而避免了其缺点，起到了扬长避短的作用。

研究方法（Approaches）是研究者对某事物的规律进行研究的出发点或者角度。包括规范研究和实证研究两种方法。
第二节研究设计的基本要素七、分析方法研究方法（Approaches）是研究者对某事物的规律进行研究的出发点或者角度。包括规范研究和实证研究两种方法。规范研究（Normative Study）：关于经济目标、经济结果、经济决策、经济制度的合意性的研究，它解决经济过程中“应该是怎样”（ what should be）的问题，旨在对“好”、“坏”做出价值判断。规范研究：研究客观现象的目的在于提出一定的标准作为公共管理理论的前提，并以该标准作为制定公共政策的依据，以及研究如何使公共管理现象的运行符合或实现这些标准。

实证研究（Empirical Study）。主要用来总结是什么情况（what is the case），怎么样，怎么做。
第二节研究设计的基本要素实证研究（Empirical Study）。主要用来总结是什么情况（what is the case），怎么样，怎么做。实证主义所推崇的基本原则是科学结论的客观性和普遍性，强调知识必须建立在观察和实验的经验事实上，通过经验观察的数据和实验研究的手段来揭示一般结论，并且要求这种结论在同一条件下具有可证性。实证性研究方法可以概括为通过对研究对象大量的观察、实验和调查，获取客观材料，从个别到一般，归纳出事物的本质属性和发展规律的一种研究方法。

第三节研究取样确定了研究的分析单元后，研究取样是社会研究设计面临的重要问题，它不仅与研究目的、研究内容密切相关，而且还直接关系到研究资料的收集、整理、分析，同时它还涉及到整个研究的费用以及应用范围。

研究取样（sampling）就是从一个总体（population）中抽取部分具有代表性的个体作为研究样本（sample）。
第三节研究取样一、研究取样的基本原理研究取样（sampling）就是从一个总体（population）中抽取部分具有代表性的个体作为研究样本（sample）。

第三节研究取样研究取样中的相关概念理论总体。总体是指研究对象的全体。如：进行一项有关公务员行政能力的研究，如果期望以研究结果解释全国的公务员，那么理论总体就是全国的公务员；如果期望解释浙江省的公务员，那么理论总体就是浙江省的公务员；如果期望解释杭州市的公务员，那么理论总体就是杭州市的公务员。抽样框架（可获得总体）。抽样框架是抽样单位的实际名单，样本就是从抽样框架中选取。如果一个公务员样本是从某个政府部门的公务员花名册中抽选，这个花名册就是抽样框架。

样本。样本是总体的一部分，它是从总体中按一定规则抽选出来的那部分分析单位的集合。
第三节研究取样样本。样本是总体的一部分，它是从总体中按一定规则抽选出来的那部分分析单位的集合。取样比。取样比是指在抽选样本时，所抽取的样本单位数与总体单位数之比。置信度。置信度也称为可靠度，或置信水平、置信系数。取样误差。在取样研究中，通常以样本做出估计值对总体的某个特征进行估计，当二者不一致时，就会产生误差。偏差。是指在取样研究中除取样误差以外，由于各种原因而引起的一些误差。均方差。在取样调查估计总体的某个指标时，所有可能样本的估计值与总体指标之间离差平方的均值即为均方差。

①方向性原则（与研究目标、研究内容相匹配）。 ②可测性原则（数据可以获得，样本推测总体）。 ③可行性原则（幼儿园按随机原则实验、对照组）。
第三节研究取样二、研究取样的基本原则研究取样设计应满足的五条基本原则： ①方向性原则（与研究目标、研究内容相匹配）。 ②可测性原则（数据可以获得，样本推测总体）。 ③可行性原则（幼儿园按随机原则实验、对照组）。 ④代表性原则（1936《文摘》兰登胜、罗斯福败）。 ⑤经济性原则（讲究时间、人力、物力节省）。

概率取样（probability sampling）非概率取样（non-probability sampling）
第三节研究取样三、研究取样的基本方法根据抽选样本的方法，研究取样可以分为：概率取样（probability sampling）非概率取样（non-probability sampling）

概率取样是按照概率论和数理统计的原理从研究总体中，根据随机原则来抽选样本的一种取样方法。
第三节研究取样（一）概率取样概率取样是按照概率论和数理统计的原理从研究总体中，根据随机原则来抽选样本的一种取样方法。概率抽样样本具有代表性，可以作推论，常用于正式的、量化的研究。概率取样包括：简单随机取样、分层随机取样、聚类随机取样和系统随机取样。

1.简单随机取样（random sampling）
第三节研究取样 1.简单随机取样（random sampling）简单随机取样，是指从总体中不加任何分组、划类、排队等，完全随机地抽取研究单位。其特点是：每个样本单位被抽中的概率相等，样本的每个单位完全独立，彼此间无一定的关联性和排斥性。

例：研究浙江大学大学生的诚信品质，可以通过随机数字表来进行简单随机取样，基本程序如下：
第三节研究取样简单随机取样实例例：研究浙江大学大学生的诚信品质，可以通过随机数字表来进行简单随机取样，基本程序如下：确定浙江大学本科生的总体，设为25000；确定样本规模，选择为总体的10%，即为2500；给每一个本科生编制代码，从；在5位数的随机数表上，从中选择2500个小于25000的数字；被选中数字的本科生组成研究样本。

2.分层取样（stratified random sampling）
第三节研究取样 2.分层取样（stratified random sampling）分层取样，是指将总体单位按其属性特征分成若干类型或层次，然后在各个类型或层次中随机抽取样本单位，其特点是：由于通过划类分层，增大了各类型中单位间的共同性，容易抽出具有代表性的调查样本。该方法适用于总体情况复杂，各单位之间差异较大，单位较多的情况。分层取样又称为分类取样或类型取样，它首先是将总体的N个单位分成互不交叉、互不重复的k个部分，我们称之为层；然后在每个层内分别抽选n1、n2、... nk个样本，构成一个容量为n个样本的一种取样方式。

3.聚类随机取样（cluster random sampling）
第三节研究取样 3.聚类随机取样（cluster random sampling）聚类随机取样，是指把组成总体的所有部分分为若干群体，从随机选择的某一群体或几个群体中随机地抽取个体组成研究样本的取样方法。例：研究浙江大学大学生的诚信品质时，采用聚类随机取样，基本程序如下：确定浙江大学本科生的总体，设为25000；确定样本规模，选择为总体的10%，即为2500；按某特征（如学院）把浙江大学本科生分为30个群体；从30个群体中随机地选择若干个群体（如6个群体）；从6个群体中随机地抽取2500个本科生作为研究样本。

4.系统随机取样（system random sampling）
第三节研究取样 4.系统随机取样（system random sampling）系统随机取样，也称为等距取样，是指按照某一特征，把总体中的个体进行排序，然后按随机原则确定起点，每隔一定的间隔抽取一个单位的一种取样方式。例：研究浙江大学大学生的诚信品质时，采用系统随机取样方法，基本程序如下：确定浙江大学本科生的总体，设为25000；确定样本规模，选择为总体的10%，即为2500；按学号把浙江大学本科生进行排序；从25000个中随机地抽取1个；确定取样距离：每10个抽取1个。

非概率抽样是指每个研究对象被抽取的概率是未知的，抽样方式不是随机的，样本通常是按研究目的而选择的。
第三节研究取样（二)非概率取样非概率抽样是指每个研究对象被抽取的概率是未知的，抽样方式不是随机的，样本通常是按研究目的而选择的。非概率抽样不具代表性，通常不能推断总体，常用于非正式的、质化的研究。非概率取样主要有：简便取样、判断取样和配额取样等。

1.简便取样（convenience sampling）
第三节研究取样 1.简便取样（convenience sampling）简便取样，是指研究者根据现实情况，以自己方便的形式抽取偶然遇到的人或事作为研究对象，或者仅仅选择那些最容易找到的人或事作为研究对象。例如：为了调查某市的交通情况，研究者到离他们最近的公共汽车站，把当时正在那里等车的人选作调查对象。其他类似的简便取样还有：在街口拦住过往行人进行调查；在图书馆阅览室对当时正在阅读的读者进行调查；在商店门口、展览大厅、电影院等公众场所向进出往来的顾客、观众进行的调查；利用报刊杂志向读者进行调查；老师以他所教的班级的学生作为调查样本的调查等。

2.判断取样（judgment sampling）
第三节研究取样 2.判断取样（judgment sampling）判断取样，是指研究者根据研究的目标和自己主观的分析，来选择和确定研究对象的方法。研究者依据主观判断选取可以代表总体的个体作为样本。样本的代表性取决于研究者对总体的了解程度和判断能力。判断取样的优点：可以充分发挥研究人员的主观能动作用，特别是当研究者对研究的总体情况比较熟悉，研究者的分析判断能力较强、研究方法与技术十分熟练、研究的经验比较丰富时，采用这种方法往往十分方便。缺点：样本的代表性难以判断，不能推论。

第三节研究取样 3.配额取样（quota sampling）配额取样与分层取样中的比例取样相似，也是按研究对象的某种属性或特征将总体中所有个体分成若干类或层，然后在各层中取样，样本中各层（类）所占比例与他们在总体中所占比例一样。例：假设某高校有2000名学生，其中男生占60％，女生占40％；文科学生和理科学生各占50％；一年级学生占40％，二年级、三年级、四年级学生分别占30％、20％和10％。现要用配额取样方法依上述三个变量抽取一个规模为100人的样本。依据总体的构成和样本规模，可以得到如下表所示的配额表。

第三节研究取样 100人样本的配额表

样本容量：指抽取样本的具体数量。样本数量多少为宜，这是一个复杂的问题。通常而言，选取研究样本的数量需要考虑以下七个方面的因素：
第三节研究取样四、样本容量的确定样本容量：指抽取样本的具体数量。样本数量多少为宜，这是一个复杂的问题。通常而言，选取研究样本的数量需要考虑以下七个方面的因素：研究的类型、范围。当研究是定量研究，研究范围较广，样本数量可适当大一些；反之，当研究是定性研究，研究范围较狭窄，样本数量可适当少一些。研究分析的精确程度。当研究要求有较高的统计显著程度，具有较高的可信程度时，样本数量可多些；反之，则可少些。

第三节研究取样允许误差的大小。当研究允许的误差值小，要求的可信程度高，所需样本容量相应要大；反之，则可小些。下表表示当总体趋于无限大时，不同的允许误差和可信程度要求不同的样本数量。

第三节研究取样总体的同质性。当总体的变异性比较大，变量的相关程度比较低，研究的条件控制不严格，样本数量可适当增加些；反之，当总体同质性比较好，变量的相关程度较高，研究条件控制严格，则可少些。如人的血液同质性比较好，医院化验只需抽取一点点血。学生的智力、能力变异性比较大，因此抽取样本相对比较大。测量工具的可靠程度。当测量工具的可靠程度即测定指标信度比较低时，测量的误差就比较大，这时需要增大样本数量；反之，则可减少样本数量。一般说来，有关学习能力和成就的测量工具可靠性程度好些；有关人格特质、自我概念、态度等方面的测量工具可靠程度差些。研究的成本。研究的成本包括经费、时间、人力、物力，抽样数量总是要控制在研究成本允许的范围内。因此，确定样本容量时，必须仔细分析研究的条件，量体裁衣。

分析的类别。当研究的关系复杂，分析的项目较多，那么样本数量可多些；反之，则可少些。一般应保证每一分析小类的样本数量不少于10。
第三节研究取样分析的类别。当研究的关系复杂，分析的项目较多，那么样本数量可多些；反之，则可少些。一般应保证每一分析小类的样本数量不少于10。根据研究经验，研究总体数量与样本数量的关系如下表所示。

从总体与样本数量的关系表中可以看出，样本数并不是与总体数量的增加而同步增加的。当总体数量不断增加，样本数的增长逐步减缓。
第三节研究取样从总体与样本数量的关系表中可以看出，样本数并不是与总体数量的增加而同步增加的。当总体数量不断增加，样本数的增长逐步减缓。

具体确定所需的样本容量有一些方便的计算公式。对于不同的抽样方法，计算公式存在不同。以下介绍适用于简单随机取样的样本容量计算公式。
第三节研究取样具体确定所需的样本容量有一些方便的计算公式。对于不同的抽样方法，计算公式存在不同。以下介绍适用于简单随机取样的样本容量计算公式。若是估计平均值，其样本容量计算公式为：式中，Z指标准误的置信度，σ指总体标准差，E指允许的误差值。若是估计比例，如调查支持某项公共政策的人的比例，其样本容量计算公式为：式中，P指总体比例。样本容量计算公式

第四节研究的效度和信度在研究中，如何判断研究的质量，如何评价研究结果的有效性和可信性呢？在经过不断的研究和知识积累的过程中，人们总结出了几个重要的评价指标，即效度（validity ）和信度（reliability）。通过研究评价，有助于更深入地认识研究结果的有效性和可靠性；有助于更进一步地完善研究体系。

效度（validity ），即有效性，它是指测量工具或手段能够准确测出所需测量的事物的程度。
第四节研究的效度和信度一、研究的效度效度（validity ），即有效性，它是指测量工具或手段能够准确测出所需测量的事物的程度。效度可分为内部效度、外部效度、结构效度、测评效度和统计结论效度等。

（一）内部效度（internal validity）
第四节研究的效度和信度（一）内部效度（internal validity）内部效度（internal validity）。内部效度是指在研究的自变量与因变量之间存在一定关系的明确程度。如果自变量和因变量之间关系并不会由于其他变量的存在受到影响，从而变得模糊不清或复杂化，那么这项研究就具有内部效度。要使研究有较高的内部效度，就必须控制各种外部变量，消除它们对研究结论的影响。

（二）外部效度 (external validity)
第四节研究的效度和信度（二）外部效度 (external validity) 外部效度 (external validity) 。外部效度是指研究结果能够一般化和普遍适用到样本来自的总体和到其他总体中的程度，即研究结果和变量条件、时间和背景的代表性和普遍适用性。外部效度可以细分为总体效度和生态效度两类。

（三）结构效度 (construct validity)
第四节研究的效度和信度（三）结构效度 (construct validity) 结构效度：测量结果体现出来的某种结构与测值之间的对应程度。结构效度分析方法是因子分析，主要功能是从量表全部变量（题项）中提取一些公因子，各公因子分别与某一群特定变量高度关联。通过因子分析可以考察问卷是否能够测量出研究者设计问卷时假设的某种结构。

（四）测评效度 (measurement validity)
第四节研究的效度和信度（四）测评效度 (measurement validity) 测评效度 (measurement validity)。测量的指标是否能够准确测出想要测量的东西或概念。包括了几个重要的维度：测量的灵敏度，是否能够区别出细微的事件，情感差别等等。

（五）统计结论效度（statistical conclusion validity）
第四节研究的效度和信度（五）统计结论效度（statistical conclusion validity）统计结论效度（statistical conclusion validity）。关于研究的数据分析处理程序的效度检验，或者说，它是检验研究结果的数据分析程序与方法的有效性的指标。提高统计结论的效度，首先必须保证数据的质量；其次要明确各种统计检验方法的基本假设和适用条件，选用适宜的统计程序；此外还应注意适当增大样本的容量。

信度（reliability）：测量（或研究）结果的一致性或稳定性程度，反映被测特征真实程度的指标。
第四节研究的效度和信度二、研究的信度信度（reliability）：测量（或研究）结果的一致性或稳定性程度，反映被测特征真实程度的指标。在实际应用中，信度主要有以下五种基本类型：重测信度、复本信度、折半信度、同质性信度和评分者信度。

（一）重测信度（test-retest reliability ）
第四节研究的效度和信度（一）重测信度（test-retest reliability ）重测信度。用同样的测试工具对同一被试间隔一定时间的重复测试，计算两次测试结果的相关系数。假如第一次测量时的观测值是X，第二次的观测值是Y，那么重测信度就等于X与Y的相关系数。在进行重测信度的评估时，应注意以下两个重要问题：一是重测信度一般只反映由随机因素导致的变化，而不反映被试行为的长久变化；二是不同的行为受随机误差影响不同。

复本信度的高低反映了这两个测验复本在内容上的等值性程度。两个等值的测验互为复本。
第四节研究的效度和信度（二）复本信度复本信度（alternate-form reliability）。也称等同信度，是以两个测验复本来测量同一群体，然后求得应试者在两个测验上得分的相关系数。复本信度的高低反映了这两个测验复本在内容上的等值性程度。两个等值的测验互为复本。计算复本信度的主要目的在于考察两个测验复本的题目取样或内容取样是否等值。复本信度也考虑两个复本实施的时间间隔。

（三）折半信度（split-half reliability）
第四节研究的效度和信度（三）折半信度（split-half reliability）折半信度（split-half reliability）。折半信度，是指将一个测验项目按奇偶项分成两半，分别记分，计算这个测验两部分项目分数之间的相关系数，再据此确定整个测量的信度系数 Rxx 。测验愈长，信度系数愈高。

（四）内部一致性信度（ internal consistent reliability ）
第四节研究的效度和信度（四）内部一致性信度（ internal consistent reliability ）内部一致性信度（internal consistent reliability）。主要反映的是测验内部题目之间的关系，考察测验的各个题目是否测量了相同的内容或特质。内部一致性信度也称同质性信度（homogeneity reliability），是指测验内部的各题目在多大程度上考察了同一内容。

内部一致性信度通常用克劳伯克（Cronbach）α系数来表示，α系数的计算公式如下：
第四节研究的效度和信度内部一致性信度计算内部一致性信度通常用克劳伯克（Cronbach）α系数来表示，α系数的计算公式如下：式中K为测验工具所包含的题目数量， Si为第i个测验题目的标准差，S是整个测验的标准差。

（五）评分者信度（scorer reliability）
第四节研究的效度和信度（五）评分者信度（scorer reliability）评分者信度（scorer reliability）是指不同评分者对同样对象进行评定时的一致性。最简单的估计方法就是随机抽取若干份答卷，由两个独立的评分者打分，再求每份答卷两个评判分数的相关系数。这种相关系数的计算可以用积差相关方法，也可以采用斯皮尔曼等级相关方法。

提高测量信度的方法提高测量信度主要方法有：增加测验或量表的长度；测验时间、测验难度适当；测验内容尽可能同质；
第四节研究的效度和信度提高测量信度的方法提高测量信度主要方法有：增加测验或量表的长度；测验时间、测验难度适当；测验内容尽可能同质；测验程序和环境尽量标准化；评分尽量客观。

美国社会学家艾尔•巴比在《社会研究方法》一书中用图3-6所示。
第四节研究的效度和信度三、研究的效度和信度关系研究的信度和效度有着密切的关系。美国社会学家艾尔•巴比在《社会研究方法》一书中用图3-6所示。图中清晰地说明了信度和效度两者之间的关系。

信度是效度的必要条件而非充分条件。可信可以导致有效，也可以导致无效。有效必先可信，不可信则必然无效。无效可以可信，也可以不可信。
第四节研究的效度和信度效度和信度关系的描述信度是效度的必要条件而非充分条件。可信可以导致有效，也可以导致无效。有效必先可信，不可信则必然无效。无效可以可信，也可以不可信。效度和信度两者之间的关系也可以用下图所示描述。图中实线箭头表示必要联系，虚线箭头表示可能联系。

复习思考题 1.什么是研究设计，研究设计需要回答的关键问题是什么？ 2.举例说明研究设计涉及的基本要素。 3.举例说明概率取样和非概率取样的本质差别。 4.确定研究样本的大小需要考虑到哪些因素？ 5.什么是效度，效度有哪些主要类型？ 6.什么是信度，信度有哪些主要类型？ 7.举例说明研究效度和信度之间的关系。

谢谢！

第二章研究设计与评价.

Similar presentations

Presentation on theme: "第二章研究设计与评价."— Presentation transcript:

Similar presentations

About project

反馈

请登录

Auth with social network:

第二章 研究设计与评价.

Similar presentations

Presentation on theme: "第二章 研究设计与评价."— Presentation transcript:

Similar presentations

About project

反馈

第二章研究设计与评价.

Presentation on theme: "第二章研究设计与评价."— Presentation transcript: