Download presentation
Presentation is loading. Please wait.
1
能力倾向测验 什么是能力倾向测验? 能力倾向测验与成就测验是什么关系? 能力倾向测验是如何发展起来的? 能力倾向测验有什么特点?
能力倾向测验可以分为几类? 能力倾向测验举例
2
什么是能力倾向测验? 对能力倾向(性向),很多心理学家作出了不同的解释,但都强调一点,就是能力倾向是一个人的潜在能力,此种潜能予以训练以后,容易使个人获得某种知识和技能。 Reber(1985) 提出,能力倾向测验是测量成就潜力的。 Bingham (1943) 提出,能力倾向是指潜在的能力,而能力倾向测验则针对能力和兴趣。
3
能力倾向测验与成就测验是什么关系? 二者的联系 不同之处:
从前面我们知道,成就测验被定义为对过去某种特定学习的影响,而能力倾向测验则是预测将来的成就。然而,预测莫过于检验其过去的作业。因此,能力倾向测验与成就测验便没有什么不同。所以,为了避免这种混淆,有人干脆将成就测验定义为是测量过去学习的经验,而能力倾向测验则是测量将来作业能力的测验。 实际上,能力倾向测验与成就测验的区分只在于编制测验的目的和编制方法。如果目的在于编制一种预测工具,那么就可以称为能力倾向测验;如果目的在于编制测量过去作业的工具,便可称为成就测验。 不同之处: 能力倾向不同于受教育影响的学业成就。学业成就涉及的是特定的学习经验,是以过去或当前为标准;能力倾向涉及广泛的学习经验,是在一定遗传素质基础上各种经验累积的结果。能力倾向测验只预测一个将来在某方面的“可能”成就,并不保证他在该方面的“必然”成就,因为,一个人的能力倾向能否获得充分的发展与他的性格、兴趣、学习态度、技巧、机会等条件都有关联。 能力倾向测验是测量各种学习的累积影响,而不是测特定的学习经验所产生的直接效果。成就测验是测量的某种特定学习的影响。成就测验被定义为对个体已有的知识、技能和作业水平的测量;能力倾向测验则是预测将来的成就。
4
能力倾向测验与智力测验的关系 联系: 区别:
智力测验一般得到的是对个体总智能的评估分数,而能力倾向测验则测量的是某种特定的或多种因素的组合。如果我们把所有这些测验放在一条直线上,左端表示总分数,右端表示具体分数,那么就可以看到在这一直线上从左到右可能出现这样一些测验, SB(只有一个分数)、WISC-R(只有VIQ、PIQ、FIQ)、CQT(大学资格测验,有五个分数)、CTMM(加州心理成熟量表,有七个分数)、DAT(区分能力倾向测验,有九个分数)、MAT(音乐能力倾向测验,只有一个特殊分数)。 联系: 能力倾向测验分为三类:一般能力倾向测验、特殊能力倾向测验、多因素能力倾向测验。其中一般能力倾向测验就是智力测验。概括的是人类能力的共同方面。不涉及人与人之间在能力构成上的差异。而狭义的能力倾向测验专指后两者。 智力测验与能力倾向测验的另一个区别就是Cronbach(1970,1990)提出的带宽(bandwidth)和精确度.带宽指测验可预测的效标全距,测验能预测的效标总数越大,则这个测验的带宽越大智力测验比能力倾向测验的带宽普遍要大。精确度是指测验可在多大程度上预测效标,一般而言,能力倾向测验的精确度更大一些。而智力测验由于带宽过大,一般只有中等的预测效度。经典测量学认为,一种测量工具应该有高的精确度和低的带宽。能力倾向测验正符合这一要求,所以自1920年以后,各种能力倾向测验逐渐发展起来,以补充智力测验的不足,两者各有所重,在应用上相辅相成。
5
能力倾向测验的发展 能力倾向测验的发展主要可以归结 为以下四个原因: 智力测验的局限 个体能力倾向的差异 因素分析技术的发展 来自实际的需要
6
智力测验的局限 在智力的心理测量学的理论研究中,由斯皮尔曼提出的一般智力因素得到了充分的重视以及普遍的认可,因而在此基础上产生了传统的智力测验并且广泛地应用于社会之中。但是,关于智力实质的理论研究和争议并未因此而停止。以瑟斯顿和吉尔福特为首的智力多因素论者虽然最后不得不承认智力G因素的存在,但他们始终强调的是构成智力的多种基本能力因素,并视其为智力结构中的核心因素群,认为应从这些不同的能力因素入手评估能力 。在弗农的智力层次理论中,智力被作了进一步的细分,呈树状结构,智力的一般因素被分为几个主要的能力因素,最后再细分为众多的基本能力因素。 传统的智力测验以测量G因素为目标,通过广泛地测量心理功能,从而估计个体的总体智力水平。但是很快发现,这些测验不能包括所有重要的功能,大部分的智力测验只不过测量了言语能力和数目及抽象关系能力。因此所谓的智力测验只是涉及到智力的某些方面。于是为了名符其实,不少测验作了名称上的改变,如一些智力测验只不过测量了与学校教育有关的各种能力,所以它们改称为学业能力倾向测验(Scholastic aptitude test)。在第一次世界大战前,心理学家就已经认识到特殊能力倾向测验可以补充笼统的智力测验。 人们在使用智力测验的过程中,也逐渐发现其缺陷与不足之处,其中之一便是对智力测验结果的单一分数的解释问题。从智力测验所依据的理论基础来看,这一分数表明的是个体在一般智力上的差异,但在实际实施与解释中,人们发现即便某些被试得到同样的智商分数,他们在不同的题目类型中所出来的成绩却是不一致的。要想在更精确的意义上来解释个体的能力差异,传统智力测验显然 是不够的。
7
个体能力倾向的差异 个体在某一测验的各部分上的作业,常常表现出显著的差异。这种个体内变异在智力测验上表现为分测验得分的差异。例如,有人对所有的言语分测验都感到困难,但对图画或几何图形项目却得心应手。更细微的差别还可以发生在言语部分或操作部分以内。利用这种比较,心理学家和临床工作者能对个体的心理构成作深入的分析。但由于各分测验的项目太少,智力测验往往不足以作出这种个体能力倾向差异的分析。传统的智力测验旨在概括人类能力的共同方面,不涉及人与人之间在能力构成上的差异。
8
因素分析技术的发展 人Spearman到Thurstone再到Guilford,对智力本质的统计研究,使得分析物质的组成成为可能,从而为区分性的能力倾向测验提供了帮助。因素分析技术的出现,智力所包含的各种不同能力因素能够被辨别、分类和定义,进而使得对这些能力因素有性地测量变为可能。这样我们就能够编制多重能力倾向测验,从百为个体各种能力倾向的强弱提供比较,不只是一个部分或智商,而是一系列分数,如语言能力、空间能力、数学推理能力、机械能力等。
9
来自实践的需要 主要来自以下几个实际工作领域的需要: 学校专业与工作职业的选择与咨询 人事工作的科学管理(人事选拔、人员安置、绩效评估)
关系和知觉和想象能力,机器修配工需要机械操作能力等。要想在人员与工作之间作出最佳匹配,合得物尽其用,人尽其才,就必须清楚每个工作所要求的主要能力因素以及每个人员所具备的主要能力素质。的智力测验只能就一个单一而笼统的智商分来解释和比较个体间差异,却不能对此差异内部的一些现象做更进一步的客观判断,更无法比较不同能力因素上的个体内差异。既不能为个体提供自身在不同上的水平分布状况,也不能帮助人事管理部门有效选择和安置在工作所需的特定能力上水平相对最高的人员。 由于社会迫切需要能够辨别和判断在不同能力因素上的个体间以及个体内差异,而当时现有的能力测验----智力测验 作为心理学家和教育学家,他们所关心的实际问题之一,就是引导青年人选择和从事他们所喜爱并将会有所作为的专业与工作。作为人事管理人员,他们首要的任务就是选拔出对即将担任的工作有兴趣并且完全 能够胜任的人,并且将每个人 安置在他最有可能发挥特长的上;而对于个人来说,他们也希望在面临求学或职业选择时,能够清楚地了解自己在不同的能力因素方面的优劣程度,从而能够最有效地决定自己的发展方向。在这种决定过程中,能力测验将是最主要的辅助工具之一。因此,传统的智力测验已经不能满足这种社会需要。许多研究表明,不同性质的工作要求不同的知识与能力专长。如会计需要快捷的计算能力,律师需要俯和运用语言的能力、美术家需要空间 又无法满足这一要求,加之因素分析技术的出现,使得一历程 所蕴含的各种不同能力因素的辨别分类成为可能,能力倾向测验而生。1941年,瑟斯顿在自己的智力理论支持下,编制并且发表了第一个能力倾向成套测验---基本心理能力测验(PMA),主要测量五种能力因素: 言语能力、数的能力、知觉速度、推理能力和空间关系认知能力,目的是为了了解和预测学生在各门课程中的学习情况。由于该测验存在许多技术缺陷,因而现在较少应用,但它具有重要的历史意义,为此后发展起来的各种倾向测验的先驱 。 在近几十年里,能力倾向测验得到迅速发展,测验层出不穷,且大量地应用于社会,成为人员选拔与安置等决策的有效工具。 主要来自以下几个实际工作领域的需要: 学校专业与工作职业的选择与咨询 人事工作的科学管理(人事选拔、人员安置、绩效评估)
10
能力倾向测验的特点 能力倾向测验预测失败比预测成功更为正确。 必须审慎解释各种特殊能力分数间的差异。 能力倾向测验在训练计划中应审慎运用。
从测验目的看,即不同于智力测验与不同于成就测验。 测验结构形式上有其自身特点 其测验结果的解释也有自身特点
11
能力倾向测验预测失败比预测成功更为正确 能力倾向测验只测量某方面的潜在能力。个体要取得成功,除了某种关键性的能力之外,还会受到动机态度、环境等多种因素的影响。具有某种能力 倾向的个体不一定在某方面很成功,但缺乏这种关键的能力,则必然没有成功的机会。就象智力优异的人,可能读到博士学位,但一个弱智者,是根本不会有这种机会的。
12
必须审慎解释各种特殊能力分数间的差异 这是因为: (1) 能力倾向测验的标准化样本,很少有两个是相同的,尤其是那些从特殊职业团体进行取样。因此,测验分数韹差异也许只是标准差异,而不是能力上的不同; (2) 被试施测某种能力测验的结果应该与实际从事这种活动的团体相比 较。如,某人做了音乐能力倾向测验,则他应该把他的结果与从事音乐工作的人在该测验上的得分进行比较,这样才能看出他是否适于从事音乐工作,如果同一般人的测验结果进行比较,无论得分如何,均没有意义。所以,特殊能力倾向测验应重视特殊团体常模的建立。
13
能力倾向测验在训练计划中应审慎运用 有些能力倾向要到15、16岁之后才能逐渐成熟,如果将这些测验用于未成熟被试,可能会出现误导。
许多能力倾向测验的预测能力尚未得到证实,或者没有进行过预测性研究,或者没有证实这种相关。所以有时各种研究资料齐全的旧测验,反而比新测验更好。
14
测验目的方面的特点 与成就测验的目的不同: 与智力测验的目的不同:
成就是指个体经过一定的教学或训练后所掌握的知识水平或所达到的能力水平,它针对于特定的学习经验,强调个体目前已经达到的水平。换言之,成就测验是对个体过去学习经验的总结。 能力倾向指的是个体在不同能力因素上潜在的优劣倾向。当能力倾向测验首次出现时,能力倾向被定义为不是建立在经验之上的、特殊的、天生或遗传的能力。现在看来,这一定义似乎有失偏颇。严格地说,任何能力都在一定程度上既依赖于遗传的潜能,又依赖于生活环境中所积累的经验,但并不直接依赖于专门的教学或训练。卡洛尔(J. B. Carroll) 等人的一些研究表明,具体的课程教学或知识技能训练可以显著改善成就测验的成绩,面对能力倾向测验的成绩却没有影响。因而,能力倾向测验的目的不在于总结过去,而在于预测将来,即预测个体在将来的学习或工作可能达到的成功程度。如某人的测验结果表明他在逻辑推理能力上有明显的优势,我们可以预测此人将来在理科课程的学习中可能取得较好的成绩。 虽然智力测验的主要目的也在于预测,但由于其所依据的理论基础与能力倾向测验不同,它所作出的预测比较笼统,针对性较弱。而能力倾向测验预测的目的性更强,它试图说明个体在多种能力上的潜在优势,并进而和专业或工作所需结合起来。
15
测验编制方面的特点 能力倾向测验一般同时测量几种能力因素,以分测验形式组成,每个分测验针对一种能力,每个测验应该是独立的,并且各分测验间的相关应尽可能低。测验的内容涉及广泛,不像成就测验那样具有明确限定的内容范围,且较少涉及与学校知识有关的内容。 由于各分测验的结果不仅要在个体之间进行比较,而且还要在个体内部进行比较,因此各分测验必须使用相同的常模样本,且应具有较高的信度。
16
测量结果解释方面的特点 被试在能力倾向测验上可以得到若干测验分数。这些分数既可以表明不同被试在每一分测验所测能力上的相对位置水平,又可表明同一被试在所测各能力上的相对优劣状况。一般能力倾向测验往往会用能力剖面图来呈现个体内差异。 由于不同工作一般需要不同的能力特长,但又往往不只需要一种能力,因此同,当用能力倾向测验预测个体在某工作上的可能成功程度时,需要解决各分测验的分数组合问题,即如何确定各种能力因素(各分测验的分数)的理想权重。针对不同工作,不同能力因素的权重应有变化。一般采用多重回归模式解决这一问题。
17
具体能力倾向测验的介绍 多因素能力倾向测验(多重能力倾向测验) 特殊能力倾向测验 专业能力倾向测验 创造力测验
18
多因素能力倾向测验 在心理测验发展的初期,人们只是运用一般能力或智力测验,再加上某些特别能力倾向测验。但是在40~50年代,多重能力倾向测验(Multi-factor aptitude test)被用来测量个体在不同领域内的技能和知识,从而为职业咨询、分类和人员安置提供最有效的信息。这种测验的结果不是一个总分或IQ,而是一组不同能力倾向的分数,它们提供了一种智能剖面图,显示出个体的强点和弱点。 多因素能力倾向测验发展的原因 多因素能力倾向测验的编制和剖面图解释 多因素能力倾向测验的特点 多因素能力倾向测验举例
19
多因素能力倾向测验发展的原因 对个体内在差异的认识 对一般智力测验特征的认识 职业咨询和分类的需要 统计学发展的影响
20
对个体内在差异的认识 智力测验产生以后,人们就开始比较被试在智力测验各项目或各分测验上的相对地位。这可以说是多因素能力倾向测验发展的先驱,不过,早期智力测验的编制,大多依据Spearman 一般因子的观点,强调测验的内部一致性,凡是项目或分测验与部分相关 低的就被淘汰。这样编成的智力测验当然不能分析个体内部差异,为此需要针对各种能力测量的多因素能力倾向测验。
21
对一般智力测验特征的认识 随着心理测验的发展,人们发现所谓的一般智力测验并非象人们假定的那样,它们测量的不过是语言理解及某些操作能力,很多能力例如机械能力其实并没有涉及到。由于智力测验的这种限制,有人将抽象与实际的智力加以区分,例如,E. L. Thorndike 将智力分为抽象、具体与社会智力 三种。而实际我们运用的智力测验只是测量语言与数学等特殊的能力倾向的组合。
22
职业咨询和分类的需要 特殊能力倾向测验对某些领域的人员选拔固然有用,但随着社会经济技术的高度发展,职业咨询和分类的要求已转向将工作人员与工作相匹配,将他们安置到最适于他们的才能的上,而不是仪在选拔最优秀的工作人员方面。因此多因素能力倾向测验远比特殊能力倾向测验要有用。而且特殊能力倾向测验常常是操作测验,而多因素能力倾向测验均为约笔测验,因此能方便地进行团体施测。
23
统计学发展的影响 从30年代起,统计学有了突破性的进展,如各种相关方法及因素分析的发展。它们不仅为多因素能力倾向测验提供了理论基础,也提供了设计方法。
24
多因素能力倾向测验的编制和剖面图解释 编制原则 分数剖面图的解释
很多能力倾向成套测验(aptitude test battery) 采用因素分析方法进行编制,如PMA等。但也有一些测验不用因素分析法,而从项目编制和确定测验变量两方面入手。如,区分能力倾向测验(DAT) 就是一个非因素分析测验。它在选择项目时,保证该项目与同一分测验的其他项目高相关,而与不同分测验的项目低相关。最后得到一组相互之间低相关的分测验。 如果多因素能力倾向测验内的各分测验是针对同一常模团体进行标准化的。那么,要想解释个体在这个测验上各分测验的分数,就必须绘制分数剖面图。但这时必须考虑到测验的测量标准误,然后才可以对各种能力倾向测验强、弱点进行解释。这样,将被试的能力倾向剖面图与某一职业群体的平均分剖面图进行比较,则有助于职业咨询、职业选择和安置。在剖面图上差异的解释不能绝对化,在能力倾向测验上的低分,也许比高分更能预测个体的作业。
25
多因素能力倾向测验的特点 典型的多重能力倾向测验,大约包含4~9种分测验,各分测验分别测不同的能力。测验结果除总分外还有各个分测验的分数,对一个人的能力可以提供多方面的说明 。 多重能力倾向测验的常模通常根据一个标准化的团体建立,因此测验结果的各分测验得分可以直接相互比较,以判定每个人在能力上的所长和所短。由于要在个人内部做比较,此种测验必须有较高的信度和较小的标准误。 多重能力倾向测验在测验时间及材料上,都比特殊能力倾向测验经济。因为特殊能力倾向测验只能测量某一种能力,并且各个特殊能力倾向测验都是各自独立编制的,各种不同测验的结果缺乏统一的统计学标准,不能直接比较和解释;相反,多重能力倾向测验在施测上可合可分,并可对各分测验成绩进行比较。 多因素能力倾向测验又称多重能力倾向测验,是多种能力倾向测验的复合体,包含着几个不同性质的分测验。它在理论上是以多因论为依据,以因素分析为基础。这类测验发展较晚,大体上说都是1945年以后编制的,这具有如下几个特点:
26
著名测验介绍 这里所介绍的几种多重能力倾向测验,都美国当前最著名的测验,有的测验在我国已经修订并建立常模。 学术能力倾向成套测验
吉尔福特—席默门能力倾向调查(GZAS) 区分能力倾向测验(DAT) 辅导性向测验(CAPS) 工业能力倾向成套测验 一般能力倾向测验 (GATB) 弗兰纳根能力倾向分类测验(FACT) 弗兰纳根工业测验 (FIT) 职业能力倾向测验 军事能力倾向成套测验 行政职业能力考试
27
学术能力倾向成套测验 学术能力倾向测验多以学生为对象进行标准化和实施,用以预测学业成就。
1.吉尔福特-齐默尔曼能力倾向调查(Guilford-Zimmerman Aptitude Survey, GZAS) 学术能力倾向测验多以学生为对象进行标准化和实施,用以预测学业成就。 2. 区分能力倾向测验(Differentioal Aptitude Test, DAT) 在二次世界大战后,J. P. Guilford 在对能力倾向测验研究的基础上编制了GZAS。该测验测量的是言语和抽象智力、数概念的熟练掌握,知觉速度与准确性。共包括七个分测验:言语理解,一般推理、知觉速度、空间定向、空间形象化、数目运算和机械知识。GZAS包括说明36分钟、测验93分钟。建立有大学团体的常 模。 DAT各测验题目范例: 言语推理: 选择一对适当的词填空以使 完整合理 。 …对于晚上,相当于早饭对于… A 晚饭– 角落 B 文雅– 早晨 C 门– 角落 D 花– 欣赏 E 晚饭– 早晨 正确答案为E 数字能力: 选择正确的答案 30 - 20 =? 15 B C D. 8 E. 以上皆非 正确答案为E 其它的例子见 郑日昌: P243 数字能力(NA)– 测量普通智力,采用计算题,不用文字题,以避免受到其他无关能力的干扰; 抽象推理(AR) – 测量非言语推理能力(亦属普通智力); 文书速度和准确性(CSA)– 测量完成一件简单知觉任务的速度; 空间关系(SR) –测量想象和在心理上操作有形材料的能力; 拼写(SP)—指出拼写正误,测量巩水平; 言语运用(LU)– 找出语法或惯用法错误,测量语言水平。 DAT由本纳特(G. K. Bennett) 等人编制,是应用最为广泛的多元性向成套测验。该测验初版于1947年,1962、1972和1981年分别修订、再版。整套测验由8个分测验组成,提供9个分数,即言语推理、数学能力、抽象推理、空间关系、文书速度和准确性、机械推理、拼写、言语应用、言语推理加数学能力。最后一项分数,可作为学业能力的指标。1972年的修订本包括S型和T型两个。1981年版包括V型和W型两个复本。 DAT具有数量惊人的效度资料,包括娄千种效度系数,大部分的资料是推测以后学业及课程表现的预测效度,有不少系数的值相当高,然而在差异的预测上结果不太理想。至于职业效标,有若干证据显示个别的DAT分测验具有预测效度,但资料相当贫乏。一些追踪研究的结果表明: (1) 在某一特定的职业领域中,DAT中有关分测验的得分与工作的成就水平之间明显的相关,例如工程师在数字能力、机械推理和空间关系三项分测验中的成绩高,技术专科学校毕业生的这三项成绩较低。 DAT测验常模来自32个州的64所公立和私立学校的6.1万名学生。标准化样本的选取采用分层取样以确保能代表美国初二至高三的学生母群,同时还考虑了社会地位、学校所在行政区及学校的规模。指导手册提供了初二到高三男女学生的百分位数及标准九常模,也可分别根据同性别或男女混合性别常模画出测验分数的剖面图。 台湾的宗亮东及徐正稳曾根据1966年版的M型修订成中学综合性向测验,北京的谢小庆等人根据1981年版的V型编制了BEC职业能力倾向测验Ⅱ型。 读学位的大学生的DAT平均分高于那些不读学位的大学生,后者的平均分数又高于不读大学而就业的人; (3) 在某些课程上表现突出的大学生,他们相应的DAT分测验成绩也较高; (4) 大学生的言语运用和词汇分测验的平均成绩高于未读大学的人。DAT的8个分测验是单独施测、单独记分的,这8个分测验是: 言语推理(VR)– 测量普通智能,采用文字形式的类比题目;
28
一般能力倾向测验(General Aptitude Test Battery, BATB)
工业能力倾向成套测验 工业能力倾向成套测验多用于工商业的人员选择与安置。三十年代,明尼苏达就业稳定化研究所(Minnesota Employment Stabilization Research Institute) 编制了最早的工业能力倾向成套测验。它包含的测验有一般智力测验及数学、知觉、机械和心理运动能力测验。它还建立了一组职业能力模式(Occupational Ability Patterns, OAPs),有文书人员、机械工人、推销员及其他职业团体的测验平均分剖面图,可作为个人比较的依据。 一般能力倾向测验(General Aptitude Test Battery, BATB) GATB由美国就业服务社(U. S. Employment Service, USES)编制。研究者们在工作分析和对59个测验因素分析的基础上,设计了GATB,主要用于职业。包括两个部分: (1) 筛选与测验前的练习:所谓筛选就是用USES的基本职业文化水平测验(Basic Occupational Literacy Test) 中的范围量表(Wide—Range Scale),对被试进行区分,找出文化水平过低,而应接受非阅读性能力倾向成套测验(Non—reading Aptitude Test Battery, NATB) 的被试。所谓测验练习就是指导被试进行对测验的适应性练习。(2) 施测GATB。 2. 弗兰纳根能力倾向分类测验(Flanagan Aptitude Classification Test, FACT GATB 共有12个分测验,8个纸笔测验和4个仪器测验,它们按照9个因素计分:智力、言语能力倾向、数字能力倾向、空间能力倾向、形式知觉、文书知觉、运动协调、手指灵活性。9个因素上的原始分数可以转换成百分等级和标准分数,其平均数为100,标准差为20。通常选择特殊职业团体作为样本,向他们施测GATB,可以得到特殊职业常 模,将类似的特殊职业常 模合并为职业能力模式(OAPs)。1984年,已经得到469种特殊职业常模,建立了66种OAPs 。一个OAP包括一套职业的最低GATB测验分数,可作为职业咨询的基础。 GATB适用于高中至成人。其重测信度和复本信度分从0.8 到 0.90。而效度研究结果最高为0.90。与DAT在教育咨询中的地位相对应,GATB是职业咨询与安置中最有效的成套测验。 由美国第二次世界大战中飞行学校学生分类成套测验(Aviation Cadet Classification Battery) 发展而来。FACT最初是14个分测验,后来增至16个,即检验,编码、记忆、知觉、集合、量度、协调、判断与理解、审美、形式、组合、表格、机械、表达、推理和精巧。最后又形成19个分测验。FACT的测验时间由最初的5个小时增至10个小时。由于时间太长而且一再改变测验内容,从而限制了其用途。 3. 弗兰纳根工业测验(Flanagan Industrial Test, FIT) 4. 职业能力倾向测验(Aptitude Tests for Occupations )
29
弗兰纳根工业测验(Flanagan Industrial Test, FIT)
FIT 包括18个分测验。是在对FACT个性的基础上形成 的。建立在与FACT相同的工作分析之上,并测量相同的工作元素。FIT需时较少。但其百分等级和标准九分数常模建立在相比FACT较小的样本上,各测验的信度从0.50到0.90,但效度证据不足。
30
职业能力倾向测验(Aptitude Tests for Occupations )
由Roeder & Graham 编制。适用于9到12年级以及成人。包括六个分数:人事管理、机械、推销、文书工作、计算及科学能力倾向。可作为参考或学生我把大学专业的依据。
31
军事能力倾向测验(AGCT) ASVAB的内容包括算术推理、数字运算、文章理解、字词知识、编码速度、一般科学、数学知识、电子知识、机械理解、自动化及工厂知识。 ASVAB的4个分测验组成了目前陆军资格测验,该测验可作所有军种所共有的能力倾向测验之用。80年代,美国国防部以ASVAB的现行题目对全国12000名18-23的男性及女性样本施测,这些人包括一般公民、军人,无论在年龄分配、性别比例、种族比例、乡村-都市居民比例及主要地理区域上都能代表全国的青年团体。另外, ASVAB也建立了高中团体的常模资料。 ASVAB的信度符合严格的心理测量学标准。个别分测验的库德-理查德逊信度系数集中在0.8附近。 ASVAB在各种适当效标上的预测效度也相当显著。从1986年起,美国军方设计以ASVAB为工具研究陆军军职人员的选拔、分类的长期计划,称“A计划”,这是一个长期追踪程序。在 年间有近5万名士兵接受了实验性质的预测性测验,此后,收集1万名被试的工作表现资料,并对其中部分人进行工作表现测量。 ASVAB所采取的编制技术路线是编制测验的典范。 在陆军甲种测验和陆军乙种测验用于军队的选拔与分类后,各种用于军队的职业测验相继诞生,有军队一般分类测验(Army General Classfication Test, AGCT)、飞行学员成套测验(ACCT)、职业能力成套测验(Armed Services Vocational Aptitude Battery, ASVAB)。其中ASVAB是由各军种联合发展出来的以供所有军种使用的综合选拔与分类测验组。 ASVAB最新的版本包含10个分测验,各军种选用各自适宜的分测验,形成适合该军种的特殊人员分类需要的能力倾向组合。例如,有军事文书、行政职业专长的能力倾向组合,也有电子修理及监视、通讯职业专长的能力倾向组合等。
32
行政职业能力考试 部分 测试内容 题数 参考时间(min) 一 知觉速度与准确性 60 10 二 判断推理 事件排序 45 常识判断 图形推理 数字推理 演绎推理 三 言语理解 词语替换 15 选词填空 阅读理解 四 资料分析 五 数量关系 合计 160 90 这是我国用于录用政府机关工作人员的多重能力倾向测验,是为了适应我国公务员制度建立的需要,由人事部考试录用司委托有关专家编制的一个职业能力测验。迄今为止,已经应用于几十个部委的干部录用,并已经被若干省用于政府机关工作人员的考试录用。其内容包括言语理解、知觉速度与准确性、判断推理、数量关系、资料分析5个部分,共180题,测试时间为90分钟。考试的内容、题目数量和时限如下:
33
辅导性向测验(CAPS) 辅导性向测是由台湾路君约和陈淑美编制的多因素能力倾向测验。为系列测验之一。它参照了生涯能力配置调查(The Career Ability Placement Survey, CAPS)的框架编制而成。主要为中等学校作辅导工作用。它包含8个分测验:机械、空间、语文推理、数学能力、语文习惯、字义、知觉速度与准确度、手部速度与灵巧度。建立有男女两性的百分位数T分数和标准九分数常模。
34
特殊能力倾向测验 艺术能力测验 专业能力倾向测验 感知觉和心理运动能力测验 机械能力测验 文书能力测验
特殊能力倾向测验是鉴别个体在某一方面是否具有特殊潜能的一种工具。这类测验最初是为了弥补智力测验的不足而编制和使用的,最早出现的特殊能力倾向测验是机械能力倾向测验。由于职业选拔与咨询的需要,各种机械、文书、音乐及艺术能力倾向测验纷纷出现,同时视力、听力、运动灵活敏度方面的测验也广泛应用于工业、军事上的人事选拔与分类。 特殊能力倾向是相对于一般智力而言的,一些传统的特殊能力倾向,如机械和文书,现在都 已并入某些多重能力倾向测验中。但特殊能力倾向测验还是很有必要的,原因有两个:一是多重能力倾向测验很少涉及视力、听力、运动技能及艺术才能等领域,因为它们的情况较特别,即便在多重能力倾向测验中包含有特殊能力倾向,如机械、文书等,有时也需要与学业能力倾向测验、特殊能力倾向测验结合使用,因为特殊能力倾向测验有广泛的常模和效度资料;二是特殊能力倾向测验具有很大的弹性,既可以结合使用,也可以单独使用。 感知觉和心理运动能力测验 机械能力测验 文书能力测验 艺术能力测验 专业能力倾向测验
35
感知觉和心理运动能力测验 一般说来,感知觉和心理运动能力测验不属于心理测验,但这些测验能提供给我们有关个体机能的重要信息,当工作成绩的高低依赖于感知觉和心理运动能力时,这种测验也是人员筛选、安置、咨询及诊断的重要依据。 内容: 感知觉和心理运动能力测验 感知觉测验 心理运动能力 大动作运动测验 小动作运动测验 大小动作运动测验
36
机械能力测验 内容: 机械能力测验 空间关系测验◎ 苏达空间关系测验 明尼苏达书面形状测验 机械理解测验◎ 本纳特机械理解测验 SRA机械概念测验 机械能力测验是最早和最经常用于工业或军事测验中的特殊能力倾向测验。有证据表明,存在着一种不明显的机械能力的一般因素,但大多数机械能力推理测验测量的能力很广泛,如视—动协调因素、知觉及空间关系能力、机械推理和机械知识等。组成分测验的各种机械能力彼此的相关都较低,但不同的机械能力分测验和总分之间具有较高的正相关。 在机械能力测验上存在性别差异,男性通常在窨和机械理解题上得高分,而女性在投入产品灵巧度与知觉辨别测验上较好,且这种差异与年龄成正比,这可能有文化因素的作用。
37
文书能力测验 内容: 文书能力测验 一般文书能力测验 明尼苏达文书测验 一般文书测验 计算机程序编制和操作能力测验
文书能力测验的特点是强调知觉速度和动作的敏捷性。但实际的文书工作中,除了需要这两种能力以外,言语和数字能力也很重要。因此许多文书能力测验包括与智力测验类似的题目以及测量知觉速度和准确性的题目。 文书能力测验又分为一般文书能力测验和测量速记能力、计算机程序编制与操作能力的测验。
38
艺术能力测验 艺术情趣在不同个体、不同文化和不同年龄之间存在着很大的差异,因此艺术能力的判断标准是很难确定的。虽然在寻找可靠标准和使用测验预测方面存在着许多问题,但从20世纪20年代起仍有许多美术能力和音乐能力的测验产生。 内容: 艺术能力测验 美术能力 艺术鉴赏和知觉测验 梅尔艺术测验 格雷夫斯图案判断测验 艺术能力操作 霍恩艺术能力倾向测验 音乐能力测验 西肖尔音乐才能测验 英国的温格音乐能力标准化测验 音乐能力倾向测验
39
音乐能力倾向测验 音乐能力倾向的分析评估 音乐成就测验 音乐成就测验主要用于测量参加或选修音乐课程的大专学生学习成绩。有两种水准:
西肖尔音乐才能测验 温格音乐能力标准化测验 音乐能力倾向测验 音乐成就测验 音乐成就测验主要用于测量参加或选修音乐课程的大专学生学习成绩。有两种水准: 阿利菲利斯音乐成就测验 阿-斯音乐成就测验
40
职业能力倾向测验 这类测验用于医学、法律、工程、牙医、教学、会计、护理、神学等专业选择受训人员或学生。有人认为这就是能力倾向测验。但也有认为是成就测验,因为其内容的材料与技术,主要是专业前的课程所学习的。总之,这类测验并非测量其他测验所未测量的特殊能力;而是测量高等教育和专业工作所需要的一般心理能力,以及从事某种专业工作需要的知识、技能和方法。同时,这类测验需进行地区效度研究,因为各地区的课程、教学标准、学生素质都有很大不同。 新医学院入学考试 牙医入学测验 护理学校入学考试 法学院入学考试 工程与物理科学能力倾向测验 教学能力倾向测验
41
专业能力倾向测验 前面介绍的多重能力倾向测验和特殊能力倾向测验多用于职业指导及一般性的职业选拔。测验还常用于各专业人员选拔和专业资格鉴定,这些测验称为专业能力倾向测验。 内容: 专业能力倾向测验 专业选拔测验 资格考试 心理学家资格考试和执照授予 美国护士资格考试
42
感知觉测验 某些学校或工作部门的成绩受个体听觉和视觉的影响,在这种情况下,可采用感知觉测验筛选出视力或听力不足的人,作为其他测量工具的补充。
感知觉测验又分为单一目的(单一目标)的测验和多重目的(多目标)的测验。前者指每种测验只测量一种功能,后者指测量综合的感知觉能力的测验。单一目的的测验包括:视觉敏度测验、听觉敏度测验和颜色视觉测验。 综合的感知觉能力的测验通常是给成套刺激以确定视觉,需要大约三到六分钟。如B-L视觉测验共分四类:双眼肌肉平衡、左右眼和双眼视敏度、深度知觉(立体感)和颜色辨别。弗劳斯蒂格(M. Frostig)编制的视知觉发展测验(Frostig Developmental Test of Visual Perception, DTVP), 是测量幼儿感知觉发展的一套绝笔测验,特别适合于有学习困难或有神经障碍的儿童。 DTVP已在全球范围内施测了三亿多儿童。 DTVP包括五个领域:眼动协调、图案背景恒定性、形状知觉、空间位置和空间关系、分数以知觉商数表示。
43
弗劳斯蒂格(M. Frostig)编制的视知觉发展测验
Frostig Developmental Test of Visual Perception, (DTVP) 适用于3岁到8岁的儿童,是一个知觉测验组合。它包括一些纸笔式分测验,尤其适于评估有学习困难或神经障碍的儿童。它是弗劳斯蒂格知觉发展和矫正计划中的诊断工具,可以得出五个分数:眼动作协调、形状背景常性、形状、空间位置、空间关系。分数用知觉商数表示。
44
心理运动能力测验 心理运动能力测验测量的是个体意识支配的精细动作的能力。这类测验专门测量速度、协调和运动反应等特性,大多与手的灵巧性有关,也有一些涉及腿或脚的运动。这是一种比较早的特殊能力测验,在20年代,这种测验广泛应用在工作和职业成绩的预测上。后来,美国空军人事和训练研究中心设计了心理运动能力的综合分析方法,并把有些技能容纳到飞行员训练和空战模拟中。从50-70,弗莱西曼(E. A. Flishman) 及其助手对心理运动能力测验进行了认真的研究。结果表明,心理运动能力很特殊,这种能力的操作测验和纸笔测验之间的相关、运动的速度和质量之间的相关都很低。从各种测验的相关中,弗莱西曼发现了11种心理运动因素,它们是:瞄准、手臂稳定,准确控制,手指敏捷,手工操作敏捷上,四肢协调,速度控制,反应时,反应倾向,手臂运动速度,腕、手的速度。他还发现心理运动能力测验的信度低于其他特殊能力测验,原因可能是这种成绩较易受练习或初中的影响。此外,从初级练习到被试基本熟练的过程中,这种测验在心理运动因素上的负荷是显著变化的。可见,心理运动测验的分数及意义都要受到练习的影响。
45
心理运动能力测验 心理运动能力测验又分为大幅度运动测验、精细运动测验及二者结合的测验。大多数这类测验是速度测验,其分数与完成任务的时间有关,且对于青少年和成人都适用。一般这种测验都要借助于仪器,但也有纸笔形式的。有些纸笔测验的预测效度较好,但目前有证据表明,用来测同一种运动能力的纸笔测验和仪器测验之间几乎没有相关。 举例: 大的手部运动 A:Stromberg Dexterity Test B: Minnesota Rate of Manipulation 小的手部运动 A:O’ Connor Finger Dexterity Test 及O’ Connor Tweezer Dexterity Test C: Purdue Pegboard D: Crawford Small Parts Dexterity Test 大小手部运动 A:Bennet Hand-Tool Dexterity Test B: Pennsylvania Bi-manual Work sample
46
Stromberg Dexterity Test
斯乔姆伯格灵巧测验,(E. L. Stromberg编制)。要求被试尽可能迅速地将54个饼干大小的彩色圆盘(红、黄、蓝)按指定的顺序排列。被试完成练习及两个实际测验大约需5-10分钟。测验手册中列出了分数分布(完成再次实际测验所需时间),样本为铸造厂铸模工人,装配与熔焊工人,普通工厂工人。
47
Minnesota Rate of Manipulation
明尼苏达操作速度测验是一种手工敏捷测验。于七年级至成人。测验材料是一块有60个洞的木板和一头红一头黄的木栓。测验分为五个总分,每一部分约需10分钟:安置测验、翻转测验、撤换测验、单手翻转和安置测验、双手翻转和安置测验。在这些部分中分别要求被试将木栓按规定方式翻转,转动和安置。
48
O’ Connor Finger Dexterity Test 及 O’ Connor Tweezer Dexterity Test
奥康纳手指灵活性测验和奥康纳镊子灵活性测验,要求被试用手指或一对镊子将很小的铜钉放入一个纤维板的小孔中。这两个测验都适用于14岁以后的个体。
49
C: Purdue Pegboard 普度木钉板测验适用于九年级至成人。以五种任务来测量手部灵活性和精细手部灵活性。第一部分将铜钉插入洞中,先用右手,再用左手,最后用双手。第二部分,被试将钉插入洞后,随垫圈和套管放在钉上,然后再插第二个铜钉,一直作下去。全部测验需时5-10分钟。常模样本为机器操作员、制造业工人、工厂求职者、包装工人等。
50
Pennsylvania Bi-Manual Work Sample
宾西法尼亚双手工作样本要求被试将100个螺丝帽旋到100个螺丝钉上,然后将它们插入8×24英吋的木板上的小洞中。
51
Crawford Small Parts Dexterity Test
克劳福德小部件灵活测验有两个部分。在第一部分要求被试用用小镊子将钉子插入小孔中,并给每个钉子套一个小环;第二部分,将小螺丝放入螺纹孔内并用螺丝刀将其拧紧。常模样本为10组求职和雇员。测验的分半信度为0.85。两个部分的相关为0.40。
52
Bennet Hand-Tool Dexterity Test
本奈特手-工具灵活性测验也要求用螺丝和螺丝钉。被试将工具箱左边板上的三排大小不等的12个螺丝帽和螺丝钉松开取下,然后再把他们装在右板上。测验分数以完成任务的时间计算。常模样本为各种工种团体的求职者。
53
空间关系测验 在20年代后期,帕特森(D. G. Paterson)及其同事在明尼苏达大学对机械拼命测验(Minnesota Mechanical Assembly Test)、明尼苏达空间关系测验(Minnesota Spatial Relations Test)和明尼苏达书面形状测验(Minnesota Paper Formboard Test). 第一个是工作样本测验,要求被试拼排随机排放的机械物体,测量动作敏捷性、空间知觉和机械理解,后两种测验为空间知觉测验。要机械职业中已经发现,空间知觉是非常重要的因素,这种因素主要测量立体视觉及空间操作产生某种具体形状的能力。 明尼苏达空间关系测验 明尼苏达书面形状测验(即纸形板测验)
54
明尼苏达空间关系测验 Minnesota Spatial Relations Test,该测验由M. R. Trabue等修订。包括A. B. C. D四块板,两套几何形状的木块,一套插在A板和B板的凹陷处,另一套在C板和D板的凹陷处。测验开始时,这些木板是零散摆放的,被试的任务是检起木块并尽可能快地放入板中的特定凹陷处。做完一板后,将A板移去,将剩下的木块放入另一块板。一般需要10-20分钟,记录所需时间及错误。该测验有16岁至成人的常模。信度高达0.80以上。与工厂工作的相关在0.50左右。
55
明尼苏达书面形状测验(即纸形板测验 Minnesota Paper Formboard Test由R. Likert & W. H. Quasha于1970年修订,到1983年为止有关此测验的研究论文达215篇之多,是相当受重视的测验。它虽然 是为了简化原版测验的施测程序而编制的,但两者的相关并不高。此测验彩多重选择题的纸笔形式,共有64个选择题,每题包括一个分解几何图形题和五个拼凑成整体的选项图案,要求被试在五个选择中找出一个,正好为分解图案拼凑成整体的形状。测验的复本信度为0.80到0.89,已经证实可以预测工厂和工程学科的成绩,并且与检验、馐、机械操作等职业的实际成就与上级评定相关很高。测验分数也与牙医及美术成就相关。我国萧崤嵘曾经修订。
56
机械理解测验 所谓机械理解测验(mechanical comprehension test)是指对实际情境中的原理的理解能力的测量。
本纳特机械理解测验 SRA机械概念测验
57
本纳特机械理解测验 Bennett Mechanical Comprehension Test (BMCT), 是G. R. Bennett等编制的。适用于9到12年级,测量的是对实际情况中的机械关系和物理定律的理解能力。项目是一些能体现这种交通系统和定律的图画和问题。时间限制在30分钟。其百分位数的常模团体为工业工作的申请者、工厂的在职人员、学生。测验有两种形式(S型和T型)。信度在0.80-0.89。由于女性的平均分数与测验信度都低于男性一,因此需要两性常模。BMCT的效标关联效度在0。30-0.60之间。它在特殊能力倾向测验中属于较好的。它的一种形式包括在DAT中,后者也许是最常用的机械能力测验。
58
SRA机械概念测验 SRA Test of Mechanical Concept 由S. S. Stanard & K. A. Bode编制。适用于高中至成人。测量个体对力学及机械关系的基本了解。它包括三个分测验:机械关系、机械工具及使用、空间关系。测验有A、B两种形式,无时间限制。小样本的研究发现该测验对机械修理工、操作工、汽车修理工是有效的。百分位常 模的工业样本分地区和种族,教育样本分地区和性别。
59
一般文书能力测验 商业上用的一般文书能力测验,内容差别比较大,简单的如明尼苏达文书测验,只要求数目和姓名的核对工作,复杂的如一般文书能力测验,要求一般智力与知觉运动任务的结合。 明尼苏达文书测验 一般文书测验
60
明尼苏达文书测验 Minnesota Clerical Test 适用于8-12年级的学生以及成年人。主要目的在于选取文书人员、校对人员、能迅速知觉和操作符号的专业人员。测验分成两个部分:数字比较和姓名比较。要求被试核对200对数字、200对姓名是否匹配。前者,如11208-11208;393-6717~398-7617;后者如,cynthia~cynthia, John C. Linder~John C. Lendev。测验得分为正确题数减去错误题数。其重测信度为0.7-0.8。百分位常模分性别与不同年级(7-12年级)。有文书工作人员和求职者的常模。与教师和上级评定有中等相关。
61
一般文书测验 General Clerical Test 分为九个部分,可以得到三种能力分数:文书速度与准确性、数字能力和语言能力。全测验需47分钟,其1972年的手册中提供了12种不同工商业工作的常模,商业学校与高中学生常模。其他一般文书测验如SRA出版的SRA文书能力倾向测验(SRA Clerical Test)可得办公室词汇、办公室算术、办公室核对三个分数。
62
计算机程序编制与操作能力测验 由于计算机进入越来越多的办公室,对文书人员的计算机编程和操作能力要求越来越多。于是,心理学家们就编制了测量计算机编程能力的测验。如J. M. Palormo编制的计算机程序员能力倾向测验(Computer Programmer Aptitude Battery).该测验包括语言意义、推理、字母序列、数字能力、制图能力共五个分测验。需时75分钟,多用于评估和选择学习计算机课程的申请者。 心理学家们还编制了测量计算机操作能力的测验,如A. G. Hollowy 编制的计算机操作人员能力倾向成套测验(Computer Operator Aptitude Battery)。测验包括顺序辨认(迅速辨认顺序的能力)、形式核对(发现数字、字母、版式之间一致的能力)逻辑思维(根据逻辑分析、解决问题的能力)三个分测验。测量个体学习操作计算机的能力倾向。测验需时45分钟。百分位常模依据的是有经验的计算机操作人员和无经验的申请者和受训人员。
63
美术判断与知觉测验 梅尔艺术测验(Meier Art Tests)
N. C. Meier 编制,它包括两个分测验,A为美术判断测验,1929年出版,B为美学知觉测验,于1969年出版。A包括10对著名艺术品的图片,其中一张是另一张稍稍改动的形式,要求被试判断哪一张更好。百分等级常模分初中、高中和成人三种。分半信度0.70-0.84。与美术班成绩或美术创作成绩的相关为0.40-0.69。B包括50个项目,每个项目为一件艺术品的四种形式,每一种形式相对于另外三种在比例、整体性、形状、设计及其他特征上有所不同,要求被试按其优劣排出等级。对A的研究较多,对B的研究较少。 格雷夫斯图案判断测验 (Graves Design Judgment Test)由M. Graves编制。由90套二维或三维窨抽象图案组成,每套包括二至三个同一图案的变式,它们在整体性、平衡性、对称性及其他艺术特性上有所不同,要求被试判断哪一种形式是最好的。测验的时间限制在20到30分钟,适用于高中以上个体。分半信度为0.80-0.90,但效度证据不多。
64
美术作业能力测验 这一方面的代表是霍恩艺术能力倾向问卷(Horn Art Aptitude Inventory).由C. A. Horn编制,适用于7-16年级。是美术学院选择学生的测验,被试多为受过某种程度的训练。该测验是美术能力的工作样本测验。由两部分组成:(1)要求被试画出20种常见的物体或几何图形;(2)要求被试在方框规定的基本线条内作图。这一测验与美术老师对作业的评价间相关为0.53,与高中美术课教师的评分相关为0.66。
65
西肖尔音乐才能测验 Seashore Measures of Musical Talents,由美国爱荷华大学C. Seashore等编制。该测验是一组音乐旋律,它以磁带或唱片的形式呈现,评估听觉辨别力的六个方面:音高、响度、节拍、音色、节奏和单调记忆。西肖尔等认为这些能力是音乐全面发展的基础。测试的过程是向被试呈现一组两个旋律的音高,音强,长短,判断两个单调的音色是否相同,两种节奏的异同,或某种音符在两种单调顺序中有所不同等等。西肖尔测验适于四年级到成人,每个测验约10分钟,全部做完共约1小时。分半信度为0.55-0.85。研究发现测验与音乐训练效率相关为0.32-0.40。特别值得一提的是,测验的音高辨别分测验已经在某些早年及民用职业的听觉测验中运用。
66
温格音乐能力标准化测验 Wing Standardized Tests of Musical Intelligence由H. D. Wing编制,适用于8岁到17岁儿童。以钢琴音乐为材料,按以下8个方面记分:节奏(哪个节奏较好)、和声(哪个和声更好)、记忆(哪个音符有了改变)、音调变化(一个重复和弦中音调变化的方向)、和弦分析(和弦中音调的数目)、强度(哪个部分适于被强调)、分节法(哪一种分节方式更好)、总分(对音乐的总体评价)。测验以录音带方式呈现。除音乐年龄外,常模还以A、B、C等级表示。信度系数幼儿为0.70,较大年龄儿童为0.90。效度研究很少,对11岁儿童的音乐能力的教师评估与该测验分数有0.60相关。
67
音乐能力倾向测验 Musical Aptitude Profile由E. Gordon编制,适用于4到12年级学生,约需时2小时。该测验以磁带呈现,金属制造50个原版的大提琴与小提琴短曲。不要求被试有音乐知识或任何音乐方面的个人史因素,所测量的三种基本音乐因素为:音乐表达、听知觉、音乐运动觉。测验包括三个分测验:T测验针对音调意象(旋律、和声)、R测验针对节奏意象(速度、节拍)、S测验针对音乐感受(短曲、平衡和风格)。前两个分测验有正确答案,后一个分测验彩多重计分,要求被试回答两个录音带的音乐哪个更具韵味。Gordon对该测验的预测效度曾作三年的追踪研究,对82上班的241名四、五年级的学生施测,然后每周给他们上一次音乐课,结果发现与儿童音乐演奏水平的相关一年后为0.59,三年后为0.74。
68
音乐成就测验 Aliferis Musical Achievement Test由A. Aliferis 编制,为大学入学水平测验,为筛选音乐系一年级新生用。可以得到四个分数:旋律、和声、韵律、总分。 Aliferis & Stecklein Musical Achievement Test由A. Aliferis 和 S. Stecklein 编制,用于大学音乐系学生。在他们二年级末、三年级初时予以测验。该测验的小标题为“听觉辨别量表”,有四个分数:旋律音程、和弦、韵律、总分。
69
新医学院入学考试 New Medical College Admission Test 开始时有四个分数:语文、数学、社会(经济、社会、政治)、自然科学(物理、化学和生物)。现在改为六个分数:生物、化学、物理、科学问题、技术分析(阅读、教学)、科学知识。可以组成四个部分,科学知识、科学问题,阅读技能分析,数学技能分析。
70
牙医入学测验 Dental Admission Testing Program 是由牙医能力倾向测验计划修订的测验。有六个分数。测量数学推理、语言推理、自然科学、知觉能力等方面。
71
护理学校入学考试 Entrance Examination for School of Registered Nursing包括语言能力、数学能力、生物学、物理学、阅读技巧、学校能力、算术能力(数学分测验前半总分)七个分数。
72
法学院入学考试 法学院入学考试(Law School Admission Test)是美国法学院入学考试,由美国律师学会主办,每年二、四、六、十月共举行四次,新的计分为120到180分。LSAT是录取学生的重要依据。
73
工程与物理科学能力倾向测验 Engineering and Physical Science Aptitude Test包括数学、设计、基本物理知识、言语理解、算术推理和机械理解共六个方面。
74
教学能力倾向测验 这一方面的最早的测验是Moss 等编制的教学能力倾向测验(Teaching Aptitude Test),适用于12到16年级学生。而最著名的是由美国教育测验服务社(ETS)所编制的国家教育检查程序(National Teacher Examination Program, NTE),该测验分成两部分:(1)NTE核心测验(Core battery), 它包括沟通技巧、普通常识、专业知识;(2)NTE教学领域测验(Teaching Area Examination):它包括26种学科的测验。
75
专业选拔测验 专业选拔测验可用于选拔那些适合的人员接受专业训练,如普通医学、牙医、护理、法律、商业工程、神学、建筑等专业学校的学生。
常用的有: 新医学院入学考试 牙医入学测验 护理学校入学考试 法学院入学考试 工程与物理科学能力倾向测验 教学能力倾向测验 这些测验在职业能力倾向测验中已经介绍,这里不再赘述。
76
资格考试 资格指地位、声望、阅历和从事某种活动应具备的条件、身份等。
专业技术资格指可以独立从事专业技术工作的条件与身份。实际 上是一种实力,金属制造学历、工作实绩与经验、信誉、社会关系(公众承认度)等可在工作上产生效益的实力,获得资格的人实际上是获得了就职、升迁、流动、独立开业等权力。 标准化测验可用于资格和执照鉴定,这些测验侧重于测量专业知识的成就测验,但也包含一般能力测验。在美国,这种测验著名的有教育测验中心编制 的国家教师考试(National Teacher Examination,NTE),主要用于即将成为教师的人的专业准备性,以便发给证书,以此作为允许进入更高等的师范学校接受教育的资格。 下面是两种美国专业资格考试 心理学家资格考试和执照授予 美国护士资格考试
77
心理学家资格考试和执照授予 在美国,各州对心理学家资格考试与执照授予的基本要求大致相同,必须具备心理学博士学位加上指导经验(通常一年到两年),参加的考试是全国统一的专业心理学家执业考试(Examination for Professional Practice in Psychology,EPPP),由美国州立心理学协会的考试委员会(Examination Committee of the American Association of State Psychology Board)主办,专业考试部(Professional Examination Service)技术协助。这项测验包含了心理学的实际知识及方法学内容,同时也要求心理学家的道德原则及相关的专业、政府与心理活动规定等。 一般这种考试最合适的效度是内容效度,原因在于很难在已获得执照开业的心理学家身上获得相同的效度资料。这也是其他资格考试中共同的问题,因此一般资格考试所提供的效度资料都是内容效度。一般来说,资格考试所获得的资格或执照,都是一般性的执照,代表的是达到专业业务所需的最低要求。较高层次的认可由美国专业心理学会(American Board of Professional Psychology, ABPP)执行。刚开始时ABPP授予三个领域的文凭:临床、咨询和工业组织心理学,后来又增加了学校心理学、临床神经心理学、法律心理学及临床催眠。
78
美国护士资格考试 美国护士资格考试由全国州护理委员会联合会负责组织。该联合会建立于1978年,其中每个委员皆由所在州立法机关授权。联合会职责既包括护士管理,也包括护士考试及录用。美国的护士考试分“注册护士”与“经验护士”两种,前者的应考资格为具有学位或州护理委员会批准的护理教育课程毕业文凭,而后者有一定年限的护理经验即可报考。两种护士只可担任指定的部分护理工作。经验护士的工资只是注册护士的一半。这种考试所得到的效度也是内容效度。
79
创造力测验 1950年Guilford在美国心理学年会上作了题为《创造性》的著名演讲。他提出智力操作中存在聚合与发散思维两种不同类型的思维:聚合思维(Convergent thinking)是指利用已有的知识经验或传统方法来解决问题的一种有方向、有范围、有条理、有组织的思维方式;发散思维(Divergent thinking)是既无一定方向又无一定范围的由已知探索未知的思维方式。他认为发散思维在行为上主要表现出3种特性: 流畅性:面对智力任务能在短时间内作出迅速而众多的反应。 变通性:思维灵活多变,触类旁通,不受传统思维或心理定势的影响,能多方位地思考与解决问题。 独特性:对事物能表现出不同寻常的新颖见解。 Guilford 将发散思维的特性视为人的创造性活动的特性。并因此将创造力定义为发散思维 的能力,即对规定的刺激旌大量的、变化多端而又独特的反应的能力。他指出现有的智力测验注重聚合思维的测量,不鼓励被试作出多样化的与众不同的反应,因此,被的的创造力在智力测验中无法得到充分的反映。 Guilford 的研究得到很多学者的共鸣。此后许多创造力研究者都遵循他的研究思路继续研究。 现在一般认为,创造力是一种特殊的能力,具有高度的实用价值,但对这一能力的性质、范围、测量方法、与其他心理特质的关系并没有公认的理论。大多数研究者认为它不是单一的能力,而是包括许多不同的能力因素。首先创造力与智力有关。创造力高的人一般智商也高。但是当智力高于平均水平时,创造力与智商间的相关便显著下降。这时个体的创造力不太受智力高低的影响,而与兴趣、价值观、人格、知识、认知偏好等有关。因此,创造力的发展一表现,除了与认知成分有关,还受非认知成分的影响。 对创造力测量的研究时间并不长,至今没有出现令人满意的工具。现有的一些测验,如Guilford的发散思维测验系列、Torrance的托伦斯创造性思维测验、Rookey 的宾西法尼亚创造倾向评估,都属于尝试性的研究工具,效度证据多为表面效度,缺乏效标关联效度和结构效度的证据。
80
吉尔福特发散性思维测验系列 Meeker(1969)提研究发现,WISC并不涉及发散性思维,SB中仅有9%的项目的与发散思维有关。Guilford 认为在传统教育上也是如此。创造能力并不被重视。他意图宣传创造能力的重要性一,并设计了不少测验来测量发散性思维。这些工作是他多年在南加州大学研究计划的主要部分。其发散性思维测验,是在智力结构模型发散性思维基础上设计的,到目前为止,已为14种这方面的特殊能力设计地专门的测验。其中前9个测验要求言语反应(M),后4个测验为图形内容(F)的非言语测验。测验一般适用于初中水平以上的人,从思维的流畅性、变通性和独特性3个方面评分。分半信度在0.60-0.90之间,测验手册中报告了每个测验的因素效度,但缺乏效标关联效度的数据资料。但这些测验并未经过系统的标准化程序,有很多不足之处。 举例: 故事命名(Plot Titles): 让被试先阅读一段的故事,然后为该故事命名。 结果(Consequences):列举鞭种假设事件的所有不同的结果。例如,“如果人们不需要睡眠会产生什么结果?”。答案可能是:粮食消耗更多,住房可以缩小(因为不需要卧室)。 表达流畅性(Expressive Fluency): 写出四个词的句子,每个词以给定的字母开头,例如,“K-U-Y-I”,答案可能有:Keep up your interest, keep using your instrument……。
81
托伦斯创造性思维测验 在标准化方面,此测验有若干个样本,大小不一。年龄则包括儿童与成人,各样本来自不同地区,但并不是代表性样本。在信度方面,测验的评分者信度略低。复本信度据一般研究的报告多在0.7-0.9之间。而言语作业的信度又高于图形作业。重测信度在0.70到0.80。在效度方面,测验手册中的虽然惧了不少这方面的数据,但数据显示其结构效度和效标关联效度相当薄弱。因此,这一测验需进一步系统研究。 托伦斯创造性思维测验主要有三套测验,每套皆有两个复本。 言语创造性思维测验(Thinking Creatively with Words) 图象创造性思维(Thinking Creatively with Pictures) 语词声音创造性思维( Thinking Creatively with Sounds and Words ) 该测验是由美国前明尼苏达大学教育心理学系主任E. P. Torrance在教育情境中发展起来的。主要考察流畅性、灵活性、独创性、精确性这几个变量。包括12个分测验,适合于幼儿园直至成人被试,可以团体施测,但对于四年级以下的被试须个体施测。托伦斯创造性思维测验手册中对评分标准与方法有详细的规定,并举例说明。测验的结果以T分数表示。 在对一个人的创造力进行评价时必须将流畅性、灵活性、独创性、精确性等记分进行综合考虑。
82
言语创造性思维测验(Thinking Creatively with Words)
由7个不同的作业组成,按流畅性、变通性、独创性记分。 询问(asking)呈现一张图画,要求列出为了解图中之事而需要询问的所有问题。 猜测原因(Guessing causes)列举图中之事发生的所有可能原因。 猜测结果(Guessing consequences)列举图中之事的所有可能的后果。 产品改进(Product improvement)对给定玩具提出改进意见。 不寻常用途(Unusual uses)列举某物不同寻常的可能用途。 不寻常问题(Unusual questions)对活动5中所示物体提出不同寻常的疑问。 假设(Just suppose)列举一种假设事件的所有可能后果。
83
图象创造性思维(Thinking Creatively with Pictures
包括3项活动,皆根据基础图案绘图,可得到流畅性、灵活性、独创性、精确性由个分数。 图象构建(Picture construction)以明亮的彩色曲线为起点,建构一幅故事画。 图象完成(Picture completion)利用所给的少量不规则的线条画出物体的略图。 平行线或圆(Parallel lines or circles)利用成对的平行线条(A本)或圆(B本)绘出尽可能多的不同的图形(中以圆代替平行线)。
84
语词声音创造性思维 ( Thinking Creatively with Sounds and Words )包括2项活动,皆为言语性反应,对刺激作自由想象,并写出联想到的有关物体或活动。根据反应的罕见性记分。 声音和形象(Sounds and images )要求被试对熟悉和不熟悉的声音刺激作出想象。 拟声和形象(onomatopoeia and images)要求被试围绕10个诸如:“嘎吱嘎吱”等模仿自然的象声词展开想象。
85
霍恩艺术能力倾向测验 Horn Art Aptitude Inventory,由C. A. Horn编制,适用于7-16年级。是美术学院选择学生的测验,被试多为受过某种程度的训练。该测验是美术能力的工作样本测验。由两部分组成:
Similar presentations