Presentation is loading. Please wait.

Presentation is loading. Please wait.

第二章 体育测量与评价的基础理论.

Similar presentations


Presentation on theme: "第二章 体育测量与评价的基础理论."— Presentation transcript:

1 第二章 体育测量与评价的基础理论

2 第一节 体育测量的基础理论 体育测量是体育教学、运动训练和体育科研的重要基础。只有实施科学的测量,才能获得准确而可靠的数据,并通过分析和研究,得出科学的结论。

3 一、体育测量的基本概念 (一)测量 体育测量具有广泛的含义,不仅包括物理量的测量,如身高、体重、跳高高度、跳远长度、血压等,而且包括非物理量的测量,如技战术水平、疲劳程度、心理素质、身体素质等。 史蒂文斯曾说,广义而言,测量是根据法则给事物赋予数量。也就是说,用一定的法则给事物属性指派数字或符号的过程即为测量。 体育测量是指依照一定的法则,对体育领域中事物的属性或特征赋予数量的过程。

4 (二)测验 为了某种测量目的所进行的一系列测量构成的系统称为测验。与测量相比,测验具有完整性,强调的是系统性,一次测量未必就完成了一次测验,可能只是一次测验的一部分,当然一次测验可能只要一次测量,也可能需要多次测量,取决于测验的设计。

5 (三)测量的要素 1.待测属性或特征 测量的目的是通过测量值反映事物的属性或特征,那么“待测事物的属性或特征是什么?”,是首先必须明确的问题,也是最重要的问题,所以待测事物的属性或特征是测量的第一要素。在体育实践中,事物的属性有些很简单、直观,而有些却很复杂、抽象。

6 2.法则 待测属性明确之后,接着任务是如何去测量该事物的属性或特征,这就需要制定一套能有效衡量事物属性的规则和尺度,或是能显示事物属性的程序,即测量法则。

7 3.数字符号 测量是对事物的属性或特征数量化的过程,测量结果需要用数字符号来表示。

8 (四)测量量表 测量量表是指测量所获得数据属性的表述规则(反映表示测量结果的数字符号的性质和类型)。这个表述规则是由实数列的诸特性所决定的。即实数列的三种特性:顺序、距离、原点。具体的说,两个以上的实数有顺序之分,两个实数之间的差距可以用距离描述,原点是对应于零位数的那一点。 一般地,根据量表中含有实数列特征的多少,我们将量表分为四类:

9 1.名称量表 名称量表,又称定类量表或分类量表。名称量表实所有量表中最简单的一种,它只能依照某种法则给事物或属性指派名称或类别。它不含实数列中的任何特征,量表中的数字只起着表示符的作用,用来区分和归类所研究的对象。如足球运动员的一个号码……

10 2.有序量表 有序量表又称定序量表或顺序量表。它含有实数列的第一特性――有序性。如比赛名次表中的第一名、第二名,第一要优于第二等。但不能确定好多少,能力上的偏差也不能从名次上的差异来确切反映。

11 3.等距量表 等距量表亦称定距量表,它含有实数列的第一和第二两个特征,即有序和距离。能反映事物的属性或特征的差异大小程度。不仅能回答“好坏”的问题,还能回答“好多少”的问题。但因为没有绝对零点,所以不能用于数值之间的倍率的比较。

12 4.比例量表 比例量表也称定比量表或比率量表。它含有实数列的全部特征,可以表示两个事物特性的差异程度,而且也可以说明它们之间的比率。属于高级量表。

13 (五)测量的类型 测量的分类方法较多,按照不同的分类标准,就有不同的分类,常见的测量类型有:

14 1.按测量方法分类 直接测量:直接获取数据,如身高、体重、跳远距离等 间接测量:获取间接数据,如下肢爆发力通过立定跳远获取间接数据来反映。

15 2.按测量属性分类 物理量测量:直接测量物质的实体,获得其物理特性的定量数据。如身高、跑速、血压等属性的测量。
非物理测量:指测量抽象、复杂的属性,获取非物理特性的数据。如疲劳程度、技战术水平、心理素质等的测量。

16 3.按测量的组织形式分类 连续性测量:是指在连续的一段时间内,对固定对象的某种属性或特征所进行的定期性测量。反映纵向发展变化的规律。
横断面测量:是指在规定的时间内,对各个年龄组的某种或某些指标所进行的一次性测量。显示纵向发展变化的规律。

17 (六)体育测验的类型 在体育领域里,由于运动现象的复杂性,体育测验有其特殊性。有些测验需要多个测试者同时对某一个受试者进行测量,有些测验需要对受试者进行多次重复测验。

18 1.按测试者人数分类 单个测试者的测验:如身高 多个测试者的测验:如体操比赛中,6位裁判同时对某个运动员评分… 2.按重复测量次数分类 测试本身所安排的重复测量次数位测验的频数。根据频数大小,测验可分为“频数等于1的测验”和“频数大于1的测验”。

19 (七)测量误差 体育测量中,由于测量仪器精度、测量技术、测量方法与条件等限制,使得实测值与被测值之间会有一定的差距,出现各种测量误差。所谓测量误差,是指与测量目的无关的变因产生效应,所引起的观测值与真值之间的差异。由于测量误差在所难免,所以没有绝对准确和毫无误差的测量。

20 测量误差可以使用下式表示: E=X-T (2-1) 式中:E-表示误差;X-表示测量结果;T-表示真值。 所有的被测事物或现象在特点的条件下,理论上都有一个对应的客观、实际值存在,我们称之为“理论真值”。它只是个理想的概念,这在误差理论研究中非常重要。为了进一步理解体育测量的误差,可认为地把体育测量过程分为三个子过程。

21 1.测量过程的分解 测量的目的在于了解被测事物或现象的真值。根据测量真值的近似可知性和体育测量的推测过程的基本特点,可把测量过程分解位以下过程: 式中:X-指标测量值;T1-现象真值;T2指标真值;T-待测真值。 (1)第I过程:由测量值推测现象真值的过程。 (2)第II过程:由现象真值推测指标真值的测量过程。 (3)第III过程:由指标真值推测属性的过程。

22 2.测量误差的分解 公式(2-1)给出了总测量误差,即由测量值推测真值存在的误差。依据测量过程的分解,可以将总误差分解位测试者误差、受试者误差和指标误差三部分。 测试者误差:在第I过程中,现象真值(T)是确定的,而测量值(X)与之有差异,很明显,误差来源是测试者。第I过程中的测量误差称为测试者的误差。

23 受试者误差:在第II过程中,相对于T1来说,T2是确定的。该过程的误差表现为现象真值与指标真值之间的差异。造成这种误差的原因有受试者本身、测量方法以及测试条件等多方面,但该误差最终是通过受试者表现出来的,所以该过程的误差称为受试者误差。 指标误差:第III过程是通过指标真值去推测属性的过程,其误差大小主要决定于指标能否真实地反映测试属性。如果测量指标中含有非待测属性的因素较多,那么该过程的测量误差较大。所以,这一过程的误差主要来源于测量指标,有被称为指标误差。

24 以上所述为一般性的测量过程和测量误差的分解,在实际应用中,具体到某一次测验,可能没有三个过程,测量误差也可能不需要考虑三部分。例如,标枪我们一般不考虑测试者误差,而主要考虑受试者误差;而体操、武术等主管评分项目的比赛中,人们往往关心的是测试者的误差。

25 测量理论的主要任务是如何使测量具有科学性和可操作性,其中科学性就是控制测量误差,使测量误差尽可能小,所以分析测量误差的来源、衡量测量误差大小是其重要内容。由于待测真值是未知的,直接计算测量误差是不可能的,只能借助测量值去间接衡量。一般来说,测量误差的来源很多,笼统地衡量总测量误差是很困难的,借助于测量误差的分解,可以就测试者误差、受试者误差和指标误差分别进行度量,从而得到对总测量误差的整体衡量。 出于对测试者的误差、受试者误差和指标误差的间接度量,导致了测量客观性、可靠性和有效性的产生。

26 二、体育测验的客观性 (一)客观性的概念 客观性是间接衡量第I过程中测量误差(测试者误差)大小的一种量度。所谓间接衡量是指不同测试者对同一受试对象同时测量,通过测量结果的一致程度来衡量测试者误差大小。直观上看,如果测试者误差小,那么由不同的测试者对同一受试者实施测量时,会得出极为接近的测量结果,即所有测量值应具有较高的一致性;反之,如果不同测试者测量结果的一致程度低,则说明测试者的测量误差大。如果某一项测验的测试者误差小,则该测验的客观性高;反之,测验的客观性低。所谓客观性,一句话是指不同测试人员对同一批受试对象实施同一测量或实验手段,其测量结果的一致性。这种一致性,是用客观性系数进行描述的。 客观性常见于一些主观评分类项目,也就是常常那些采用专家评定方法对某些定性指标进行评价时,对不同专家评定结果的一致性估计尤为重要,如体操、武术、跳水、花样滑冰等体育项目中。

27 1.测验的总体 在体育测量中,测验本身对测试者和测试对象都有一定的要求,我们称满足测验要求的所有测试者和测试对象构成的全体称为测验的总体,记为(A、B),其中A代表测试者,B代表测试对象。明确了测验的总体,也就明确了测验的适用范围。

28 2.测验的客观性定义 设从测验总体中随机抽取一名测试者(或若干名测试者)和一个受试对象,测验值为X,根据误差理论和测量过程的分解,测验的第I过程误差模型为: X=T1+e (2-3) 式中,T1-受试对象表现的现象值;e1-测试者造成的误差;e1和T1相互独立。从而:

29 (2-4) 可见,客观系数是一个相对数,反映测试者的测量误差相对于个体差异的大小,若测量误差相对较大,则客观系数较小,反之亦反。客观性系数介于0和1之间,最小值为0,最大值为1。公式(2-5)定义的客观性系数是测验关于全体测试者和受试对象的客观性系数,即关于测验总体的客观性系数,称之为测验的总体客观性,也称测验的客观性,一般总是未知的,实际应用中需要通过样本进行检验。

30 (二)影响客观性的因素 实施测量的方法与程序是否标准化。标准化程度越高,测量结果的客观性越强。
测量指标的难易程度、稳定性及其指标的性质。测量方法比较复杂且难度较大的指标,测量结果的客观性较差;稳定性较差的指标,测量结果的客观性也较差;定性指标比定量指标的客观性差。 受测试人员及受试者主观因素影响的程度。受测试人员及受试者主观因素影响程度越大,测量结果的客观性越差。

31 测试人员的业务技术熟练程度。 若采用专家评定方法时,参评专家的人数多少,知识经验水平,也对评定结果的客观性有着重要影响。参评专家人数过多,意见过于分散。参评专家人数过少,个别专家的意见正确与否,作用又太大。这些因素,都将使评定的客观性受到不同程度的影响。

32 因此,在进行研究方法设计时,为了提高测量或实验结果的客观性,必须尽量选择那些可以用一定计量单位描述的定量指标,简易可行且稳定性好的指标。尽量少用那些易受测试人员和受试者主观因素影响的指标。然后,施以标准化的测量程序。对于那些只能定性不能定量或只能用名次、序号进行量化的定性指标,应特别慎重。若采用专家评定的方法,必须对专家人数、业务水平提出明确要求。同时,必须制定一个尽可能详细而又能避开专家某些主观因素影响的具体评定标准。尔后,通过适当方式,在不同专家间统一认识,统一评定标准,这是十分必要的。

33 (三)估计客观性的方法 对于客观性的估计,应根据数据资料的性质不同而采用不同的方法。

34 1. 参数统计力法 通过测量或实验,当所获得的数据资料属于用区间量表和比率量表描述的计量资料且呈正态分布时,可以采用参数统计方法估计其客观性。这一客观性,通常是用不同测试人员对同一批受试对象实施以同一测量或实验手段,然后计算不同测试人员间测量结果的相关系数并进行显著性检验来进行描述的。

35 2. 非参数统计方法 当所获得的数据资料是通过专家评定,用有序量表来描述的等级、名次、序号等计数资料且不知道是否属于正态分布时,可采用计算等级相关系数或相似系数(又称和谐系数)的非参数统计方法估计其客观性。 这里,仅就多名专家对多个被评价对象的水平和被评价因素的相对重要程度进行专家评定时,如何通过计算相似系数的方法估计不同专家间评定结果的客观性问题,做一详细介绍。具体的方法与步骤:

36 (1)将专家评定结果列入相似系数计算表 下是5名专家对7名学生体质水平(或7个体质因素相对重要程度)的排序结果。 参评专家
学生编号(或因素编号) A B C D E F G (n) 1 4 3 2 6 5 7 S (m)

37 (2)计算7名学生(或因素)所得序号总 和的平均数,可用两种方法:
(3)分别计算每人(或每个因素)所得序号总和、离均差、离均差平方及离均差平方和,并填入表2中。

38

39 (4)按下式计算相似系数,即: 式中W为相似系数;S为7名学生(或7个因素)所得序号总和的离均差平方和;m为参评专家人数;n为学生人数(或因素个数)。 相似系数W的取值范围为0~1,0表示5名专家意见完全不一致,1表示意见完全一致。W值越接近于1,说明专家评定的客观性越强,评价结果越可靠。

40 (5)对相似系数进行显著性检验(这里的相似系数就是指这5名专家打的分数,看这些分数是否保持一致,如果一致说明客观性强),相似系数的显著性检验,用x2检验方法。先用公式计算x2值,即x2=m(n-1)×w,再与x2界值表中相对于·05或·01水平的界值进行比较,并对显著性进行判断。本例x2=5×(7-1)×0.9=27,查x2界值表结果,x2 (6)×0.01界值为16.812。因为x2>x2 (6)×0.01,所以P<0.01,相似系数有非常显著意义。说明5名专家的意见相当一致,客观性很强。

41 (一)可靠性的基本概念和可靠性理论 可靠性,又称信度。所谓可靠性,是指在相同条件下,对同一批受试对象重复测量时,测量结果的一致程度。在相同条件下,只要受试者自身状态不发生变化,对同一批受试对象实施同一测量,一般应得到一致的结果。然而,即使进行最严格的标准化和规范化测量,使用最精密的量具和仪器,由最有经验的测试人员进行测试,其测量结果还会存在—定的误差。这种误差的大小,在很大程度上决定了测量的可靠性。但是,测量的可靠性理论和误差理论是有区别的。

42 在误差理论中,被测量的量值被看作是不变的。而在可靠性理论中,每次测量时,被测量的量值都有变化。例如,对某受试者进行一次最大摄氧量测量,若使用精密度较高的实验仪器设备,并严格控制实验条件,就完全可以测量准确。此时,是把受试者最大摄氧虽看作在短时间内不会发生变化的。如果有些误差,也是由于仪器的基本误差或试验条件控制不严等原因造成的。但是,要确定该受试者在某一时期内的最大摄氧水平,则不管采用什么方法,都无法精确测量。因为每次实验时,受试者自身状态(身体的、精神的)都有可能发生变化,故很难在每次测量中得到完全一致的结果。各次实验结果之间的误差,是由于受试者自身状态变化而引起的。

43 根据可靠性数学理论,对一名受试者进行任何一次测量的结果(实测值),都是两个量的和,即被测量的真值与由于不能被控制的受试者状态变化和随机误差而引起的误差之和,这就是可靠性的理论依据,可用下面公式表示:
xi (x)=x(T)+x (e) 式中xi为某次测量的实测值;x为被测量的真值;x为由不能被控制的受试者状态变化和随机误差而引起的误差。

44 在相同条件下,当观测次数无穷大时,人们常把xi的均数被看作是测量的真值。因此在x的下面标以符号,即x。如果误差是随机的(随机误差的总和等于0,且在不同实验中相互独立),按照数理统计方法,便可写成:
即在一次测量中,实测值的方差( )等于真值方差( )与误差方差( )之和。真值方差被称为理想的(即没有误差)的组间方差,为了跟前面一致性,常用 表示 ,误差方差被称为组内方差。由于误差的影响,才使实测值的分布生变化。

45 可靠性高低,是用可靠性系数(或称信度系数)进行描述的。
可靠件系数(ii),即真值方差与实测值方差之比。可靠性系数可用下面公式表示: 从上式可以看出,假如没有测量误差,即 =0,则可靠性系数ii就等于1。随着测量误差的增大,可靠性系数值也就越小。因此,可以认为,测量的可靠性在很大程度上取决于测量误差的大小。测量误差越小,可靠性越高。

46 (二)影响可靠性的因素 1.测量误差大小 从可靠性系数的含义及计算公式 来看,测量的可靠性,很大程度上取决于测最误差的大小。因此,有必要将产生各种误差(系统误差、随机误差、过失误差和抽样误差等)的误差源进行详细的分析。 受试者自身状态的变化包括受试者对测量或实验方法的理解与掌握程度;受试者在进行测试时的身心状态,包括机能和健康状况;受试者的兴趣、意志和注意力集中程度;受试者思想和身体的准备情况及能否积极主动地配合等,都可能对测量结果的可靠性产生影响。

47 测试人员自身状态的变化包括测试人员对测试方法及技术掌握的熟练程度;测试人员的责任感和准备工作情况;测试人员的组织工作经验;测试人员是否经常更换,也可能对测量结果的可靠性产生不同程度的影响。
量具和仪器功能状态的变化包括精密度是否符合要求,使用前是否进行了严格校准或标定;群体测量时,量具和仪器的规格、型号是否统—,装置是否符合要求;能否保证标准的使用条件,如电压、照度、室温、湿度等,是产生系统误差进而影响可靠性的重要因素。

48 测试方法与程序是否标准化包括测试方的规范化;次数、时间、顺序、难易度是否统一要求;对受试者的要求是否明确等。
外部环境的变化包括气温、湿度、风力等气候条件的变化;测试场所是否有干扰;场地布局是否合理,丈量是否准确等,都可能使测量结果产生较大误差而影响其可靠性。 进行群体测量时是否确足够样本含量因为它涉及抽样误差的大小。

49 2. 被测量值的分布范围大小 可靠性系数(信度系数),正象所有的相关系数一样,受实测值的分布范围(即全距大小)的影响。分布范围越小,即变异程度越小,可靠性系数就越小。因为,从公式 可以看出,当方差 不变而实测方差 减少时,则分式值 增加,可靠系数ii值减小;当误差方差 不变而实测方差 越大时,则分式值 减小,可靠性系数ii越大。这提示我们,当样本中个体之间差异很大的时候,测量的可靠性就会提高。

50 个体差异分布范围对可靠性的影响,可以克莱公式(Ke11y)检查出来。假如测量工具或仪器能等同地量出整个差异范围,则两个不同的差异范围的测量标准差将相等。基于这一思想,克莱推演出如下公式:
式中e为可靠性系数已知的样本分布标准差;n为可靠性系数未知的样本分布标准差;∞和nn为两个分布中各自的可靠性系数。

51 例如,将某一测验应用于某一群体,其实测值的标准差为12,可靠性系数为0
例如,将某一测验应用于某一群体,其实测值的标准差为12,可靠性系数为0.84。假如应用于另一个群体,标准差是8,其可靠性估计值可用上式求得,即: 因此,即使对某一群体测量可靠的手段,若用于另一群体时(非同质群体),应用克莱公式对其可靠性进行重新估价。

52 3. 测验的长度 测验的长度,指测验的次数或组数。
一般来说,测验的长度增加,可靠性随之提高。在实际工作中,当我们认为某项测验因测验次数或组数太少而感到可靠性不够高时,可以用增加测验的长度来提高可靠性。究竟将测验长度增加几倍才能满足可靠性的要求,可以用由斯皮尔曼-布郎通式(即 )推导出的下式进行计算,即

53 例如,某项测验的可靠性系数为0.75,问加长多少倍才能使其达到0.90的可靠性。代入上式可得:
也就是说,必须将原有测验的次数或组数增加三倍,才能达到0.90的可靠性。 反之,若原有测验过长,需要减少测验次数或组数,也可用此法推出。

54 4. 测验的难度 测验的难度与可靠性没有直接关系。然而,由于测验过于简单或过难会使被测量值分布范围太小,也会造成可靠性降低。测验的难度与有效性密切相关。一个根本无效或效度很低的测验,根本谈不上可靠。因此,某项测验对某个群体太难或太容易,该测验本身就失去了鉴别个体差异的能力,故使测验无效或效度降低,可靠性也随之降低。 所以,测验的难度水平,应能产生最广泛的分布,才能提高其可靠性。在心理测验或考试中,测题太难,受试者将对许多题目作出随机反应,即猜测,这种测验结果,将使人难以置信。

55 (三)估计可靠性的方法 如前所述,测量的可靠性,是用可靠性系数进行描述的,即真值方差与实测值方差之比。但是,真值却是一个抽象的概念。进行测量或实验时,要在相同条件下无限制地增加观测次数,实际上是不可能的。也就是说X00这个参数是得不到的。因此,无法直接计算其可靠性系数,必须采用间接的方法,估计其可靠性。估计可靠性最常用的方法是,先进行方差分析,再计算组内相关系数(详见《体育测量与评价》,邢文华等编著)。因为方差分析,能够将测量结果的变差分解成几种变差。这几种变差,都是由影响可靠性的各种因素的影响而造成的。 如果测量只重复进行两次,组内相关系数实际上与第一、二次测量结果的简单相关系数相近。因此,在这种情况下,便可用简单相关系数估计其可靠性。但是,应特别强调的是,若测量和实验的重复次数超过了两次,尤其是采用复杂的实验方案,如在两天内,每天进行两次实验,就必须通过计算组内相关系数的方法估计其可靠性了。

56 测量的可靠性,是通过稳定性、内部一致性和等价性等不同形式表现出来。表现的形式不同,估计可靠性的方法也不同。
1. 稳定性及其估价方法 测量或实验指标的稳定性,是指经过一定时间(非同日),在相同条件下重复测量或实验时,测量结果再现的一致程度。

57 测量或实验的稳定性,与指标特点、受试对象特点和重复测量的时间间隔等有关。一般情况下,形态指标在短时间内变化不大,比较稳定,重复测量时,测量结果再现的一致性强。而机能指标、动作技术及运动能力测验,因易受主客观因素的影响,重复测量时再现的一致性较差,其测量结果的稳定性较差。另外,由于测量结果易受受试者生理、心理、学习经验和训练水平高低等自身状态变化的影响,即使是同一测量或试验手段,在实施于不同对象时,其稳定性也不同.一般情况下,成人要比少年儿童稳定,运动员要比一般人稳定。同时,稳定性会随重复测量时间间隔的延长而下降。

58 “测量——再测量”,是估计测量或实验稳定性常用的一种方法。即让一批受试者在不同时间,用相同的方法,在相同的条件下进行两次测量,用第一次与第二次两次测量结果之间的相关系数估计其稳定性。这个系数越接近1,则测量或试验结果就越稳定而可靠。若两次测量结果之间相关程度很低,则说明稳定性很差。 这种方法用于估计群体测量指标稳定性时,为节省时间,一般可采用第一天对全部受试者进行测量,第二天采用随机抽取一定的受试者进行再测量,并计算随机抽取的部分受试者两次测量结果的相关系数,以估计其稳定性。

59 2. 内部一致性及其估计方法 测量的内部一致性,是指在同一天内,在相同条件下(由一测量人员、用同一测量或实试方法、使用同一量具或仪器,在同一场地)对同一批受试对象实施两次测量,其测量或实验结果的一致程度。

60 估计内部一致性的常用方法是裂半法,即在同一天内进行偶 数次测量,然后把测量结果分成相等的两个部分,奇数次作为一半。偶数次作为一半,对每个受试者而言,可以取得两种数据,即奇数次测量结果的总和与偶数次测量结果的总和。最后,用这两个裂半之间的相关系数估计测量的一致性可靠性。估计整个测量的一致性时,可用下式计算,即 式中11为全部测量结果的一致性可靠性系数;1/21/2为测量结果两个裂半之间的相关系数。

61 当某一测量或试验长度(即重复次数)加倍时,用裂半法估计一致性可靠性,常用到斯皮尔曼—布朗预测公式,即
式中nn为测验次数增加n倍后的一致性可靠性系数;n为测验增加的倍数;ii为原来测验的可靠性系数。例如,某项测验进行6次时,用裂半法计算的一致性可靠性为0.82,若测验长度增加至12次,而难度不变,其可靠性应为: ii = 0.82 , 代入上式,则 可见随着测量长度的增加,一致性可靠性越强。但测验难度保持不变,是使用这个公式的前提。

62 3. 等价性及其估价方法 同日对同一批受试对象实施不同方式、相同难度并能测量同一属性的同质测验。其两种不同方式测验结果的一致程度,称为测量的等价性。 等价性也是通过计算相关系数的方法来估价的,即计算两种不同方式同质测验结果之间的相关系数。 在体质研究中,人们往往从很多相同类型的测验中选择一种或几种测验。例如,欲测量一组受试者跑的速度,可以选择50m跑,也可选择60m或100m跑;欲测量其一般耐力,可选责1000m跑,也可选择1500m或3000m跑;欲测量上肢力量耐力,可选择引体向上,也可以选择俯卧撑或双臂屈伸;欲测量心血管机能,可选择最大摄氧量,也可选择PWC170机能试验台阶试验等。

63 当我们让同一组受试者完成同一类型、两种不同方式试验时,一般用平行测验的方法,估价其等价性,即
方式A← →方式B 但是,在进行科研方法时,对如何看待和使用等价测验,应做具体分析。一方面,如果同时采用两项或两项以上等价测验的话,可以提高测量与评价的可靠性、有效性,即可获取更多有价值的信息。另一方面,若只采用一项等价测验那么从节省时间、人力、简化测验程序的角度考虑,也是有益的。不过,一项测验的信息价值,要低于一组测验的信息价值。如何处理这一关系,主要取决于指标的难度和测量的规模。一般对难度大,要求精密度高的指标,在实施较大规模测量时,不宜同时采用过多的等价测验项目。

64 统计学关于估价可靠性的方法很多,每一种方法,都有其特定的使用范围。因此,在研究方法设计时,应针对所选用的测量或实验方法的特点,选择最适宜的估价可靠性的方法。同时,还应注意,虽是同一测量或试验方法,当用于不同群体时,应对其可靠性进行重新估价。

65 四、有效性 测量的有效性,是测量的三性理论的核心,也是体质研究中十分重要的一个理论问题。
它不仅涉及测量或实验方法本身的科学性,而且也直接与科研方法设计是否合理相联系。因为在许多课题研究中,尤其是定量研究中,都要对某些指标进行实际的测量或实验,以取得研究工作所需要的各种数据资料,进而深入地研究并揭示其内在的规律得出科学的结论。因此,所设计的研究指标的测量或实验方法能否准确而有效地测量出事先欲测量的某一属性,换句话说,即通过某一测量或实验,所能测到的某一属性与所要测量的属性是否一致,其逻辑符合程度大或小,直接关系研究结论是否经得起推敲以至能否成立。所以,它往往是研究工作成败的关键。

66 (一)有效性的基本概念 所谓有效性(亦称效度或测量的信息价值),是指某一测量或实验指标在测量某特性(质量、能力、特征)时,所能测出的某一属性与所要测量属性的一致性。 有效性包括两个方面的含义:一是这项测量或实验手段主要测量什么,或者说使用这一测量或实验手段进行测量时,是否能测出预先打算要测量的某一属性;二是测量的准确度如何,或者说能够获得多少有价值的信息。 在理解这个基本概念时,有两个方面必须加以考虑,即相关性和可靠性。相关性是指测量结果与被测量属性的一致程度。可靠性是指测量结果的准确程度。 有效性(或称效度)高低,是用有效性系数(或效度系数)进行描述的。

67 (二)影响有效性的因素 受试者的年龄、性别和知识经验水平:对于某一性别、年龄组有效的测量或实验手段,用于另一性别、年龄组就不一定有效;对于初学者有效的测量或实验手段,用于有一定学习经验或已掌握了该项测验技能者也不一定有效;对于运动员有效的测量或实验手段,用于一般人也不一定有效。即使有效,其有效程度也会有差别,所得到的信息价值也各不相同。 不同受试群体特点和测验指标的鉴别能力:同一测量或实验手段,用于不同群体,其有效性也不同。一般来说,在一个群体中,个体之间差异越小,测验的鉴别能力差,则所得到的信息价值就小,有效性越差;个体差异越大,测验的鉴别能力强,则所得到的信息价值就越大,有效性越强。

68 3. 测验指标的难度:当一项测验用于受试者,多数不能完成,或多数都能很轻松完成,说明这项测验不具备鉴别受试者某种属性的能力,因而是无效的。因此,在多数情况下,是靠增加测验的难度来增大受试者之间变异的。只有当测验具有一定难度,才能使受试者之间的个体差异客观地显现出来,测验的有效性才能提高,所得到的信息价值才大。过难或过易都影响测验的有效性。 4. 测验指标自身和“效标”的可靠性:测量的有效性,一方面取决于待检验的某项测验指标本身的可靠性;另一方面还取决于用来检验这项测验有效性所使用“效标”的可靠性。一项可靠性很低的测验指标,其有效性永远也不会很强。同时,效标测验的可靠性达不到要求,也会使待检验测验指标的有效性降低,信息价值减小。

69 5.测验的方式:成套测验的有效性往往高于单项测验。实际应用中往往有这样的情况,当某项测验单独进行时,对鉴别某种能力的有效性可能差些,测验结果所获得的信息价值小些。而当这个测验被包括在一组成套测验中时,测验的有效性就会大大提高,究其原因可以发现,这是由各指标之间的互补作用和整体效应造成的。 综上所述,在进行研究方法设计时,充分认识和估计影响有效性的各种因素,分析研究对象及其群体的特点,事先估价所选指标的可靠性及其用于作为效标测验的可靠性,适当加大测验的难度以提高其鉴别能力,确定合理的测验方式,对所采用的指标进行必要的有效性(即效度)检验,是保证科研方法设计严密性和科学性的重要前提。

70 (三)估计有效性的方法 测量的有效性,大致有4种基本类型。即内容有效性、结构有效性、实验有效性(或称效标相关有效性)和推测有效性。有效性的类型不同,其估价的方法也各异。

71 1. 内容有效性的估计方法 内容有效性,是指测验项目和指标的内容能有效地代表总体属性的准确程度,即测验的内容与欲测量的总体属性的一致性。如果它充分地反映了总体属性的全部信息,则该测验内容的设计或编制是有效的。 有效性,一般是用测验所能测量的属性与测验设计者所要测量属性的相关程度进行估价的,但是,相关系数不是在任何情况下都能计算出来的。当无法计算两者的相关系数,或通过实验和对实验结果的数学分析也无法确定其有效性时,就不得不用定性的而不是定量的方法描述其有效性,即采用逻辑推理、判断的方法估价有效性。这就引出了逻辑有效性的概念。 对内容有效性进行估价时的逻辑分析,应与通过实验及数学分析论证测验有效性的方法互为补充。对内容有效性的逻辑分析、推理和判断,要靠数学分析的方法提供有说服力的论据。而数学分析方法得出的结论,也应结合专业知识、经验进行判断。实际应用中的情况比较复杂,应特别注意。

72 2. 结构有效性的估计方法 结构有效性,是指由各种技术组成的一个或一组有特征的、完整的测量手段的结构体系是否包含了欲测总体属性的各种拟测成分,即指测验所能测量的属性与各种拟测成分在结构上的一致性或逻辑符合程度。 估价结构有效性多用于为研究运动技术设计的基本技术和技能测验,在体质研究中较少涉及。这里,我们就不详细阐述了。

73 3. 效标相关有效性的估计方法 将一项测验的结果,与一个公认的且已被证实是有效的测量或实验结果进行比较,二者的相关程度,即为效标相关有效性。
估价效标相关有效性(或信息价值)时,有两种不同情况。第一种情况是具有可以测量的“效标”,第二种情况是没有可用的统一“效标”。因此,应根据不同情况采用相应的方法进行估价。

74 (1)具有可以测量的“效标” 在有可测量的“效标”情况下,估价实验有效性,是将某一测量或实验手段与某种“效标”进行比较,其二者的相关系数即为有效性系数。 作为“效际”使用的测验,应选择那些一看就知道,而且为大家所公认并为实践证明能有效地测量某种属性的测量或实验手段。 在体质研究中,常用的“效标”有以下几种:①可以客观测量并能用一定计量单位描述的定量指标;②非客观测量并无法用一定计量单位描述的专家评定的名次和序号;③“合成效标”(即多项总分);④已被证明有效的标准化实验结果。

75 在进行科研方法设计时(指标设计),如何选择估价这些指标对测量某种属性的有效性“效标”,是一个很重要的问题。确定效标,应经过以下几个基本步骤:①首先要确定所选效标对测量某种属性的逻辑有效性;②只有当效标是可靠的,而且可靠性系数足够大时,才可作为效标使用;③最后要根据所设计指标的测量结果与效标的相关程度(即有效性系数),确定用这些指标代替效标测验是否合理。 另外,为了提高“效标”的可靠性,在选择和设计“效标”时,还必须注意最大限度地消除所有明显的“效标”偏差的来源。

76 “效标”的偏差,大体上有以下4种类型 ①“标值不足”,即在“效标”中省略了某些相关的元素。产生这种“标值不足”的原因有3个:
与使用的量表类型有关。例如,进行专家评价时,往往用高、较高、一般、较差、差或1、2、3、4、5级来描述评价等级的有序量表。这种评价等级,只能粗略地描述出个体水平高低,不能精确地回答高到什么程度或低到什么程度的问题,而且往往又因缺乏详细而具体的标准,使其评价结果的可靠性和客观性受到影响。用这种评价结果作为“效标”使用,很有可能造成“标值不足”。

77 在制定评定细则时,有可能忽略了反映总体属性的某一个方面。
使用“合成效标”时没有加权或加权不合理。本来应根据构成“合成效标”各指标的相对重要程度,分别进行加权,但因设计者有时忽略了这一点,或加权不合理,有可能造成“标值不足”。例如,用身体素质全面发展水平这个多指标的T总分作为“合成效标”使用时,应根据速度、力量、耐力、灵敏、柔韧等素质的相对重要程度,在计算各指标T总分时进行加权。若该加权的没有加权,或加了权但不合理,往往会因“标值不足”而影响“效标”自身的可靠性。

78 ②“标值污染”,即在“效标”中引进了某些不相关的元素。
这种偏差,常产生于制定指标测试细则过程之中。即在制定测试细则时,忽略了除随机测量误差以外的可能产生其他误差的各种有关因素,并使这些因素在测量或实验过程中起了作用。例如,在用跑台实验直接测得的最大摄氧量作为“效标”来检验某简易指标的有效性时,为使测得结果准确、可靠,应在实验设计时周密地考虑时间、环境、受试者机能状态及仪器误差等有关因素,并严格加以控制。这样的实验结果作为“效标”才是可靠的。否则,由于测试条件控制不严,而使某些无关的因素在实验过程中起了作用,就会导致实验结果不准确、不可靠。把它当做“效标”使用时,其自身的可靠性自然会受到影响。又如,通过专家进行经验评定时,有时会出现因专家喜欢某个人的个性而给其较高的评价等级,或因不喜欢某个人的个性而给其较低的评价等级的情况。不管是哪种情况,都使与评价目标无关的因素起了作用,造成了“效标”的污染,使其自身的可靠性受到影响。

79 ③“标值量表单位偏差”,即较多地使用了量表的某一侧
这种偏差,常常在使用等级评定的有序量表时出现。例如,在对学生体质水平进行经验评定时,使用的是1~10分的有序量表,而专家的给分,多数较集中在7~10分这个量表区间,从而使量表单位的使用偏向了一侧。当使用这一评分结果作为效标时,这样的偏差,常会影响“效标”自身的可靠性。

80 ④“标值变形” 在标值不足的情况下,对于应当进行非零加权的元素进行了零加权(忽略了某些相关元素)。其结果,就会使“效标”产生变形。
标值变形,对于前述的标值不足、标值污染和标值量表的单位偏差,各有着不同的意义。 在标值不足的情况下,对于应当进行非零加权的元素进行了零加权(忽略了某些相关元素)。其结果,就会使“效标”产生变形。 在标值污染的情况下,即该赋予零权的元素反而加了权(引进了无关的元素)致使标值变形。 在标值量表单位偏差的情况下,标值的变形表现在集中地使用了量表的一端,而使另一端的部分量表区间实际上被赋予了零权。

81 以上所分析的“效标”偏差的来源,是在进行研究方法设计时所不应忽视的。它既是一个测量学的重要理论问题,又是一个技术细节问题。因为“效标”的选择涉及定量研究所使用的测量或实验手段的有效性,因此稍有疏忽,就有可能导致研究结论的错误。这一点,必须引起科研工作者高度重视。

82 (2)没有统一的“效标” 在实际研究工作中,往往会遇到这样的情况,要估价某指标的有效性,却找不到可用的“效标”,因此无法与“效标”进行比较。在这种情况下,借助于因素分析的方法会更有效。 因素分析,是研究多指标、多变量之间关系的一种有效的多元统计方法。它的主要原理和依据是,把任何一项测验成绩都看作是一系列不能直接观测的、由潜在因素共同影响和作用的结果。 当设计一组测试指标,并通过实际测试计算出它们之间的相关系数矩阵时,就可以用因素分析的方法,确定各测验指标的有效程度。这些测试指标在主成分分析中正交因子矩阵上因子载荷的大小(即某指标相对于某主成分的相关系数),即为该指标有效性的指征。

83 4. 推测有效性的估价方法 推测有效性,是指用一个或多个变量(自变量)推测另一个变量(因变量)的准确程度,即推测结果与实际量值的一致性。具体的方法是,通过建立一元或多元回归方程式进行推测。 在体质研究,推测主要有两种用途:

84 (1)推测某一事物或现象某种特性的现状 例如,用一个简单的测验或测量结果(12分钟跑、台阶试验),推测另一个复杂的实验结果(最大摄氧量)。
这种推测的主要特点是用两种方法同时进行测试,直接取得作为自变量(简单测验或实验)和因变量(复杂实验)的两种数据,然后建立用于推测的回归方程。

85 (2)推测某一事物或现象未来发展变化的趋势
例如,用一个(儿童身高或足长)或多个变量此一时的量值作为推测因子,预测其彼一时(未来)可能达到的量值。 这种预测的主要特点是,不能同时取得作为自变量(反映现状的量值)和因变量(反映未来发展变化的量值)的两种数据。只有在经过从此一时到彼一时较长时间的追踪观察之后,才能建立用于预测的回归方程式。

86 在进行研究方法设计时,若欲提高推测的有效性,必须注意以下几个问题:
两种事物或现象存在相关关系,但不一定都是因果关系。当它们之间存在相关关系,(相关程度足够高,相关系数足够大)同时又是因果关系时,为推测而建立的同归方程才有实际意义,才是有效的。若它们之间存在相关关系(相关程度也足够高,相关系数也足够大),但不是因果关系(伪相关)时,建立回归方程进行推测是毫无实际意义的。 推测误差的大小,即方程的推测精度,应结合专业知识经验,对标准估计误差Sy进行判断,视其推测误差是否能为专业经验所接受。只有当推测误差能为专业经验所接受时,推测才是有效的。

87 用多元回归方程进行推测时,各推测因子之间应保持独独立性,并具有足够的信息量,推测才是有效的、可靠的。
推测方程不能随意外推。推测的范围,一般只适用于建立推测方程时样本所属总体范围;若用于不属一个总体的另一个人群,应进行回代试验,即内部检验和外部检验。当回代试验的推测误差可以接受时,才能外推使用。 此一时有效的推测方程,若用于彼一时进行推测时,应重新估价其有效性,因为这里有时间因素的变化问题。

88 因此,在直接使用他人或移植国外已建立的推测回归方程时,应格外慎重,不能随意照搬或套用,必须搞清时间、对象及适用范围。否则,推测的有效性和可靠性不会理想,甚至是没有意义的。

89 五、测量“三性”之间的关系 通过对测量过程的分解以及“三性”的定义,可知三个科学性分别从不同的方面对测量误差进行估价。客观性度量第I过程中的误差,即测试者误差;可靠性度量第II过程中的误差,即受试者误差;而有效性度量的是第II和第III过程中的合并误差。 从本质上说,测量的三个科学性因衡量测量误差的要求而产生,都是用来衡量测量误差大小的指标,从这个意义上说,测量三性是统一的。但从局部来看,它们分别衡量三个子过程中的误差大小。欲提高测量的科学性、客观性、可靠性和有效性都必须提高,三者缺一不可。

90 可靠性是有效性的一部分,可靠性高,有效性未必高;可靠性低,则有效性一定也低,可靠性是有效性的必要条件,而非充分条件。
对于测量的可靠性来说,“三性”系数究竟控制在多大内的测量才是客观的、可靠的、有效的?这一点,要结合测量目的,参考大家公认或已发表的测量“三性”的参考标准,结合受试对象的特征等方面先进行逻辑估计和预先判断,然后再进行综合的考虑。

91 六、体育测量的编制和实施 (一)体育测验编制的基本原则
测验的编制是测量理论和测量实践相结合的重要环节,也是体育测量的前提条件,没有一个(套)编号的测验,根本无从说起测量与评价。编制测验时,一般要遵循以下几个原则:

92 1.科学性原则 科学性原则是指所编制的测验或所选择的测验方法必须符合测量的有效性、可靠性和客观性。根据这个原则,测验的编制者在选择测量指标时,不仅要注意该测量手段准确、有效地测量某个属性,而且要保证对相同的受试者进行重复测量时能得到前后一致的测量结果,同时还要考虑不同测试者对同一受试者使用同一测量时,可以取得一致的测量结果。测量的科学性是测验编制必须考虑的,而且是任何一个测验都具应具备的。一项好的测验,是可以通过这“三性”检验的。

93 2.可比性原则 可比性原则是要求编制者按测量与评价的理论和测量的有关规定来编制规范化的测量。所谓规范化的测验,即对测验内容和细节做出统一的、明确的说明和规定。应尽量采用已有的、国际或国内通用的标准,只要在测验规定的相同测量结果具有可比性。根据这个原则编制的测验,只要在测验规定的相同测量环境条件下,无论任何测试者对同一总体进行测量,其测量的方法和要求等都应相同的。以此进行测量而获得的测量结果,以及以该测量结果确定的评价标准,都可以用于样本之间的相互比较。

94 3.适用性原则 测验的编制必须符合受试对象的实际情况,全面地考虑受试者的年龄、性别、形态、机能和运动能力、普通人或运动员等方面的特点。同一测验对于不同的受试者,测量结果也不尽相同,其测验的“三性”要求是不同的。两外,选择的测验指标应是测验对象力所能及的,最好是受试者熟练的、能较好完成的、能充分发挥其最大能力的指示。使编制的测验具有适当的难度和区分度,以有效地区分受试者之间的个体差异,达到测量的目的。一般来说,难度适中的测验具有较大的鉴别性。要尽量避免选用那些浪费时间、要详细阐明并要用相当的时间学习才能掌握的测验指标。

95 4.相关、独立性原则 在编制成套测验时,要仔细考虑相关独立性原则。测验的相关性,是指成套测验中各个测验与总体属性的相关关系。各测验内容或测验结构与总体属性的相关程度越高,其有效性就越高。成套测验旨在测量某种综合或总体的属性,在实际测量中,这种综合或总体属性是难以直接测量的,而要通过若干个测验组合,并以各测验之和来代表它。 测验的独立性,是指成套测验中各个测验(指标)应具备的单一属性和独立性。而各个指标之间的相关程度则越低越好,各指标之间的低相关说明成套实验中各指标的独立性强,这样在测量时就可避免不必要的重复,节约人力、物力、财力和时间。同时,在进行统计分析时,可避免同类指标的互相影响,提高计算结果的科学性。

96 (二)体育测验编制的基本程序 1.确定测验目的
编制测验,首先要考虑的是测验的目的,亦即测验编制者要解决什么问题。它是整个编制的核心,必须首先确立。它将决定测验对象和测验指标的选择、组织工作安排、仪器和经费等一系列问题。目的一般不宜定得过多,以解决一两个具体问题为宜。

97 2.分析拟测属性和选择测验指标 拟测属性是测验编制者和使用测验而期望的一种测量结果,它是根据测验目的来确定的。测验目的确定后,则要分析拟测属性的概念、内容、结构、内在联系和外部特征等,然后用定性和定量的方法去选择相应的测验指标。 定性分析选择测量指标,是基于理论和经验,运用逻辑判断、分析、比较的方法选择测验指标。 定量分析选择测量指标,是在定性分析的基础上,运用数理统计的方法和手段,对待定的测验指标做定量分析后进行选择的。常用的数理统计方法有回归分析、聚类分析、主成分分析等。

98 3.预备测验 测验指标定下来之后,应从需要测量的对象中抽取较小的样本进行试验,这种试验称为预备试验。预备试验时,选择的试验对象应与正式测量时的对象条件类似,同时要在标准化条件下进行测验。另外,对测验的时间、仪器、场地、测验方法和测试人员,应明确做出统一的规定。这种试验的目的是:

99 (1)检验测验的客观性、可靠性和有效性,并确立其系数。
(2)检查所编制或选择测验的可行性和实用性,如检查测验是否适合于原定的测试对象;检查测试方法、要求、成绩记录、测验次序、;组织实施以及有关测验的各个环节是否符合测量的实际情况和实施要求。 (3)根据试验情况和出现的问题,对测验做进一步的修改,使之趋于完善。

100 经过预备试验后,精选测验指标,剔除测量值不稳定、有效性和可靠性低或测验结果呈极度偏态的指标。进行预备试验,可以发现编制测验中意想不到的问题,进一步修改和完善测验的编制,确保正式测验的成功。

101 4.科学性检验 科学性检验是指对测量进行“三性”――客观性、可靠性、有效性检验。如待定测验指标的“三性”达到了使用标准便可选用,否则要另行选择。两外,还应对筛选出来的各个指标进行相关程度的检验,如某两项指标的相关程度高且效标的相关程度又很接近,说明这两项指标属同质测验,要剔除其中一项。总之,最后确定的指标,互相之间的相关程度要低(独立性),与属性的相关程度要高(相关性)。

102 5.编写测验实施细则 测验实施细则可以说是测验的说明书,一般测验实施细则应包括下列内容: (1)测验的目的; (2)测验对象的年龄与性别;
(3)测验的有效性、可靠性和客观性; (4)测验的方法和要求; (5)记录、评分的方法和要求; (6)测验中要注意的问题和安全措施。

103 6.实施正式测验

104 (三)测验编制的程序 在实行多项测验或群体测验时,要考虑测验程序的编排问题。测验程序是指实施测验的先后次序,它是根据测验时间、测验项目、测验内容、测验人数、测验难易度和强度、测验条件(场地、设备)和测试人员等方面的情况而进行编排的。编排测验程序的原则是:第一,省时,便于组织实施;第二,保证前后测验之间不会产生不良影响。

105 在体育测验实践中,测验程序的编排通常采用以下三种方法:
1.逐一测验编排法 2.连续测验编排法 3.循环测验编排法

106 (四)成套测验 有一些机能领域的测验项目(指标),不只是一项而是有多项组成。这样由多项指标来测定某个同一机能领域的测验,称成套测验,又称组合测验或系列测验等,它主要用于测量体育范畴中某一方面或某些行为(或现象)的综合属性,并同样具有诊断、评价和预测等功能。

107 1.成套测验的特点 成套测验的总体属性常常难以直接测量获得,一般只是测量构成其总体属性的各个测验项目(各个指标),把它们的测量观测值综合起来以对总体属性进行估价。成套测验具有以下特点: (1)总体属性与其各个测验成分高度相关: (2)各成分测验(指标)之间是独立的:即成套测验中各测量之间应是低度相关。 (3)评价时应结合实际综合考虑:成套测验编制时必须要考虑各结构成分(各测验)的权重、各观测数的转换以及综合评价的方法等问题。

108 2.成套测验的编制 (1)项目的难易度检验:测验项目的难度过大或过小均会降低测量效果,所以成套测验中的各个项目的难度要适中,而且在排列项目顺序时,也应采用由易到难的排列法,因此需要对项目的难易度作必要的检验。项目的难易度,可用受试者在该项测验中的成功率表示,成功率愈高,难度愈小,当然亦可用失败率表示,失败率愈高,难度愈大。 例2.10:

109 (2)项目区分度检验:所谓项目的区分度,是指该项目的测验成绩,能够区分受试者不同能力水平的程度。
设成套测验总分的上位25%与下位25%的人为“上位群”及“下位群”,而且“上位群”在某项测验中的失败者(不合格者)为W上,“下位群”在同一个测验中的失败者为W下,则︱W上-W下︱的值越大,该项目的区分度越好。 若受试者人数为N,则上、下位群的人数为:N上=N下=0.25N 则W上与W下的最大值分别为:W上=N上,W下=N下,而最小值均为0。 显然,区分度的最大值,只有当“上位群”全部成功,而“下位群”全部失败时才会得到。 从而,可得到计算区分度指数的公式: d=︱W上-W下︱/0.25N 一般认为,区分度指数至少应达到0.20。

110 (3)项目间的相关分析: 理想的成套测验,要求各项目之间的相关程度要低,若项目间呈高度相关,则意味着这些项目所代表的是共同属性,因而只采用其中的一项也不影响测量的效果。

111 3.编制成套测验时应注意的问题 (1)成套测验编制: (2)成套测验以3~5个项目组合为宜; (3)编制成套测验要求考虑综合评价的问题:

112 (五)体育测试的实施 按照测验的实施过程,体育测验的组织实施过程分为三个阶段。

113 1.测验前的准备工作 在测验计划确立后及测验实施前,应作如下准备工作: I.组建测试队伍;
II.组织测试者认真学习测验计划、测试细则,明确分工; III.测试实习; IV.准备测验场地、设备和仪器; V.准备成绩记录的表格或测试卡片及其用具。

114 2.测试工作的进行 I.向受试者说明有关事项; II.准备活动; III.测验前的练习; IV.必要的提示; V.思想鼓动。

115 3.测试后的工作 I. 放松活动; II. 整理测验场地、设备及仪器; III.检查所记录的测验成绩; V. 按原计划及时分析处理测量资料。

116 第二节 体育评价的基础理论 体育测量是将一些可以测得的物理量和非物理量转换为数值或符号,进行资料汇集、信息收集的过程。评价则是对所获得信息进行加工处理,通过科学地分析进而作出价值判断,且赋予被测量事物或现象某种意义。所以说,测量是基础,是前提;评价是结果,是目的。二者紧密联系,不可分割。

117 一、体育评价的基础知识 (一)体育评价的概念
评价是指评定事物的属性或特征的价值。目的是在正确地解释事物现状的基础上,为改善现状和实现理想的目标而制定决策提供判断依据。 体育评价是指依据一定的标准,判断体育测量结果,并赋予其价值或意义的过程。 评价标准,均可分为两大类,即具有理想值(标准值)性质的评价标准,及只具有现状平均值(中位数)性质的评价平准。近年来有人注意探索动态评价标准(进步度评价标准)的制定,既不参照绝对评价标准,也不参照所属群体的成绩,而同自己的原成绩相比较而判断进步程度的方法,称动态评价。

118 (二)体育评价的基本形式 在体育实践中,体育评价有三种基本形式: 1.诊断性评价
诊断性评价,又称初始评价,是指在教学和训练开始前的评价。其主要目的是为了解学生的身体、能力、技能等状况及初始水平,做到心中有数,并且可根据初始状况、水平进行分组教学与训练,以达到因材施教、获得最佳效果的目的。

119 2.形成性评价 形成性评价,又称阶段性评价。教学和训练是分阶段进行的,在确定整个教学和训练总目标的同时,也要确定若干个阶段性目标。确定的阶段性教学训练的目标是否合适,是否需要修正,教学训练的内容是否需要调整,这些都依赖于形成性评价。形成性评价,就是把某一教学或训练的总目标分解称若干个阶段目标,并在教学和训练过程中随时检查评定阶段目标完成的情况,以便及时反馈有关计划的完成情况,并为最终达到教学和训练总目标而不断地调整、改善、控制整个教学和训练过程。故形成性评价是科学地控制、调整、改进教学与训练的中心环节。

120 3.终结性评价 终结性评价,又称终末性评价。是指在教学、训练过程的最后(如学期、学年末或训练周期末)进行的评价。它主要对学生体能、机能、成绩和身体能力的提高及体质的增强、个体的进步等方面进行评价,确定个体在集体中的位置以及进行不同群体间的相互比较。通过终结性评价可以获得全面的反馈信息,以检查教学或训练方法、手段的效果,总结经验,发现问题,为确定下一阶段教学和训练的目标提供科学的依据。

121 (三)评价的类型 评价是参照特定的评价标准确定测量数据的价值。根据参照标准的不同,评价可分为以下几种类型: 1.相对评价
相对评价以被评价对象所在的总体为参照标准,判断被评对象在总体中成绩的优劣。

122 2.绝对评价 绝对评价是利用绝对评价标准,对个体或群体进行评价。
绝对评价标准,应客观地反映人体特定领域的正常与异常或理想水平,并经实践检验而得到社会公认。 绝对评价在实际应用中并不多,因为绝对评价标准不易制定。通常说的评价,大多是相对评价。

123 3.进步度评价 进步度评价又称个体评价,是以被评对象以前的水平为评价标准,判断个体或群体前后进步幅度的评价。个体标准是对同一个体不同时期、不同状态下的指标进行比较的一种评价标准,它能相对客观地反映个体情况的变化。 个体评价是根据个体成绩按实践序列变化的大小予以评定,所以在制定评价标准时要注意进步的幅度,同时还要考虑进步的难度。

124 二、体育评价量表及常用评价方法 有了评价标准以后,如何对个体或群体进行评价,则需要制定一种标尺,即制定评价量表。评价量表是指能辨别事物属性、特征价值的一种标尺,它是用统计方法把测量获得的实测值转换为一组导出数据所组成的参照标准。在体育测量中,常见的评价量表主要有两种:分值量表和等级量表。

125 国民体质监测工作规则 总则 第一条 国民体质监测是指国家为了系统掌握国民体质状况,以抽样调查的方式,按照国家颁布的国民体质监测指标,在全国范围内定期对监测对象统一进行测试和对监测数据进行分析、研究。 第二条 国民体质监测对象为3至69周岁的中国公民。按年龄分为幼儿、儿童青少年(学生)、成年和老年等四组人群。 第三条 国民体质监测工作的任务是:对监测对象进行体质测试;建立国民体质数据库;统计与分析监测数据;公布监测结果,为相关工作决策和研究提供服务。 第四条 国民体质监测工作应坚持科学、统一、系统的原则,做到组织严密、取样客观、操作规范、结果准确。 第五条 国务院体育行政部门主管全国国民体质监测工作。国务院体育、教育、卫生、计划、科技、民族、民政、财政、农业、统计等有关部门和全国总工会共同建立国民体质监测工作领导机构,在各自职责范围内协同开展国民体质监测工作。国务院教育行政部门负责儿童青少年(学生)的体质监测工作。开展国民体质监测工作的各级地方人民政府体育行政部门应当会同有关部门,建立相应的领导机构,负责本地区的国民体质监测工作。

126 网络构建与职责 第七条 国家建立由国家国民体质监测中心、省(区、市)国民体质监测中心、地(市)国民体质监测中心和监测点构成的国民体质监测网络,实行分级管理。 第八条 各级国民体质监测中心由同级体育行政部门负责组建。监测点由地(市)国民体质监测中心确定。各级国民体质监测中心、监测点的组建方案须逐级上报体育行政部门审核、备案。儿童青少年(学生)体质监测网络由教育行政部门负责组建。 第九条 各级国民体质监测中心须配备相应数量的管理人员和专业技术人员.

127 各级国民体质监测中心的职责 (一) 起草全国或本地区国民体质监测工作方案,逐级上报监测工作领导机构批准实施;
(一) 起草全国或本地区国民体质监测工作方案,逐级上报监测工作领导机构批准实施; (二) 协助同级体育行政部门和有关部门组织实施国民体质监测工作,指导监督下级国民体质监测机构的工作; (三) 培训下级国民体质监测中心、监测队的管理人员和专业技术人员; (四) 验收、汇总、处理、上报国民体质监测数据; (五) 提交全国或本地区国民体质监测报告; (六) 完成体育行政部门和上级国民体质监测中心交办的任务。

128 第十一条 地(市)国民体质监测中心根据监测工作任务,组建监测队。监测队在地(市)国民体质监测中心的领导下,承担抽取、测试监测对象和整理、上报监测数据等任务。
第十二条 监测队应当根据工作需要,配备相应数量的管理人员、测试人员和医务人员,测试人员应通过培训考核,持证上岗。 第十三条 监测点是国民体质监测工作中相对固定、能代表相应人群的取样单位。被确定为监测点的单位应提供测试的必要条件,协助监测队做好测试组织工作。

129 组织实施与物质保障 第十四条 国家每五年开展一次国民体质监测工作。国家体育行政部门负责组织有关领域的专家制定国民体质监测工作方案并于监测年下达。监测工作使用的调查表式和抽样方案应经国家统计部门审批。 第十五条 体质测试必须严格执行工作程序,遵守操作规定,使用国家指定的测试器材和数据汇总方式,实行技术监督和医务保障制度。. 第十六条 国民体质监测工作经费由各级体育行政部门从其集中的体育彩票公益金中解决。积极争取社会各界对国民体质监测工作的经费支持。 第十七条 应加强对国民体质监测经费使用的管理,严格财务制度,确保专款专用。

130 结果公布与资料保管 第十八条 国家对全国国民体质监测结果实行统一公布制度。监测结果应遵照《统计法》对统计资料公布和管理的有关规定,经国家国民体质监测工作领导机构审议通过后公布。未公布前,任何组织和个人不得公布和公开使用。 第十九条 全国国民体质监测结果由国务院体育行政部门会同有关部门公布.全国国民体质监测结果公布后,地方可以公布本地区国民体质监测结果。 第二十条 国民体质监测资料属国家所有。体育、教育行政部门应当建立国民体质监测数据和资料的使用、保管及保密制度。各级国民体质监测中心应当采取必要的保密及安全措施,对有关工作人员进行保密教育,做好监测数据和资料的保管、保密工作。未经主管部门同意,不得向任何组织或个人提供监测数据和资料。 第二十一条 经同级体育、教育行政部门批准,有关部门在遵守保管、保密制度的情况下,可元偿使用国民体质监测数据和资料。社会公众可以通过监测结果公告和监测报告等获取有关信息。

131 奖励和处罚 第二十二条 对在国民体质监测工作中作出显著成绩的组织和个人,各级体育、教育行政部门和有关部门应予以表彰、奖励。
第二十二条 对在国民体质监测工作中作出显著成绩的组织和个人,各级体育、教育行政部门和有关部门应予以表彰、奖励。 第二十三条 对违反本规定,有下列行为之一者,各级体育、教育行政部门和有关部门视情节轻重,应予以通报批评、取消有关先进评选资格和体质监测工作资格等处罚;对情节严重,造成重大损失的单位要追究经济责任;构成犯罪的,应依法追究刑事责任: (一)不按时完成监测工作任务; (二)违反监测工作操作规范; (三)改动、伪造监测数据; (四)挪用、克扣监测工作经费; (五)擅自公布监测结果,非法提供和使用监测资料; (六)给监测工作造成其他严重损失。

132 国民体质监测方案 一、目的 充实并完善我国国民体质监测系统和数据库,了解我国国民体质现状和变化规律,为全民健身计划的实施提供科学依据,为国家经济建设和社会发展服务。 二、组织领导 (一)"全国国民体质监测工作领导小组"领导和协调本次国民体质监测工作,办公室设在国家体育总局群体司。 (二)教育部门负责组织实施儿童青少年(学生)体质监测工作(方案另定)。 (三)各省(区、市)和承担国民体质监测任务地(市)应建立领导机构,负责组织实施本地区国民体质监测工作

133 三、监测网络与任务 (一)国家国民体质监测中心的任务 1、拟制国民体质监测工作方案; 2、培训全国国民体质监测工作人员;
3、协助进行国民体质监测器材招标,制作监测卡片、手 册和软件;  4、指导、监督、检查全国国民体质监测工作; 5、编印监测工作简报,宣传、指导开展监测工作; 6、收集、整理、保存监测工作音像资料; 7、验收、汇总、统计运算和研究分析国民体质监测数据,向国家体育总局报送监测结果; 8、完善和管理国家国民体质监测数据库及相关资料档案。

134 (二)省(区、市)国民体质监测中心的任务
1、拟制本省(区、市)国民体质监测工作方案; 2、培训本省(区、市)国民体质监测工作人员; 3、发放监测器材、卡片、手册和软件;  4、指导、监督、检查本省(区、市)国民体质监测工作; 5、编印监测工作简报,宣传、指导开展监测工作; 6、收集、整理、保存监测工作音像资料; 7、验收、汇总本省(区、市)国民体质监测数据,并连同监测卡片报送国家国民体质监测中心; 8、研究分析本省(区、市)国民体质监测数据,向省(区、市)体育行政部门报送监测结果; 9、完善和管理本省(区、市)国民体质监测数据库及相关资料档案。

135 (三)地(市)国民体质监测中心的任务 1、拟制本地(市)国民体质监测工作方案; 2、培训本地(市)国民体质监测工作人员,组建监测队,开展监测工作; 3、宣传监测工作,收集、整理、保存监测工作音像资料; 4、检查、验收、汇总监测队送交的监测卡片,完成数据录入并连同监测卡片报送本省(区、市)国民体质监测中心; (四)监测队必须具备的条件: 1、每队至少拥有15名以上培训合格的检测员(至少3名女性); 2、配备国家体育总局提供的体质监测器材; 3、必须有医务保障,确保发生意外伤害事故时能够及时进行处理。

136 四、监测对象与抽样 本次国民体质监测对象为3至69周岁的中国国民,分为幼儿(3-6岁)、儿童青少年(学生)(7-19岁)、成年人(20-59岁)和老年人(60-69岁)四个年龄段。 (二)类别与样本量 1、幼儿分为城镇幼儿、农村幼儿两种人群,按性别分为四类样本。以每岁为一组,四类样本共计16个年龄组。每个省(区、市)每一年龄组抽样100人,总样本量为1600人。 城镇幼儿是指父母拥有非农业户口,本人生活在城市的幼儿; 农村幼儿是指父母拥有农业户口,本人生活在农村的幼儿。 2、成年人分为农民、城镇体力劳动者和城镇非体力劳动者三种人群,按性别分为六类样本。以每5岁为一个年龄组(20-24岁、25-29岁、…… 55-59岁),六类样本共计48个年龄组。每个省(区、市)每一年龄组抽样

137 农民是指拥有农业户口、从事农业工作的人员;
城镇体力劳动者是指拥有非农业户口、从事体力工作的人员; 城镇非体力劳动者是指拥有非农业户口、从事脑力工作的人员。 3、老年人分为城镇老年人、农村老年人两种人群,按性别分为四类样本。以每5岁为一个年龄组(60-64岁、65-69岁),四类样本共计8个年龄组。每个省(区、市)每一年龄组抽样100人,总样本量为800人。 城镇老年人是指拥有非农业户口,本人生活在城市的老年人; 农村老年人是指拥有农村户口,本人生活在农村的老年人。 每个省(区、市)幼儿、成年人和老年人总样本量为7200人,全国共计223200人。   (三)抽样原则 监测采取随机整群抽样的原则抽取监测对象。

138 五、监测内容 监测内容包括体质检测和问卷调查两部分。 六、监测经费  七、监测器材 八、工作步骤 (一)准备阶段 1、制定工作方案 2、培训人员 3、落实器材 4、制作、发放监测卡片、手册及软件 (二)测试阶段 (三)数据处理阶段 (四)总结阶段

139 测试指标 幼儿组(3-6岁) 形态指标:身高、坐高、体重、胸围、皮褶厚度 机能指标:脉搏(心率)
体能指标:立定跳远、网球投掷、坐位体前屈、 10m往返跑、走平衡木、双脚连续跳

140 学生组 项 目 小学(6-12岁) 中学(13-18岁) 大学(19-22) 身 高 △ 体 重 胸 围 腰 围 臀 围 肺活量 50米跑
项 目 小学(6-12岁) 中学(13-18岁) 大学(19-22) 身 高 体 重 胸 围 腰 围 臀 围 肺活量 50米跑 立定跳远 一分钟仰卧起坐 握 力 50米×8往返跑 800米跑(女) 1000米跑(男) 坐位体前屈

141 幼儿组、成年组 测试指标 幼儿组 成年组 老年组 (3-6) (20-39) (40-59) (60-69) 形 态 身高 * 坐高 体重
形 态 身高 坐高 体重 胸围 腰围 臀围 皮褶厚度 机 能 脉搏(心率) 血压 肺活量 台阶实验

142 指标 标 能 立定跳远 网球投掷 坐位体前屈 10m往返跑 10m×4往返跑 走平衡木 双脚连续跳 握力 背力 纵跳 闭眼单脚站立 灯光反应时 反应尺 俯卧撑 一分钟仰卧起坐

143 学生体质健康状况监测卡片(一) 校名________班级________ 是否能参加素质项目测试 是 否
校名________班级________ 是否能参加素质项目测试 是 否 姓名________________ (根据内科检查结果) 省(自治区、直辖市) ____□□ 身高(cm) □□□.□ 监测站名___________ __ □□ 体重(kg) □□□.□ 民族 父___ 母 ____ __ □□ 胸围(cm) □□□.□ 城乡 城=1 乡= □ 腰围(cm) □□□.□ 性别 男=1 女= □ 臀围(cm) □□□.□ 出生日期_____年____月____日 肺活量(ml) □□□□ 检测日期_____年____月____日 握力(Kg) □□.□ 实足年龄 □□ 米跑(秒) □□.□ 点校代码 □□ 仰卧起坐(次/分) □□ 检测序号 □□□ 立定跳远(cm) □□□ 班主任签名_____________ 坐位体前屈(cm) □□□.□ 裸眼视力 左 □□ 米×8往返跑___分___秒__ 右 □□ 米跑 ___分___秒___ 串镜校正 左 正片___负片___ 米跑 ___分__秒___ 右 正片___负片__ 折算秒 □□□.□ 屈光不正 左 □□ 右 □□ 粪蛔虫卵 □ 正常=0 近视=1 远视=2 其它= 阳性=1 阴性=2 主测签名_________

144 学生体质健康状况监测卡片(二) 简要病史:________ _____________ _____________ ___________
_____________ _____________ _____________ ___________ 外 科 内 科 皮肤_________________ 收缩压(mmHg)______ 淋巴___________ 舒张压(mmHg)______ 颈 __________ 心脏:心率_____/分 心律___ 甲状腺_________ 杂音:部位____ 时期______ 其他: 响度____ 性质______ 耳 左_________________ 传导_____ 右____________________ 肝脏:剑下____ 性质____ 鼻______________________ 肋下____ 性质_____ 咽____________________ 喉_____________________ 脾脏:_________ 性质_____ 胸透: 心电图: B 超: 体检小结: 主检医师签名:

145 学生体质健康监测调查问卷 同学们:你们好!
本问卷属于研究性质,目的是想通过这份问卷了解一下你平时的饮食、运动情况。公布结果时不会出现学校、班级、个人的名字,我们将对同学们所回答的问题严格保密,不让其他同学知道;这也不是考试,也无所谓答案正确与否,希望你做出诚实的回答。希望你认真读每一道题,按照答题要求填写。如果题的后面注明是多选题时,选几项都可以,没有注明的就只选一项。谢谢合作。 (请在你选择的答案上划√) 学生体质健康监测中心 二○○八年 月 日

146 1、学校名称: 2、班级: 年级 班 3、姓名: 4、省(自治区、直辖市) 5、监测站名 6、点校代码 7、检测序号 8、民族 父 母 9、 城乡 城=1 乡=2 10、性别 男=1 女=2 11、出生日期: 年 月 日 12、填写日期: 年 月 日 13、实足年龄 班主任签字

147 1.你母亲的文化程度是: (1)小学 (2)初中 (3)高中/技校/中专 (4)大专 (5)大学本科及以上 2.你父亲的文化程度是: 3. 在过去7天(一周)里,你每天吃早餐吗?(选择答案(2)~(5)的同学直接回答第5题) (1)从来不吃 (2)吃1~2次/周 3)吃3~5次/周 (4)天天都吃 4.在过去7天里,你不吃早餐的主要原因? (1)没有足够的时间 (2)不饿或不想吃 (3)节食减肥 (4)感觉不好或吃早餐恶心 (5)无人准备或得不到早餐 (6)不喜欢早餐中的食物 5.在过去7天里,你每天喝牛奶吗? (1)从来不喝 (2)1~2天喝一袋(250~500ml(3)3~5天喝一袋(4)每天喝一袋 (5)每天喝两袋 (6)每天喝三袋及以上

148 6.在过去7天里,你每天吃鸡蛋吗? (1)从来不吃 (2)1~2天吃一个 (3)3~5天吃一个 (4)每天吃一个 (5)每天吃两个 (6)每天吃三个及以上 7.在过去7天里,你每天吃肉(如畜肉/禽肉/鱼)吗? (1)从来不吃 (2)1~2天吃一次 (3)3~5天吃一次 (4)每天吃一次 (5)每天吃两次 (6)每天吃三次 8.在过去7天里,你每天吃零食吗? (1)从来不吃 (2)1~2天吃一次 (3)3~5天吃一次 (4)每天吃1次 (5)每天吃2次 (6)每天吃3次 (7)每天吃4次或4次以上 9.在过去7天里,你喝了汽水、可乐等碳酸饮料吗? (1)没喝过 (2)1~3次 (3)4~6次 (4)每天喝1次 (5)每天喝2次 (6)每天喝3次 (7)每天喝4次或4次以上 10.在过去7天里,你有几天在睡觉前还吃东西? (1)0天         (2)1天 (3)2天 (4)3天 (5)4天 (6)5天 (7)6天 (8)7天

149 11.你是否讨厌吃某种食物? (1)是,请注明食物种类或名称 (2)否 12.你上学和放学时采用的主要交通工具为: (1)步行 (2)乘公交车 (3)乘私人小汽车 (4)乘坐父母的自行车 (5)自己骑自行车 13. 如果你是步行上学,平均每天从家到学校和从学校到家累计时间为: (1)10分钟以内 (2)10~20分钟 (3)20~30分钟 (4)30~40分钟 (5)40~50分钟 (6)50~60分钟 (7)60分钟以上 (8)我不是步行上学 14. 如果你是自己骑自行车上学,平均每天从家到学校和从学校到家累计时间为: (1)10分钟以内 (2)10~20分钟 (3)20~30分钟 (4)30~40分钟 (5)40~50分钟 (6)50~60分钟 (7)60分钟以上 (8)我不是自己骑自行车上学 15.在过去的7天里,你有几天参加30分钟以上的体力活动,并使你出汗、气喘吁吁。如打篮球,踢足球,跑步,游泳,快骑自行车,快步跳舞,或差不多与这些类似的活动。 (1)0天         (2)1天 (3)2天 (4)3天 (5)4天 (6)5天 (7)6天 (8)7天

150 16.你希望每周有几节体育课? (1)0节         (2)1节 (3)2节 (4)3节 (5)4节 (6)5节 (7)6节 (8)7节 17.在平时的体育课上,一节课的时间里,你实际上锻炼或运动多少分钟? (1)  没有参加体育课 (2)少于10分钟 (3)10~20分钟 (4)21~30分钟 (5)31~40分钟 (6)41~50分钟 18.在过去7天里,你平均每天用于体育锻炼的时间(包括课间操、体育课、课外体育活动)为? (1)少于0.5小时 (2)0.5~1小时 (3)1~2小时 (4)2~3小时(5)3小时以上 19.你每天早上起床的时间为: (1)6︰00以前 (2)6︰00~6︰ (3)6︰30~7︰00 (4)7︰00~7︰ (5)7︰30以后 20.你中午午休的时间为: (1)从不午休 (2)10分钟以内 (3)10~30分钟 (4)30~60分钟 (5)60分钟以上

151 21.你每天晚上睡觉的时间为: (1)9︰30以前 (2)9︰30~10︰ (3)10︰00~10︰30 (4)10︰30~11︰ (5)11︰00~11︰30 (6)11︰30以后 22.在过去7天里,星期一至星期五你平均每天用于做作业的时间是: (1)0.5小时以内  (2)0.5~1小时 (3)1~2小时 (4)2~3小时(5)3小时以上 23.在过去7天里,星期六和星期日你平均每天用于做作业的时间是: 24.在过去7天里,星期一至星期五你平均每天看多长时间电视和/或录像? (1)  不看 (2)少于1个小时 (3)1~2小时 (4)2~3小时 (5)3~4小时(6)4个小时以上

152 25.在过去7天里,星期六和星期日你平均每天看多长时间电视和/或录像?
(1) 不看 (2)少于1个小时 (3)1~2小时 (4)2~3小时 (5)3~4小时(6)4个小时以上 26.在最近的一个长假(寒假或暑假)中你平均每天看多长时间电视和/或录像? (1) 不看 (2)少于1个小时 (3)1~2小时 (4)2~3小时 (5)3~4小时 (6)4个小时以上 27.在过去7天里,你平均每天玩多长时间电子游戏? (1)不玩 (2)少于1个小时 (3)1~2小时 (4)2~3小时 (5)3~4小时(6)4个小时以上 28.在过去7天里,你平均每天用多长时间电脑?(包括上网、玩游戏、看光盘等) (1)不用 (2)少于1个小时 (3)1~2小时 (4)2~3小时 (5)3~4小时 (6)4个小时以上


Download ppt "第二章 体育测量与评价的基础理论."

Similar presentations


Ads by Google