2017/3/9 实验误差及其控制 魏敏杰 陈 杰 阮 强 王振宁 单凤平 孟繁浩 富伟能 陈 磊 中国医科大学
反映事物总体真正的实际值称为真值(true value),实验所得到的观测值与真值之间所存在的差距称为误差(error)。 2017/3/9 反映事物总体真正的实际值称为真值(true value),实验所得到的观测值与真值之间所存在的差距称为误差(error)。 在整个实验过程中,从抽样、分组,直到施加处理因素及收集数据资料,都可能受到各种各样干扰因素的影响,因此所获得的实验数值往往不能与总体的真值完全符合,这点已经被无数的科研工作所证实.
实验误差(experimental error) 实验所得到的观测值与客观存在的真值之间的差距(非主观原因)。 系统误差 随机误差 过失误差
系统误差(systematic error) 由某种固定的原因(如方法技术、仪器和 试剂、实验条件、顺序等)所造成的误差。 系统误差二个重要特性: ⑴ 单向性。 偏差的方向一致(偏高或低); ⑵ 可消除性。找出原因,通过合理设计或控 制原因,即可基本消除或减小至最小程度。
系统误差的种类 1. 方法技术误差 是由于分析的方法和技术本身的原因引起的误差。如选用的方法不当、技术熟练程度差、操作规程错误、量的概念和时间概念不强以及检验质量控制不严等。 2.仪器和试剂误差 主要表现在设备条件方面,包括各种检测仪器、仪表、器械、测量工具及实验室各种常用的物品等。凡是由于实验过程中所用器具的不准确性造成的误差,皆属仪器误差.
系统误差的种类 3.条件误差 主要表现在受试对象所处的环境条件和实验室环境条件二方面。实验条件控制不好,如季节、时间、温度、pH值、受试因素未标准化与固定化(如药材的产地、采取的时间……)等,往往使所获得的观测数值不同,这种差别一般称为条件误差。
环境条件的变化体现在时间与空间上,为避免条件误差的产生,要求实验组与对照组的处理和观察均应在同一时间和空间内进行,不能一前一后,也不能两地分置,对实验组和对照组的受试对象应遵照公平对待和条件等同的原则。 比如不能将实验组的动物放置在阳光充足,通风良好,饮食、供水及时的场所,而对照组的动物放在阴冷潮湿的角落,饮食和供水也不及时。
如果研究的对象是病人,应使二组病人所处病室内的温度、湿度、照明、声响、营养饮食乃至医务人员的服务态度等诸方面大致相同。如果实验的工作量不大时,最好能集中在同一时间内一气呵成,如果实验时间需要很长,则必须控制环境条件中重要因素的恒定。 实验条件控制的不好,就会发生处理因素与非处理因素的交叉,甚至无法判断某些实验结果是哪个实验因素造成的。
系统误差的种类 4.顺序误差 是一种特殊形式的条件误差。 实验总是有先有后按照一定的顺序进行,生物的许多机能和反应性都有随着时间有节律性动摇的特性,如果将实验组与对照组的实验顺序固定,就忽略了时间变化影响实验效应的因素;另外顺序误差也体现在实验操作者的精力和体力的疲劳方面. 所以最后结果中的差别,很难明确地说明是实验因素的效应还是隐藏在固定顺序中的顺序误差所造成的。
当不同的组不是同时进行,而是按一定顺序先后进行实验时,如果时间拖得较久,即可能发生误差。当在同一个体按一定顺序先后进行不同处理时,如果时间相隔较短,先前的处理可能影响机体对后继处理的反应。 防止顺序误差较好的办法是在实验的顺序中适当的采用随机化原则。
系统误差的种类 5.分配误差 是由分组不够合理所造成。在分组过程中,由于方法上的不当,往往会出现一些偏性。如验证某一新疗法或新药的疗效时,或是通过实验来实现研究者的主观愿望时,常常自觉或不自觉地把病情较轻或是容易治愈的患者编入实验组,以便取得更多的阳性数。因为这种意愿,首先就会在主观意识中形成一种偏性,带入到分组过程而形成分配误差。 实验中的分配误差基本上可以控制,最有效的方就是随机分组。
系统误差的种类 6.主观误差 是研究者在观察结果时自觉或不自觉地带有主观片面性所造成的。研究者总是希望实验结果能与设计假说符合,所以在观察结果时可能将符合主观愿望的结果一律保留,不符合主观愿望的结果则寻找借口予以排除。 要避免主观误差给研究结果或结论带来不应有的影响,研究者必须坚持实事求是的科研准则,是即是,非即非,否则即使一时能自圆其说,但最终仍经不住实践的检验。
随机误差(random error) 排除系统误差后随机发生的误差,包括偶然误差和抽样误差,具有可变性和不可避免性。 2017/3/9 随机误差(random error) 排除系统误差后随机发生的误差,包括偶然误差和抽样误差,具有可变性和不可避免性。 中国医科大学药理教研室
随机误差的种类 1 偶然误差 (accidental error) 是由一些暂时无法控制的微小因素所造成的误差。 偶然误差几乎不可避免,误差的大小完全由偶然性来决定,例如实验过程中微小气候与周围电磁场的微小变动,仪器性能的微小变化等。
随机误差的种类 2 抽样误差(sampling error) 是抽样的样本与总体之间总是存在着或多或少的差异。总体(popu1ation)是研究对象的全体;样本(sample)是从总体中抽取的一部分个体。 在科研中几乎都是用抽样的研究方法来说明被研究对象的总体。
为了准确地表示样本内各个观测值的变异程度,人们首先会考虑到以平均数为标准,求出各个观测值与平均数的离差,即 ,称为离均差。虽然离均差能表达一个观测值偏离平均数的性质和程度,但因为离均差有正、有负,离均差之和为零,即Σ =0,因而不能用离均差之和Σ 来表示资料中所有观测值的总偏离程度。
先将各个离均差平方,即 ,再求离均差平方和,即Σ ,简称平方和,记为SS;由于离差平方和常随样本大小而改变,为了消除样本大小的影响,用平方和除以样本大小,即Σ ,求出离均差平方和的平均数; 统计量Σ称为均方(mean square缩写为MS),又称样本方差,记为S2,即 S2=
实际工作中, 往往是未知的,一般可用样本标准差s代替 : 因为标准差sd随样本含量的增加而趋于稳定,故增加样本含量可以降低抽样误差。
标准差和标准误的意义、作用和使用范围均不同。 标准差(亦称单数标准差) 一般用sd表示,是表示个体间变异大小的指标, 反映了整个样本对样本平均数的离散程度,是数据精密度的衡量指标; 而标准误一般用Sx 表示,反映样本平均数对总体平均数的变异程度,从而反映抽样误差的大小,是量度结果精密度的指标。 随着样本数(或测量次数) n 的增大, 标准差趋向某个稳定值,即样本标准差s 越接近总体标准差σ, 标准误则随着样本数( 或测量次数) n 的增大逐渐减小,即样本平均数越接近总体平均数μ;故在实验中也经常采用适当增加样本数(或测量次数) n 减小s x 的方法来减小实验误差,但样本数太大意义也不大。
标准差是最常用的统计量, 一般用于表示一组样本变量的分散程度; 标准误一般用于统计推断中,主要包括假设检验和参数估计,如样本平均数的假设检验、参数的区间估计与点估计等。 标准差与标准误既有明显区别,又密切相关:标准误是标准差的1/ n ; 二者都是衡量样本变量( 观测值) 随机性的指标, 只是从不同角度来反映误差; 二者在统计推断和误差分析中都有重要的应用。
随机误差的种类--抽样误差 在统计学上用标准误(standard error, SE)表示抽样误差大小: 均数SE的计算公式: 相对数SE的计算公式:
随机误差的种类--抽样误差 大样本时: 小样本时: 相对数查二项分布可信区间表。 (对应P及自由度t值在excel中用TINV查得) 用SE估计总体均数(m)存在的可能范围(95%及99%可信区间) 大样本时: 小样本时: 相对数查二项分布可信区间表。 (对应P及自由度t值在excel中用TINV查得)
随机误差的种类--抽样误差 为了尽可能的减少抽样误差,要遵循“随机抽样”的原则.从理论上讲,不断加大样本含量可使随机误差逐渐减小,但无论如何样本都不可能百分之百地反映出总体的真值,只能努力争取更好的接近它。 样本含量应适当增加,过多地增加会有一定困难,也不足取。
过失误差 是因工作中的差错所造成的误差。 过失误差的特点是: (1)异常性。实验结果出现反常变化; (2)可避免性。 工作中马虎大意、责任心不强、制度不严等,都能造成这种错误,纯粹是一种责任事故。 如取错标本、编错号码、数据记录错行、刻度或指针错误、试管归位错误、计算结果错误、检验结果张冠李戴等等。这些情况不仅给实验结果带来较大的误差,有时甚至可以打乱整个数据资料。
过失误差 过失误差是人为的误差,完全可以防止。这就要求实验人员一方面提高责任心,认真地操作和记录,一方面要完善各项工作制度和严格管理。 如果错误十分明显尚能很快发觉,而一般的过失误差往往在最后的数据分析时也难发现.使实验结果受到很大的影响甚而导致错误的结论。 过失误差是人为的误差,完全可以防止。这就要求实验人员一方面提高责任心,认真地操作和记录,一方面要完善各项工作制度和严格管理。
实验误差的控制 设对照组 合理确定样本数 实验方法要标准化 平行或重复实验 增加主观指标的客观性 控制实验误差应从实验设计、实验过程、以及实验结果分析等各个阶段采取相应的措施加以控制。 设对照组 合理确定样本数 实验方法要标准化 平行或重复实验 增加主观指标的客观性
1 设立对照,严格按随机化原则抽样和分组。 任何可能发生的条件误差都会以同等程度影响到实验组与对照组,以对照组作为基础来比较观察处理效应,就有可能抵消非处理因素的干扰。在确定对照组和实验组时要遵循随机化原则,这样任何可能发生的误差就以同等的机率影响实验组与对照组,从而也在对比时相互抵消。同样顺序误差也可通过随机化方法决定实验顺序而加以控制。
2 合理确定样本数 样本数越大其抽样误差越小,所得的实验结果适用范围越广。但样本数过大实践上困难甚多,也并非绝对必要。另一方面,样本数太小时,发生抽样误差和不均衡性的可能性增大。应按数理统计原则合理确定样本数的大小。
3 实验方法要标准化 所谓标准化就是要有具体的规定,明确的标准。诸如测量步骤样本收集及预处理仪器的标准与操作方法试剂的配制和标定结果的判断和记录方式等等均应有统一的要求,而且所有标准一旦规定,任何实验者不得擅自更改。
4 平行或重复实验 在实验效应的测量中,即使反复测定同一样本中某物质的含量,也不可能每次测定的结果都一样,因为有些误差是无法消灭的,如操作误差(每次取样的量不可能绝对一致),仪器误差(受仪器精密度所决定)等。但是这一类误差多是非定向的,有时使测定值偏高,有时则偏低,因此单独一次的测值可能误差大些,但测定的次数越多这种误差部分相互抵消使均值更接近于真值。因此主张用平行多份样本(至少双份)或反复多次重复测定取其均值的办法,如血压要测定几次,血液生化指标测定要作平行双份样本等,判读X光片、CT片、心电图等,应由几位医生共同进行,或是一位医生间隔一定时间多次判读,较为稳妥。
过失误差的发生是偶然的,在平行的,特别是重复的实验中再度发生的机率很小,因此可通过重复实验排除,而真实的实验结果在重复实验时仍应出现。 实验误差的控制(平行或重复实验) 过失误差的发生是偶然的,在平行的,特别是重复的实验中再度发生的机率很小,因此可通过重复实验排除,而真实的实验结果在重复实验时仍应出现。 可见,重复实验不只是简单的重复,它能指导方向,避免错误,提高质量。在总例数同为100的情况下,每次50例,分两次进行的实验结果,如果一致,要比单次进行100例实验所获得的结果更为可靠。
5 增加主观指标的客观性 在临床实验中,由于是以人为研究对象,心理偏因造成的误差较为突出,为防止这种误差,主要采用“盲实验”和“安慰剂”等。 实验误差的控制 5 增加主观指标的客观性 在临床实验中,由于是以人为研究对象,心理偏因造成的误差较为突出,为防止这种误差,主要采用“盲实验”和“安慰剂”等。
实验效应测量时需要注意的几个质量水平指标 (正式实验开始前应对整个测量系统进行质量控制,一定要达到要求的水平,以确保数据的可靠性!)
1.特异性(specificity) 指测量特定项目而不受其他(特别是近似的或关联的)项目干扰的能力。 如测定NE为例,一个特异性好的方法应:当样本中不含NE时其测值为0;当样本中含有高于其最低检出量的NE时即能测出;样本中有近似物如肾上腺素存在时,对NE的测定无影响。
2.灵敏度(sensitivity) 指方法所能测出的指标的最低水平。 例如用放免法测血中生长激素(GH)时,样本中GH含量低于0.2 ng时测值就与空白难以区分,因此方法的灵敏度为0.2 ng。另一方面,当GH超过6.0 ng后,标准曲线变平,超过了方法的灵敏范围。
3.准确度(accuracy) 指测定结果与真实结果的符合程度。 对于一些测量仪器,可用已知的标准样本加以检验和校正。仪器如不加校准,将使所有测值发生同向误差,即造成系统误差。
4.精密度(precision) 指同一样本多次测定时各次测值的差异程度,以多次测值的标准差表示。 精密度是估计测定结果重现性(reproducibility)的指标,和准确度是两个不同的概念,二者不一定平行。 在比较不同标准差时,如单位不同或均数相差大,可用变异系数(coefficient of variance,CV)比较,即上述标准差与均值的比。