Presentation is loading. Please wait.

Presentation is loading. Please wait.

第1章 实验数据的误差分析.

Similar presentations


Presentation on theme: "第1章 实验数据的误差分析."— Presentation transcript:

1 第1章 实验数据的误差分析

2 误差(error) :试验中获得的试验值与它的客观真实值在数值上的不一致
试验结果都具有误差,误差自始至终存在于一切科学实验过程中 客观真实值——真值 误差分析(error analysis) :对原始数据的可靠性进行客观的评定

3 1.1 真值与平均值 1.1.1 真值(true value) 真值:在某一时刻和某一状态下,某量的客观值或实际值 真值一般是未知的
1.1 真值与平均值 真值(true value) 真值:在某一时刻和某一状态下,某量的客观值或实际值 真值一般是未知的 相对的意义上来说,真值又是已知的 平面三角形三内角之和恒为180° 绝对零度等于 ℃ 国家标准样品的标称值 国际上公认的计量值 高精度仪器所测之值 多次试验值的平均值

4 平均值(mean) (1)算术平均值(arithmetic mean) 适合: 等精度试验值 实验值服从正态分布

5 (2)加权平均值(weighted mean)
加权和 wi——权重 适合不同试验值的精度或可靠性不一致时

6 (3)对数平均值(logarithmic mean)
设两个数:x1>0,x2 >0 ,则 说明: 若数据的分布具有对数特性,则宜使用对数平均值 对数平均值≤算术平均值 如果1/2≤x1/x2≤2 时,可用算术平均值代替

7 (4)几何平均值(geometric mean)
设有n个正试验值:x1,x2,…,xn,则 当一组试验值取对数后所得数据的分布曲线更加对称时,宜采用几何平均值。 几何平均值≤算术平均值

8 (5)调和平均值(harmonic mean)
设有n个正试验值:x1,x2,…,xn,则: 常用在涉及到与一些量的倒数有关的场合 调和平均值≤几何平均值≤算术平均值

9 1.2 误差的基本概念 1.2.1 绝对误差(absolute error) (1)定义 绝对误差=试验值-真值 或 (2)说明
1.2 误差的基本概念 绝对误差(absolute error) (1)定义 绝对误差=试验值-真值 (2)说明 真值未知,绝对误差也未知 可以估计出绝对误差的范围: 绝对误差上界

10 绝对误差估算方法: 最小刻度的一半为绝对误差; 最小刻度为最大绝对误差; 根据仪表精度等级计算: 绝对误差=量程×精度等级%

11 真值未知,常将Δx与试验值或平均值之比作为相对误差:
相对误差(relative error) (1)定义: (2)说明: 真值未知,常将Δx与试验值或平均值之比作为相对误差:

12 相对误差常常表示为百分数(%)或千分数(‰)
可以估计出相对误差的大小范围: 相对误差限或相对误差上界 相对误差常常表示为百分数(%)或千分数(‰)

13 1.2.3 算术平均误差 (average discrepancy)
定义式: 试验值 与算术平均值 之间的偏差 —— 可以反映一组试验数据的误差大小

14 1.2.4 标准误差 (standard error) 当试验次数n无穷大时,总体标准差: 试验次数为有限次时,样本标准差:
表示试验值的精密度,标准差↓,试验数据精密度↑

15 1.3 试验数据误差的来源及分类 1.3.1 随机误差 (random error )
(1)定义:以不可预知的规律变化着的误差,绝对误差时正时负,时大时小 (2)产生的原因: 偶然因素,例如气温的微小变动、仪器的微小震动和电压的微小波动。 (3)特点:具有统计规律 小误差比大误差出现机会多 正、负误差出现的次数近似相等 当试验次数足够多时,误差的平均值趋向于零 可以通过增加试验次数减小随机误差 随机误差不可完全避免的

16 1.3.2 系统误差(systematic error)
(1)定义: 一定试验条件下,由某个或某些因素按照某一确定的规律起作用而形成的误差 (2)产生的原因:仪器本身、操作不当、个人主观因素或样本本身的不完善 (3)特点: 系统误差大小及其符号在同一试验中是恒定的 它不能通过多次试验被发现,也不能通过取多次试验值的平均值而减小 只要对系统误差产生的原因有了充分的认识,才能对它进行校正,或设法消除。

17 1.3.3 过失误差 (mistake ) (1)定义: 一种显然与事实不符的误差 (2)产生的原因: 实验人员粗心大意造成 (3)特点:
可以完全避免 没有一定的规律

18 1.4 实验数据的精准度 1.4.1 精密度(precision) (1)含义: 反映了随机误差大小的程度
在一定的试验条件下,多次试验值的彼此符合程度 例:甲:11.45,11.46,11.45,11.44 乙:11.39,11.45,11.48,11.50 (2)说明: 可以通过增加试验次数而达到提高数据精密度的目的 实验数据的精密度是建立在数据用途基础之上的 实验过程足够精密,则只需少量几次实验就能满足要求

19 (3)精密度判断 ①极差(range) R↓,精密度↑ ②标准差(standard error) 标准差↓,精密度↑

20 ③方差(variance) 标准差的平方: 样本方差( s2 ) 总体方差(σ2 ) 方差↓,精密度↑

21 1.4.2 正确度(correctness) (1)含义:反映系统误差的大小 (2)正确度与精密度的关系: (a) (b) (c)
精密度高并不意味着正确度也高 精密度不好,但当试验次数相当多时,有时也会得到好的正确度

22 1.4.3 准确度(accuracy) (1)含义: 反映了系统误差和随机误差的综合 表示了试验结果与真值的一致程度 (2)三者关系
无系统误差的试验 精密度 :A>B>C 正确度: A=B=C 准确度: A>B>C

23 有系统误差的试验 精密度 :A' > B' > C' 准确度: A '> B '> C ' ,A ' >B,C

24 1.5 试验数据误差的统计假设检验 1.5.1 随机误差的检验 1.5.1.1 检验( -test) (1)目的: 在试验数据的总体方差
1.5 试验数据误差的统计假设检验 随机误差的检验 检验( -test) (1)目的: 在试验数据的总体方差 已知的情况下, 对试验数据的随机误差或精密度进行检验。 例:用某分光光度计测量某样品中的AL3+浓度,正常情况下的 测定方差为σ2=0.152。经检修后,用它测同样的样品,测得 浓度分别为:0.142, 0.156, 0.145, 0.176, 0.159, 0.165,试问 仪器经检修后稳定性是否有了变化?

25 (2)检验步骤: ①计算统计量 若试验数据 服从正态分布,则 服从自由度为 分布 ②查临界值 显著性水平 —— 一般取0.01或0.05,表示有显著差异的概率

26 ③检验 双侧(尾)检验(two-sided/tailed test) : 则判断两方差无显著差异,否则有显著差异 单侧(尾)检验(one-sided/tailed test) : 左侧(尾)检验 : 则判断该方差与原总体方差无显著减小,否则有显著减小 右侧(尾)检验 则判断该方差与原总体方差无显著增大,否则有显著增大

27 (3)Excel在 检验中的应用 EXCEL数据处理初步 使用EXCEL进行 检验

28 F检验(F-test) (1)目的: 对两组具有正态分布的试验数据之间的精密度进行比较 (2)检验步骤 ①计算统计量 设有两组试验数据: 都服从正态分布,样本方差分别为 ,则 服从F分布, 第一自由度为 第二自由度为

29 ②查临界值 给定的显著水平α 查F分布表 临界值 ③检验 双侧(尾)检验(two-sided/tailed test) : 则判断两方差无显著差异,否则有显著差异

30 单侧(尾)检验(one-sided/tailed test) :
左侧(尾)检验 : 则判断该判断方差1比方差2无显著减小,否则有显著减小 右侧(尾)检验 则判断该方差1比方差2无显著增大,否则有显著增大 (3)Excel在 F检验中的应用 例:用EDTA法(旧法)和原子吸光谱法(新法)测量样品中的AL3+浓度,测定结果如下: 新法:0.163, 0.175, 0.159, 0.168, 0.169, 0.161, 0.166, 0.179, 0.174, 0.173 旧法:0.153, 0.181, 0.165, 0.155, 0.156, 0.161, 0.176, 0.174, 0.164, 0.183, 0.179 试问: (1) 两种方法的精密度是否有显著差异;(2) 新法是否比旧法的精密度有所提高。(α=0.05)

31 1.5.2 系统误差的检验 1.5.2.1 t检验法 (1)平均值与给定值比较
①目的:检验服从正态分布数据的算术平均值是否与给定值有显著差异 ②检验步骤: 计算统计量: 服从自由度 的t分布(t-distribution) ——给定值(可以是真值、期望值或标准值)

32 双侧检验 : 则可判断该平均值与给定值无显著差异,否则就有显著差异 单侧检验 左侧检验 则判断该平均值与给定值无显著减小,否则有显著减小 右侧检验 则判断该平均值与给定值无显著增大,否则有显著增大

33 例子 为了判断某含水量测定仪器的可靠性,用该仪器测定了某含水量为7.5%的标准样品,5次测量的结果(%)分别为:7.6, 7.8, 8.5, 8.3, 8.7。对于给定的显著性水平α=0.05试检验: (1) 测量结果是否存在明显的系统误差; (2) 测量结果较标准值是否偏大;

34 (2)两个平均值的比较 目的:判断两组服从正态分布数据的算术平均值有无显著差异 ①计算统计量: 两组数据的方差无显著差异时 服从自由度 的t分布 s——合并标准差:

35 两组数据的精密度或方差有显著差异时 服从t分布,其自由度为: ② t检验

36 双侧检验 : 则可判断两平均值无显著差异,否则就有显著差异 单侧检验 左侧检验 则判断该平均值1较平均值2无显著减小,否则有显著减小 右侧检验 则判断该平均值1较平均值2无显著增大,否则有显著增大

37 例子 用烘箱法(方法1)和水分测定仪(方法2)测定某样本的含水量,测量结果如下:
方法1:12.2, 14.7, 18.3, 14.6, 18.6 方法2:17.3,17.9, 16.3, 17.4, 17.6, 16.9, 17.3 对于给定的显著性水平α=0.05,两种方法是否存在系统误差?

38 目的:试验数据是成对出现,判断两种方法、两种仪器或两分析人员的测定结果之间是否存在系统误差
(3)成对数据的比较 目的:试验数据是成对出现,判断两种方法、两种仪器或两分析人员的测定结果之间是否存在系统误差 ①计算统计量: 服从自由度为 的t分布 ——零或其他指定值 ——成对测定值之差的算术平均值: —— n对试验值之差值的样本标准差:

39 ② t检验 ,则成对数据之间不存在显著的系统误差, 否则两组数据之间存在显著的系统误差 用两种仪器测量发气率,测得4分钟发气率(%)数据如下: 仪器1:44, 45, 50, 55, 48, 49, 53, 42 仪器2:48, 51, 53, 57, 56, 41, 47, 50 对于给定的显著性水平α=0.05,两种仪器是否存在系统误差?

40 秩和检验法(rank sum test) (1)目的:两组数据或两种试验方法之间是否存在系统误差、两种方法是否等效等 ,不要求数据具有正态分布 (2)内容: 设有两组试验数据,相互独立 ,n1,n2分别是两组数据的个数 ,总假定 n1≤n2; 将这个试验数据混在一起,按从小到大的次序排列 每个试验值在序列中的次序叫作该值的秩(rank) 将属于第1组数据的秩相加,其和记为R1 R1——第1组数据的秩和(rank sum) 如果两组数据之间无显著差异,则R1就不应该太大或太小

41 查秩和临界值表: 根据显著性水平和n1,n2,可查得R1的上下限T2和T1 检验: 如果R1>T2 或R1 <T1,则认为两组数据有显著差异,另一组数据有系统误差 如果T1<R1<T2,则两组数据无显著差异,另一组数据也无系统误差

42 (3)例: 设甲、乙两组测定值为: 甲:8.6,10.0,9.9,8.8,9.1,9.1  乙:8.7,8.4,9.2,8.9,7.4,8.0,7.3,8.1,6.8 已知甲组数据无系统误差,试用秩和检验法检验乙组测定值是否有系统误差。(=0.05) 解:(1)排序: 1 2 3 4 5 6 7 8 9 10 11.5 13 14 15 8.6 8.8 9.1 9.9 10.0 6.8 7.3 7.4 8.0 8.1 8.4 8.7 8.9 9.2

43 (2)求秩和R1 R1=7+9+11.5+11.5+14+15=68 (3)查秩和临界值表 对于=0.05, n1=6,n2=9 得 T1=33,T2=63, ∴R1>T2 故:两组数据有显著差异,乙组测定值有系统误差

44 1.5.3 异常值的检验 可疑数据、离群值、异常值 一般处理原则为: 在试验过程中,若发现异常数据,应停止试验,分析原因,及时纠正错误
异常值的检验 可疑数据、离群值、异常值 一般处理原则为: 在试验过程中,若发现异常数据,应停止试验,分析原因,及时纠正错误 试验结束后,在分析试验结果时,如发现异常数据,则应先找出产生差异的原因,再对其进行取舍  在分析试验结果时,如不清楚产生异常值的确切原因,则应对数据进行统计处理;若数据较少,则可重做一组数据   对于舍去的数据,在试验报告中应注明舍去的原因或所选用的统计方法

45 拉依达( )检验法 ①内容: 可疑数据xp ,若 则应将该试验值剔除。 ②说明: 3s相当于显著水平=0.01,2s相当于显著水平=0.05 计算平均值及标准偏差s 时,应包括可疑值在内

46 可疑数据应逐一检验,不能同时检验多个数据
首先检验偏差最大的数 剔除一个数后,如果还要检验下一个数 ,应重新计算平均值及标准偏差 方法简单,无须查表 该检验法适用于试验次数较多或要求不高时 3s为界时,要求n>10 2s为界时,要求n>5

47 ③例: 有一组分析测试数据:0.128,0.129,0.131,0.133,0.135,0.138,0.141,0.142,0.145,0.148,0.167,问其中偏差较大的0.167这一数据是否应被舍去? (=0.01) 解:(1)计算 (2)计算偏差 (3)比较 3s=3× =0.0335>0.027 故按拉依达准则,当=0.01时,0.167这一可疑值不应舍去

48 (2)格拉布斯(Grubbs)检验法 ①内容: 可疑数据xp ,若 则应将该值剔除。 ——Grubbs检验临界值

49 格拉布斯(Grubbs)检验临界值G( ,n)表

50 ②说明: 计算平均值及标准偏差s 时,应包括可疑值在内 可疑数据应逐一检验,不能同时检验多个数据 首先检验偏差最大的数 剔除一个数后,如果还要检验下一个数 ,应重新计算平均值及标准偏差 能适用于试验数据较少时 格拉布斯准则也可以用于检验两个数据偏小,或两个数据偏大的情况 ③ 例

51 (3)狄克逊(Dixon)检验法 ①单侧情形 将n个试验数据按从小到大的顺序排列: x1≤x2≤…≤xn-1≤xn 如果有异常值存在,必然出现在两端,即x1 或xn 计算出统计量D或D′ 查单侧临界值 检验 检验xn时,当 时,可剔除xn 检验x1时,当 时,可剔除x1

52 ②双侧情形 计算D和 D′ 查双侧临界值 检验 判断 为异常值 判断 为异常值

53 ③说明 适用于试验数据较少时的检验,计算量较小 单侧检验时,可疑数据应逐一检验,不能同时检验多个数据 剔除一个数后,如果还要检验下一个数 ,应重新排序 ④例

54 1.6.1 有效数字(significance figure)
1.6 有效数字和试验结果的表示 有效数字(significance figure) 能够代表一定物理量的数字 有效数字的位数可反映试验或试验仪表的精度 数据中小数点的位置不影响有效数字的位数 例如:50㎜,0.050m,5.0×104μm 第一个非0数前的数字都不是有效数字,而第一个非0数后的数字都是有效数字 例如: 29㎜和29.00㎜ 第一位数字等于或大于8,则可以多计一位 例如:9.99

55 1.6.2 有效数字的运算 (1)加、减运算: 与其中小数点后位数最少的相同 (2)乘、除运算 以各乘、除数中有效数字位数最少的为准
有效数字的运算 (1)加、减运算: 与其中小数点后位数最少的相同 (2)乘、除运算 以各乘、除数中有效数字位数最少的为准 (3)乘方、开方运算: 与其底数的相同: 例如:2.42=5.8 (4)对数运算: 与其真数的相同 例如ln6.84=1.92;lg =-4

56 (5)在4个以上数的平均值计算中,平均值的有效数字可增加一位
(6)所有取自手册上的数据,其有效数字位数按实际需要取,但原始数据如有限制,则应服从原始数据。 (7)一些常数的有效数字的位数可以认为是无限制的 例如,圆周率π、重力加速度g、、1/3等 (8)一般在工程计算中,取2~3位有效数字

57 1.6.3 有效数字的修约规则 ≤4:舍去 ≥5,且其后跟有非零数字 ,进1位 例如:3.14159 → 3.142
有效数字的修约规则 ≤4:舍去 ≥5,且其后跟有非零数字 ,进1位 例如: → 3.142 =5,其右无数字或皆为0时,“尾留双”: 若所保留的末位数字为奇数则进1 若所保留的末位数字为偶数则舍弃 例如: → 3.142 → 1.366

58 1.7 误差的传递 1.7.1 误差传递基本公式 误差的传递:根据直接测量值的误差来计算间接测量值的误差
1.7 误差的传递 误差的传递:根据直接测量值的误差来计算间接测量值的误差 误差传递基本公式 间接测量值y与直接测量值xi之间函数关系 : 全微分

59 函数或间接测量值的绝对误差为: 相对误差为: ——误差传递系数 ——直接测量值的绝对误差; ——间接测量值的绝对误差或称函数的绝对误差。

60 函数标准误差传递公式:

61 常用函数的误差传递公式

62 1.7.3 误差传递公式的应用 (1)根据各分误差的大小,来判断间接测量或函数误差的主要来源:
误差传递公式的应用 (1)根据各分误差的大小,来判断间接测量或函数误差的主要来源: 例: 一组等精度测量值x1, x2, x3 …… xn, 试求出其算术平均值的标准误差表达式。

63 练习 人群A中的10个人身高数据 人群B中的8个人身高数据 170, 173, 169, 175, 178, 180, 171, 185
172, 175, 178, 168, 170, 173, 174, 175, 169, 171 人群B中的8个人身高数据 170, 173, 169, 175, 178, 180, 171, 185 采用EXCEL和T检验判断两个人群身高是否存在显著差异(α=0.05)。

64 秩和临界值表

65 统计量D计算公式 n 检验高端异常值 检验低端异常值 3~7 8~10 11~13 14~30


Download ppt "第1章 实验数据的误差分析."

Similar presentations


Ads by Google