第2章 误差及分析数据的统计处理 §1 定量分析中的误差 §2 分析结果的数据处理 §3 有效数字及其运算规则 §4 标准曲线回归分析法
§1 分析化学中的误差 一、误差的表示方法 二、准确度和精密度的关系 三、误差的分类及减免方法 四、误差的传递
一、误差的表示方法 1、准确度和误差 准确度:反映测量值与真实值的接近程度。 误差—分析结果与真实值之间的差值。 E= xi-μ 绝对误差=个别测定值-真实值 误差越小,准确度越高。 E 有+、-
实际工作中,真值实际上是无法获得; 真值:客观存在,但绝对真值不可测 理论真值 : 纯物质的理论值 约定真值 : 国家标准局提供的标准参考物质的证书上给出的数值 相对真值 : 多次测定结果的平均值当作真值
一、误差的表示方法 例如:分析天平称量两物体的质量各为1.6380g和0.1637,假设两者的真实质量分别为1.6381g和0.1638g。 两者的绝对误差分别为 E=1.6380-1.6381=-0.0001(g) E=0.1637-0.1638=-0.0001(g) 两者的相对误差分别为 Er=-0.0001/1.6381=-0.006% Er=-0.0001/0.1638=-0.06% 绝对误差相等,相对误差并不一定相同。同样的绝对误差,当被测量的量较大时,相对误差就比较小,测定的准确度就比较高。 ∴ 常用相对误差衡量准确度
一、误差的表示方法 2. 精密度与偏差 精密度:测定数据间的接近程度。 偏差越小,精密度越高。 d 有+、- [重现性(同条件,本人),再现性(他人,各自条件)] 偏差— 测量值与平均值的差值。 绝对偏差=个别测定值-测定的平均值 d = xi - x 偏差越小,精密度越高。 d 有+、-
d = xi - x 绝对偏差: 相对偏差: 平均偏差: 标准偏差: 总体 n<20 样本 相对标准偏差(变异系数CV):
极差(Range) 公差 ( tolerance):公差是各生产部门对于分析结果允许误差的一种表示方法,如果超差,必须重做。 公差据实际情况对分析结果准确度的要求、试样组成及待测组分含量、各主管部门对每一项具体的分析项目规定而定,如工业分析中, 待测组分的质量分数/% 80 40 20 10 5 1.0 0.1 0.01 公差(相对误差)/% 0.4 0.6 1.0 1.2 1.6 5.0 20 50 公差的作用:日常分析中可衡量同一样品多次测定的平行性;互检分析中可衡量互检的样品是否合格;外检分析中可衡量分析结果是否合格。
计算此结果的平均值、平均偏差、标准偏差、变异系数。 计算: 例:分析铁矿中铁含量,得如下数据: 37.45% , 37.20% , 37.50% , 37.30% , 37.25% 计算此结果的平均值、平均偏差、标准偏差、变异系数。 计算:
一、误差的表示方法 请看下面两组测定值: 甲组:2.9 2.9 3.0 3.1 3.1 乙组:2.8 3.0 3.0 3.0 3.2 请看下面两组测定值: 甲组:2.9 2.9 3.0 3.1 3.1 乙组:2.8 3.0 3.0 3.0 3.2 甲组 乙组 平均值 3.0 3.0 平均偏差 0.08 0.08 标准偏差 0.08 0.14 ∴标准偏差能很好地反映测定的精密度
一、误差的表示方法 小结: 准确度常用误差来表示,误差越小,准确度越高,而且用相对误差更为确切。 精密度的大小常用偏差表示。在偏差的表示中,用标准偏差更合理,因为将单次测定值的偏差平方后,能将较大的偏差显著地表现出来。 在科研论文中,常用标准偏差表示精密度;在学生实验中,常用相对平均偏差或绝对偏差表示精密度。
二、准确度和精密度的关系 准确度 精密度 精密度高,准确度不一定高, 测定结果从精密度、准确度两方面评价 ∴精密度是保证准确度的必要条件。 准确度 精密度 不好 好 不好 不好 好 好 精密度高,准确度不一定高, ∴精密度是保证准确度的必要条件。 测定结果从精密度、准确度两方面评价
三、误差的分类及减免方法 影响准确度 影响精密度 系统误差=可测误差 单向性,重复性,可测性 误差类型 误差的大小和正负有规律 随机误差=偶然误差 影响精密度 不恒定,可变 误差值的大小和正负无一定的规律 过失误差
三、误差的分类及减免方法 系统误差产生原因 1.方法误差: 方法不够完善而引入的误差。如:滴定分析中指示剂选择不当等。 2.仪器误差: 使用了未经校正的仪器而造成的误差。 使用的试剂或蒸馏水,含有干扰测定的杂质而引起的误差。 3.试剂误差: 如操作者对指示剂终点颜色判断的差异等因素引入的误差。 4.操作者主观误差:
三、误差的分类及减免方法 减免误差的方法 1)系统误差的减免 对照试验: 纠正方法误差 标准试样 标准方法 同条件下平行试验,找出校正值 空白试验: 纠正试剂、器皿带入的系统误差 不加入试样 测定试样 同条件下试验,找出校正值 仪器校正: 求出校正值
1)系统误差的减免 回收试验: 在测定试样某组分含量x1的基础上,加入已知量x2的该组分,再次测定其组分含量x3。由回收试验所得数据计算出回收率。 由回收率的高低来判断有无系统误差存在。 常量组分: 一般为99%以上, 微量组分: 95~110%。
三、误差的分类及减免方法 随机误差产生的原因: 无法控制的不确定因素所引起 如环境温度、湿度、电压、污染情况等的变化引起试样质量、组成、仪器性能等的微小变化,操作人员实验过程中操作上的微小差别,以及其他不确定因素等。 实际工作中,随机误差与系统误差并无明显的界限,当对其产生的原因尚未知时,往往当作偶然误差对待,进行统计处理。
三、误差的分类及减免方法 2)随机误差的减小 增加测定次数 一般测定3~4次,可使随机误差减小; 高要求测定6~10次,随机误差已减至很小。 3)过失误差的减小 按操作规程,严格正确地操作 实验要仔细、认真,避免偶然事故发生 实验数据可靠,减少记录和计算中错误
四、随机误差的分布服从正态分布 1. 服从的前提 测定次数无限多; 系统误差已经排除。 2. 定义 横坐标:偶然误差的值, 纵坐标:误差出现的概率大小。
四、随机误差的分布服从正态分布 随机误差分布性质 1)对称性:正误差和负误 差出现的概率相等。 2)单峰性:误差分布曲线 只有一个峰值。 3)有界性:由偶然误差造成的大误差的概率很小。若出现误差很大的测定值,往往由过失误差造成。 4)低偿性:误差的算术平均值的极限为零。
四、随机误差的分布服从正态分布 误差范围与出现的概率之间的关系
四、随机误差的分布服从正态分布 置信度与置信区间 置信度:在某一定范围内测定值或误差出现的概率。68.3%, 95.5%, 99.7% 即为置信度。 置信区间:真实值在指定概率下,分布的某个区间。μ±σ,μ±2σ,μ±3σ等称为置信区间。 置信度选得高,置信区间就宽。
五、有限次测定中随机误差的t分布 有限次测定中偶然误差服从 t 分布 有限次测定无法计算总体标准差σ和总体平均值μ,则偶然误差并不完全服从正态分布,服从类似于正态分布的 t 分布( t 分布由英国统计学家与化学家 W.S.Gosset提出)。
五、有限次测定中随机误差的t分布 有限次测量: 、s 无限次测量:、 u 分布曲线 t 分布曲线
五、有限次测定中随机误差的t分布 讨论: (1) 由式: 得: x——有限次测定平均值 t ——几率系数 n —— 测定次数 s ——标准偏差 μ——总体平均值 (2) 上式的意义:在一定置信度下(如95%),真值(总体平均值) 将在测定平均值附近的一个区间即在 之间存在的把握程度 95%。用作分析结果的表达式。 分析结果的表达式
五、有限次测定中随机误差的t分布 置信区间 表2-2 t 值表 (3) t 值与置信度和n有关,置信度↑, n↓, t ↑。 (4) 置信度不变: 若n↑, t↓, s↓ ,则置信区间↓,平均值愈接近真值,平均值愈可靠。 (5) n不变时:置信度↑, t↑ ,置信区间↑。
例:测定SiO2的质量分数得到下列数据: 0. 2848, 0. 2851,0. 2852, 0. 2859, 0. 2862, 0 [解] 查表2-3得,n=6,置信度为90%时,t=2.02,则 查表2-3得, n=6,置信度为95%时,t=2.57,则
某学生测平均值Cu% =35.21%,S=0.06%, n=4 求P=0.95;P=0.99时平均值的置信区间 。 [解] 查t值表:P=0.95 f=4-1=3 t=4.303 查t值表: P=0.99 f=4-1=3 t=9.925 同理: (1)P变大,置信区间变宽,包括真值的可能性大 (2)分析中常定置信度为95%或90%。 (3)对平均值置信区间的解释:在35.21±0.18区间包括μ的把握为99%。 =35.21±0.18
§2 分析结果的数据处理 一、可疑数据的取舍 二、分析方法准确性的检验
一、可疑数据的取舍 可疑数据的取舍 判断过失误差 方法: Q检验法 格鲁布斯(Grubbs)检验法 作用:确定某个数据是否可用。
1、Q 检验法 Q 检验法: 测定次数在10次以内 步骤: (1) 数据排列 x1 x2 …… xn (2) 求极差 xn - x1 (3) 求可疑数据与相邻数据之差 xn - xn-1 或 x2 -x1 (4) 计算:
如果测定次数在10次以内,使用Q值法比较简便。 (5)根据测定次数和要求的置信度(如90%) , 查表2-4 (6)将Q与Q表 (如 Q90 )相比, 若Q > Q表舍弃该数据, (过失误差造成) 若Q < Q表保留该数据, (偶然误差所致) 当数据较少时,舍去一个后,应补加一个数据。 如果测定次数在10次以内,使用Q值法比较简便。 有可能保留离群较远的值,常选用P=90%。
1、Q 检验法 表 2-4 Q 值表
2、格鲁布斯(Grubbs)检验法 格鲁布斯(Grubbs)检验法 (1)由小到大排序:x1, x2, x3, x4…… (2)求x和标准偏差s (3)计算G值: (4)由测定次数和置信度要求,查表得G 表 (5)若G计算> G 表,弃去可疑值,反之保留。 格鲁布斯(Grubbs)检验法引入了标准偏差,故准确性比Q 检验法高。
2、格鲁布斯(Grubbs)检验法 表 2-3 G (p,n)值表
一、可疑数据的取舍 例:测定某药物中Co的含量(10-4)得到结果如下: 1.25,1.27, 1.31, 1.40, 用Grubbs 法和 Q 值检验法判断 1.40 是否保留。 解:① 用 Grubbs 法: x = 1.31 ; s = 0.066 查表 2-3,置信度选 95%,n = 4,G表 = 1.46 G计算 < G表 故 1.40 应保留。
一、可疑数据的取舍 ② 用 Q 值检验法:可疑值 xn 查表 2-4, n = 4 , Q0.90 = 0.76 Q计算 < Q0.90 故 1.40 应保留。
一、可疑数据的取舍 讨论: (1) Q值法不必计算 x 及 s,使用比较方便。 (2) Q值法在统计上有可能保留离群较远的值。 (3) Grubbs 法引入 s ,判断更准确。 (4)不能追求精密度而随意丢弃数据;必须进行检验。
二、分析方法准确性的检验 分析中经常遇到的两种情况: x 1与 x 2不一致,精密度判断 x 与μ不一致,准确度判断 判断方法:利用统计学的t 检验法和F检验法,检验是否存在显著性差异。 作用:判断分析方法的准确性,确定某种方法是否可用,判断实验室测定结果准确性。
1、t 检验法 t 检验法---系统误差的检测 A) 平均值与标准值()的比较 a. 计算t 值 b. 由要求的置信度和测定次数,查表得 t表 c. t计> t表,表示有显著性差异,存在系统误差,被检验方法需要改进。 t计≤ t表,表示无显著性差异,被检验方法可以采用。
1、t 检验法 例:用一种新方法来测定试样含铜量,用含量为11.7 mg/kg的标准试样,进行五次测定,所得数据为: 10.9, 11.8, 10.9, 10.3, 10.0 判断该方法是否可行?(是否存在系统误差)。 解:计算平均值 = 10.8,标准偏差 s = 0.7 查t 值表,t(0.95 , n = 5) = 2.78,t计算 > t表 说明该方法存在系统误差,结果偏低。
1、t 检验法 B) 两组数据的平均值比较 同一试样 新方法--经典方法(标准方法) 两个人测定的两组数据 两个实验室测定的两组数据 a. 求合并的标准偏差: b. 计算t值: c. 查表(自由度 f= f 1+ f 2=n1+n2-2), 比较:t计> t表,表示有显著性差异 t计< t表 ,表示无显著性差异
2、F检验法 F检验法-两组数据间偶然误差的检测 a. 计算F值: b. 按照置信度和自由度查表2-5(F表)比较 若 F计算 < F表,再继续用 t 检验判断与是否有显著性差异; 若 F计算 >F表,被检验的分析方法存在较大的系统误差。
三、分析方法准确性的检验 表 2-5 置信度95%时 F 值 fs大:方差大的数据的自由度;fs小:方差小的数据的自由度。(f = n - 1)
三、分析方法准确性的检验 例:甲、乙二人对同一试样用不同方法进行测定,得两组测定值: 甲:1.26, 1.25, 1.22 甲:1.26, 1.25, 1.22 乙:1.35, 1.31, 1.33, 1.34 问两种方法间有无显著性差异? 解:n甲 = 3 s甲 = 0.021 s乙 = 0.017 n乙 = 4 查表2-5,F 值为 9.55,说明两组的方差无显著性差异 进一步用 t 公式进行计算。
再进行 t 检验: 三、分析方法准确性的检验 查表 2-2 t 值表 f =n1 +n2-2=3+4-2 = 5,置信度 95% t表 = 2.57,t计算>t表 甲乙二人采用的不同方法间存在显著性差异。
讨论: 三、分析方法准确性的检验 (1)计算表明甲乙二人采用的不同方法间存在显著性差异; 系统误差有多大?如何进一步查明哪种方法可行? (2)分别与标准方法或使用标准样品进行对照试验,根据实验结果进行判断。 (3)本例中两种方法所得平均值的差为: 其中包含了系统误差和偶然误差。 (4)根据 t 分布规律,偶然误差允许最大值为: 说明可能有0.05的值由系统误差产生。
§3 有效数字及其运算规则 一、有效数字概念 二、有效数字位数 三、有效数字的修约规则 四、有效数字的运算规则
§3 有效数字及其运算规则 一、有效数字概念 有效数字=全部确定的数字+一位可疑数字 15℃ 15℃ 14℃ 14℃ t = 14.55 ℃ §3 有效数字及其运算规则 一、有效数字概念 有效数字=全部确定的数字+一位可疑数字 (正负一个单位的误差) 14℃ 15℃ 14℃ 15℃ t = 14.55 ℃ t = 14.5 ℃ ± 0.01℃ ± 0.1℃
(1)测量值或计算值,数据的位数与测定的准确度有关。 一、有效数字概念 实验过程中常遇到两类数字: (1)测量值或计算值,数据的位数与测定的准确度有关。 (2)表示数目(非测量值),如测定次数;倍数;系数;分数 记录的数字不仅表示数量的大小,还要正确地反映测量的精确程度。 结果 绝对误差 相对误差 有效数字位数 0.50400 ±0.00001 ±0.002% 5 0.5040 ±0.0001 ±0.02% 4 0.504 ±0.001 ±0.2% 3
二、有效数字位数 有效数字的位数由测量中仪器的精度确定 仪器 精度 有效数字 如:分析天平 0.1mg 0.1012g 天平 0.1g 12.1g 滴定管 0.01mL 24.28mL 量筒 0.1mL 24.3mL
3)对数表示时,有效数字位数由小数部分决定,首数(整数部分)只起定位作用。 二、有效数字位数 1)数字“0”在数据中具有双重作用: ☆若作为普通数字使用,是有效数字 如 3.180 4位有效数字 ☆若只起定位作用,不是有效数字。 如 0.0318 3位有效数字 3.18×10 -2 2)指数表示时,“10”不包括在有效数字中 如: 2.308×10-8 四位有效数字 3)对数表示时,有效数字位数由小数部分决定,首数(整数部分)只起定位作用。 如:pH=2.68 则: [H+]=2.1×10-3mol·L-1 2位有效数字
三、有效数字的修约规则 修约规则:“四舍六入五留双” (1)当多余尾数≤4时舍去,尾数≥6时进位。 (2)尾数正好是5时分两种情况: a. 若5后数字不为0,一律进位,0.1067534 5前是奇数则将5进位 5前是偶数则把5舍弃 b. 5后无数或为0, “奇进偶舍” 如:15.0150→ 15.02,15.025→ 15.02 注意:一次修约到位,不能连续多次的修约 2.3457 → 2.346 → 2.35 → 2.4
四、有效数字的运算规则 例: 12.27 + 7.2 + 1.134 = ? 12.27 有效数字表达=20.6 1)在加减法运算中,以绝对误差最大的数为准,即以小数点后位数最少的数为准,确定有效数字中小数点后的位数。 例: 12.27 + 7.2 + 1.134 = ? 0.01 0.1 0.001 12.27 7.2 + 1.134 20.604 有效数字表达=20.6
四、有效数字的运算规则 计算器计算=0.011111458 有效数字表达 = 0.0111 2)乘除运算中,以有效数字位数最少的数,即相对误差最大的数为准,来确定结果的有效数字位数。 例: 的结果 0.21334 × 6.25 106670 42668 128004 1.3333750 计算器计算=0.011111458 有效数字表达 = 0.0111
四、有效数字的运算规则 4)有些分数可视为足够有效 5)在运算中,数据首位8,可多算一位有效 数字。 6)误差、偏差一般取一、二位有效数字 例如:250mL容量瓶中移取25溶液,取值为1/10,10不影响有效数字的确定。 5)在运算中,数据首位8,可多算一位有效 数字。 6)误差、偏差一般取一、二位有效数字 7)高含量(>10%) 四位有效数字 中等含量(1~10%) 三位有效数字 低含量(<1%) 二位有效数字
§4 标准曲线的回归分析 回归分析:用数字统计方法找出各实验点误差最小的直线 分析化学中经常使用标准曲线来获得试样中某组分的量。例如: §4 标准曲线的回归分析 分析化学中经常使用标准曲线来获得试样中某组分的量。例如: 光度分析中的浓度-吸光度曲线; 电位法中的浓度-电位值曲线; 色谱法中的浓度-峰面积(或峰高)曲线。 回归分析:用数字统计方法找出各实验点误差最小的直线
§4 标准曲线的回归分析 回归分析法: 作用:得到用于定量分析的标准曲线 方法:线性方程的最小二乘法拟合 线性方程: y = a + bx §4 标准曲线的回归分析 回归分析法: 作用:得到用于定量分析的标准曲线 方法:线性方程的最小二乘法拟合 线性方程: y = a + bx 使各实验点到直线的距离最短(误差最小)。 利用最小二乘法计算系数a和b,得 y对 x 的回归方程,相应的直线称为回归直线。
§4 标准曲线的回归分析 1、最小二乘法拟合线性方程 由最小二乘法关系,将实验数据代入,可求得线性方程中的截距a、斜率b; §4 标准曲线的回归分析 1、最小二乘法拟合线性方程 由最小二乘法关系,将实验数据代入,可求得线性方程中的截距a、斜率b; 建立:y = a + bx
§4 标准曲线的回归分析 2、相关系数 r 判断y与x之间的相关性好坏的尺度 r = ±1 ;存在线性关系,无实验误差; §4 标准曲线的回归分析 2、相关系数 r 判断y与x之间的相关性好坏的尺度 r = ±1 ;存在线性关系,无实验误差; r = 0;无线性关系; 0 < | r | < 1时,y与x有相关性, r愈接近1, 相关性愈好