第3章 数 据 处 理
1.列表法 2.作图法 3.逐差法 4.最小二乘法
一、列表法 例: 通过测量温度t和在温度t下铜的电阻Rt来测量铜的电阻温度系数,得到t与Rt的数据列表如下: 表中数据均为有效数字
一、列表法 要求: 要把原始数据和必要的 运算过程中的中间结果 引入表中。 必须标明个符号所代表 的物理量的意义,并写 明单位。 必须标明个符号所代表 的物理量的意义,并写 明单位。 表中的数据要正确地反 映测量结果的有效数字。
作图法
1.作图规则 ①作图一定要用坐标纸,测量数据中的可靠数字在图上也应是可靠的,即图纸上一小格对应数据中可靠数字的最后一位,而误差位在小格之间估计。
1.作图规则 ②标明坐标轴和图名
1.作图规则 ③标点
2.作图规则 ④连线
3.作图举例 直角坐标举例。测得铜电阻与温度对应的一组数据如表所示,试用直角坐标作图表示出电阻与温度的函数关系。 例:
在图中任选两点 和 , 将两点代入式中可得: 由于有x=0的坐标点,故 最后,得到电阻随温度的变化关系为:
2.用电势差计校准量程为1mV的毫伏表,测量数据如下(表中单位均为mV)。在如图所示的坐标中画出毫伏表的校准曲线,并对毫伏表定级别。 毫伏表读数 0.100 0.200 0.300 0.400 0.500 电势差计读数 0.1050 0.2150 0.3130 0.4070 0.5100 修正值△U 0.005 0.015 0.013 0.007 0.010 毫伏表读数 电势差计读数 修正值△U 0.600 0.700 0.800 0.900 1.000 0.6030 0.6970 0.7850 0.8920 1.0070 0.003 -0.003 -0.015 -0.008 0.007
毫伏表的级别为: 为1.5级表
三、逐差法 1.逐差法的含义 把实验测量数量(因变量)进行逐项相减或依顺序分为两组实行对应项测量数据相减之差作因变量的多次测量值。然后求出最佳值——算术平均值的处理数据的方法。
例: 伏安法测电阻,试用逐差法求出电流I的最佳值并算出电阻R
解: 根据伏安公式 ①.若按逐项相减,则有
②.若按顺序分为两组(1~5为一组,6~10为一组) 实行对应项相减,其结果如表: 可以利用这种分组法计算因变量 的平均值 根据欧姆定律得
2.有关逐差法的几点说明 ①作用: ②优点: ③使用条件: 自变量等间隔变化(对一次逐差必须 是线性关系,否则先进行曲线改直) 验证函数是否线性关系(一次逐差) 用数据进行直线拟合(一次逐差) ②优点: 充分利用测量数据(取平均的效果) ③使用条件: 自变量等间隔变化(对一次逐差必须 是线性关系,否则先进行曲线改直)
四、最小二乘法 近性计算法比较: 作图法: 直观、简便。但主观随意性大(粗略) 逐差法: 粗略的近似计算方法(要满足一定条件) 作图法: 直观、简便。但主观随意性大(粗略) 逐差法: 粗略的近似计算方法(要满足一定条件) 回归分析法: 最准确的计算方法
1.回归分析法定义: 步骤: 由数理统计的方法处理数据,通过计算确定其函数关系的方法。 1.推断函数形式(回归方程) 如 y=a+bx (线性关系) y=aebx+c (指数关系) 2.由实验数据确定参数a、b、 c等的最佳值。 3.根据实验数据检验函数关系 是否合理。
2.用最小二乘法进行一元线性回归 (1)最小二乘法原理 给定函数关系为 y = a + bx
(2)一元线性回归(直线拟合) …... 函数形式 实验数据为 由于x和y的测量存在误差,将 代入(1)式,等式两边并不相等。 等式两端的差值用 表示,则 …...
按最小二乘法原理,a、b最佳值应满足: (2) (2)式对a和b求偏导应为0。 由于 最小, 整理后得 (3)
由于 代入(3)式有:
(3)相关系数r 相关系数:定量描述x、y变量之间线性相关程度的好坏 式中 r>0 拟合曲线斜率为正 r<0 斜率为负
(4)举例 还是以铜电阻~温度关系为例,测得的一组数据如表所示。已知Rt和t的函数关系为Rt=a+bt,试用最小二乘法求出a、b。
如果把数据代入计算γ的公式中就可得到γ的值为0.999。说明它们的线性关系良好。 解: 如果把数据代入计算γ的公式中就可得到γ的值为0.999。说明它们的线性关系良好。
3. 线性回归方程的显著性检验 因此,必须对回归方程的拟合情况或效果作显著性检验。 其理论基础就是总平方和的分解,即
表示n个y1、y2、…、yn与 之间的差异,当 各个yi已知时,它是一个定值,称为总平方 和,记作SST。
通过回归已经达到了最小值,称为剩余平 方和,记作SSE。 称为回归平方和,记作SSR。
因此,SST=SSE+SSR。 如果SSR的数值较大,SSE的数值便比较 小,说明回归的效果好;如果SSR的数值 较小,SSE的数值便比较大,说明回归的 效果差。
可以推出:r>0时b>0,x增加时Y的观测值 值呈减少的趋势。因此r>0时称x与Y正相关, r<0时称x与Y负相关。 综上所述,如果设H0为β=0,也就是假设 x与Y不是线性关系,则可以用以下三种实质 相同的方法检验线性回归方程的显著性,且 当检验的结果显著时x与Y的线性关系显著, 回归方程可供应用;当检验的结果不显著时 x与Y的线性关系不显著,回归方程不可应用。
⑴ F检验法: 当H0为真时, 且SSR与SSE相互独立;因此,当H0为真时, 当F≥F1-α(1,n-2)时应该放弃原假设H0。
(2)t检验法: 当H0为真时, 当|t|≥t1-0.5α(n-2)时应该放弃原假设H0。
(3)r检验法: 根据x与Y的观测值的相关系数 可以推出 当H0为真时,
当F≥F1-α(1,n-2)或|r|≥rα(n-2)时应该放 弃原假设H0,式中的 可由r检验用表中查出。 因此,r常常用来表示x与Y的线性关系在x 与Y的全部关系中所占的百分比,又称为x 与Y的观测值的决定系数。
4. 利用回归方程进行点预测和区间预测 若线性回归作显著性检验的结果是放弃H0, 也就是放弃回归系数β=0的假设,便可以 利用回归方程进行点预测和区间预测,这是 人们关注线性回归的主要原因之一。 ⑴ 当x=x0时, Y0的观测值y0的点预测是无偏的。
⑵ 当x=x0时,用适合不等式P{Y0∈(G,H)}≥ 1-α的统计量G和H所确定的随机区间(G,H) 预测Y0的取值范围称为区间预测,而(G,H)称 为Y0的1-α预测区间。 若Y0与样本中的各Yi相互独立,则根据 Z=Y0-(a+bx0)服从正态分布,E(Z)=0, Z与SSE相互独立,
可以导出 因此,Y0的1-α预测区间为 a+bx0±Δ(x0),
第5 可化为线性的非线性回归 一、回归方程的建立 对有些模型,如:
等,y对自变量x都不是线性的,但y对参数 和 而言是线性的,在这种情况下,我们只需把ex、㏑x、x2等视作变量,用简单的代换就可将上述模型化为线性模型 对于另外一些模型,如
等,虽然y对x和参数 都不是线性的,但也可通过适当变换化为线性模型。对于上述这些可化为线性模型的回归问题,一般先将其化为线性模型,然后再用最小二乘法求出参数的估计值,最后再经过适当的变换,得到所求回归曲线。
等,虽然y对x和参数 都不是线性的,但也可通过适当变换化为线性模型。对于上述这些可化为线性模型的回归问题,一般先将其化为线性模型,然后再用最小二乘法求出参数的估计值,最后再经过适当的变换,得到所求回归曲线。
在熟练掌握最小二乘法的情况下,解决上述问题的关键是确定曲线类型和怎样将其转化为线性模型。确定曲线类型一般从两个方面考虑:一是根据专业知识,从理论上推导或凭经验推测、二是在专业知识无能为力的情况下,通过绘制和观测散点图确定曲线大体类型。 常用的可变换为线性的曲线主要有六种,其曲线图形参见图2-4-1,其变换式列于表2-4-1,,供读者使用时参考。
表2-4-1各种非线性回归模型
本章小结 列表法 作图法 逐差法 最小二乘法
end