第十章统计回归模型 10.1 牙膏的销售量 10.2 软件开发人员的薪金 10.3 酶促反应 10.4 投资额与国民生产总值和物价指数.

Slides:

Advertisements

Similar presentations

一、一阶线性微分方程及其解法二、一阶线性微分方程的简单应用三、小结及作业 §6.2 一阶线性微分方程.

Advertisements

第五节函数的微分一、微分的定义二、微分的几何意义三、基本初等函数的微分公式与微分运算法则四、微分形式不变性五、微分在近似计算中的应用六、小结.

信号与系统第三章傅里叶变换东北大学 2017/2/27.

非线性时间序列模型一般非线性时间序列模型介绍条件异方差模型上海财经大学统计与管理学院.

第六章回归分析.

第十章相关与回归分析 PowerPoint 统计学.

第五章二次型. 第五章二次型知识点1---二次型及其矩阵表示二次型的基本概念 1. 线性变换与合同矩阵 2.

一、能线性化的多元非线性回归二、多元多项式回归（线性化）

金融风险评估与管理估值投资组合风险管理-三大块

6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.

§4.3 多重共线性 Multi-Collinearity.

预测与决策分析 Forecasting and Decision Analysis

第二章经典单方程计量经济学模型：一元线性回归模型

量化视角下的豆粕投资机会分析格林期货研发培训中心郭坤龙.

计量经济学第六章自相关.

第四章　函数的积分学第六节　微积分的基本公式一、变上限定积分二、微积分的基本公式.

第5章定积分及其应用基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法

第三篇医学统计学方法. 第三篇医学统计学方法医学统计学方法实习2 主讲人陶育纯医学统计学方法实习2 主讲人陶育纯流行病与卫生统计学教研室

不确定度的传递与合成间接测量结果不确定度的评估

计量经济学第三章多元线性回归模型.

第十章回归分析预测法第一节相关分析第二节一元线性回归预测法第三节多元线性回归预测法第四节非线性回归预测法.

第一节引言第二节一元线性回归模型第三节多元线性回归模型第四节虚拟变量回归模型第五节非线性回归模型本章小节主要内容.

Applied Regression Analysis

第三章多维随机变量及其分布 §2 边缘分布边缘分布函数边缘分布律边缘概率密度.

第12章回归直线.

§3.3 多元线性回归模型的统计检验一、拟合优度检验二、方程的显著性检验(F检验) 三、变量的显著性检验（t检验）四、参数的置信区间.

引子：国内生产总值增加会减少财政收入吗？

第二章回归模型法、参数的普通最小二乘估计式及相关性质、对模型的经济意义检验和统计检验，能应用Eviews软件进行最小二乘估计与统

一元线性回归模型 § 1 回归分析概述 § 2 一元线性回归模型的参数估计 § 3 一元线性回归模型的统计检验

面向对象建模技术软件工程系林琳.

数学实验之回归分析(1).

第2章一元线性回归 2 .1 一元线性回归模型 2 .2 参数的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验

第2章一元线性回归分析 §2.1 ：回归分析及回归模型 §2.2 ：一元线性模型的参数估计 §2.3 ：参数估计值的性质及统计推断

第十章方差分析.

数据挖掘工具性能比较.

统计学 (第三版) 2008 作者贾俊平统计学.

第七章参数估计 7.3 参数的区间估计.

若2002年我国国民生产总值为亿元，如果，那么经过多少年国民生产总值每年平均增长是2002年时的2倍？解：设经过年国民生产总值为2002年时的2倍, 根据题意有，即.

习题一、概率论 1.已知随机事件A，B，C满足在下列三种情况下，计算（1）A，B，C相互独立（2）A，B独立，A，C互不相容

9.1 简单线性相关分析 9.2 一元线性回归分析 9.3 多元线性回归与复相关分析 9.4 变量间非线性关系的回归

（实验二）回归函数的线性性、误差的独立性和方差齐性的诊断

模型分类问题 Presented by 刘婷婷苏琬琳.

概率统计主讲教师叶宏山东大学数学院.

5.2 常用统计分布一、常见分布二、概率分布的分位数三、小结.

第六章自相关.

§4.2 序列相关性 Serial Correlation.

用统计学方法研究电商平台上的产品销售特征

相关与回归非确定关系在宏观上存在关系，但并未精确到可以用函数关系来表达。青少年身高与年龄，体重与体表面积非确定关系：

一测定气体分子速率分布的实验实验装置金属蒸汽显示屏狭缝接抽气泵.

第三章两变量线性回归.

第四章多元线性回归分析.

第一部分：概率产生随机样本：对分布采样均匀分布其他分布伪随机数很多统计软件包中都有此工具如在Matlab中：rand

§5.2 抽样分布　　确定统计量的分布——抽样分布，是数理统计的基本问题之一．采用求随机向量的函数的分布的方法可得到抽样分布．由于样本容量一般不止2或 3(甚至还可能是随机的)，故计算往往很复杂，有时还需要特殊技巧或特殊工具．　　由于正态总体是最常见的总体，故本节介绍的几个抽样分布均对正态总体而言．

GIS基本功能数据存储与管理数据采集数据处理与编辑空间查询空间查询 GIS能做什么？与分析叠加分析缓冲区分析网络分析

概率论与数理统计B.

第二节函数的极限一、函数极限的定义二、函数极限的性质三、小结思考题.

第二节简单线性回归模型的最小二乘估计用样本去估计总体回归函数，总要使用特定的方法，而任何估计参数的方法都需要有一定的前提条件——假定条件一、简单线性回归的基本假定为什么要作基本假定？ ●只有具备一定的假定条件，所作出的估计才具有良好的统计性质。 ●模型中有随机扰动项，估计的参数是随机变量，显然参数估计值的分布与扰动项的分布有关，只有对随机扰动的分布作出假定，才能比较方便地确定所估计参数的分布性质，也才可能进行假设检验和区间估计等统计推断。

第三节随机区组设计的方差分析随机区组设计资料的总平方和可以分解为三项：（10.10）.

第十五讲区间估计本次课讲完区间估计并开始讲授假设检验部分下次课结束假设检验，并进行全书复习本次课程后完成作业的后两部分

滤波减速器的体积优化仵凡 Advanced Design Group.

回归分析实验课程（实验三）多项式回归和定性变量的处理.

多元线性回归分析.

第三章从概率分布函数的抽样 (Sampling from Probability Distribution Functions)

Volterra-Lotka方程 1925年, A. Lotka(美)和V. Volterra(意)给出了第一个两物种间的捕食模型。

3.1回归分析的基本思想及其初步应用（四）高二数学选修2-3 第三章统计案例.

数学模型实验课（二）最小二乘法与直线拟合.

高中物理“平抛运动的应用” 点评专家：谭一宁.

Presentation transcript:

第十章统计回归模型 10.1 牙膏的销售量 10.2 软件开发人员的薪金 10.3 酶促反应 10.4 投资额与国民生产总值和物价指数

数学建模的基本方法机理分析测试分析由于客观事物内部规律的复杂及人们认识程度的限制,无法分析实际对象内在的因果关系，建立合乎机理规律的数学模型。通过对数据的统计分析，找出与数据拟合最好的模型回归模型是用统计分析方法建立的最常用的一类模型不涉及回归分析的数学原理和方法通过实例讨论如何选择不同类型的模型对软件得到的结果进行分析，对模型进行改进

10.1 牙膏的销售量问题建立牙膏销售量与价格、广告投入之间的模型预测在不同价格和广告费用下的牙膏销售量 10.1 牙膏的销售量建立牙膏销售量与价格、广告投入之间的模型问题预测在不同价格和广告费用下的牙膏销售量收集了30个销售周期本公司牙膏销售量、价格、广告费用，及同期其它厂家同类牙膏的平均售价 9.26 0.55 6.80 4.25 3.70 30 7.93 0.05 5.80 3.85 3.80 29  8.51 0.25 6.75 4.00 3.75 2 7.38 -0.05 5.50 1 销售量 (百万支) 价格差（元）广告费用 (百万元) 其它厂家价格(元) 本公司价格(元) 销售周期

~随机误差（均值为零的正态分布随机变量）基本模型 x1 y y ~公司牙膏销售量 x1~其它厂家与本公司价格差 x2~公司广告费用 y~被解释变量（因变量） x2 y x1, x2~解释变量(回归变量, 自变量) 0, 1 , 2 , 3 ~回归系数 ~随机误差（均值为零的正态分布随机变量）

模型求解由数据 y,x1,x2估计 [b,bint,r,rint,stats]=regress(y,x,alpha) 输入输出 MATLAB 统计工具箱由数据 y,x1,x2估计 [b,bint,r,rint,stats]=regress(y,x,alpha) 输入输出 y~n维数据向量 b~的估计值 x= ~n4数据矩阵, 第1列为全1向量 bint~b的置信区间 r ~残差向量y-xb alpha(置信水平,0.05) rint~r的置信区间参数参数估计值置信区间 17.3244 [5.7282 28.9206] 1.3070 [0.6829 1.9311 ] -3.6956 [-7.4989 0.1077 ] 0.3486 [0.0379 0.6594 ] R2=0.9054 F=82.9409 p=0.0000 0 1 2 3 Stats~ 检验统计量 R2,F, p

结果分析 y的90.54%可由模型确定 F远超过F检验的临界值 p远小于=0.05 模型从整体上看成立 x2对因变量y 的影响不太显著参数参数估计值置信区间 17.3244 [5.7282 28.9206] 1.3070 [0.6829 1.9311 ] -3.6956 [-7.4989 0.1077 ] 0.3486 [0.0379 0.6594 ] R2=0.9054 F=82.9409 p=0.0000 0 1 2 3 y的90.54%可由模型确定 F远超过F检验的临界值 p远小于=0.05 模型从整体上看成立 2的置信区间包含零点(右端点距零点很近) x2对因变量y 的影响不太显著 x22项显著可将x2保留在模型中

若估计x3=3.9，设定x4=3.7，则可以95%的把握知道销售额在 7.83203.7 29（百万元）以上销售量预测价格差x1=其它厂家价格x3-本公司价格x4 估计x3 调整x4 控制x1 通过x1, x2预测y 控制价格差x1=0.2元，投入广告费x2=650万元 (百万支) 销售量预测区间为 [7.8230，8.7636]（置信度95%）上限用作库存管理的目标值下限用来把握公司的现金流若估计x3=3.9，设定x4=3.7，则可以95%的把握知道销售额在 7.83203.7 29（百万元）以上

模型改进 x1和x2对y的影响独立 x1和x2对y的影响有交互作用参数参数估计值置信区间 17.3244 [5.7282 28.9206] 1.3070 [0.6829 1.9311 ] -3.6956 [-7.4989 0.1077 ] 0.3486 [0.0379 0.6594 ] R2=0.9054 F=82.9409 p=0.0000 0 1 2 3 x1和x2对y的影响独立 x1和x2对y的影响有交互作用参数参数估计值置信区间 29.1133 [13.7013 44.5252] 11.1342 [1.9778 20.2906 ] -7.6080 [-12.6932 -2.5228 ] 0.6712 [0.2538 1.0887 ] -1.4777 [-2.8518 -0.1037 ] R2=0.9209 F=72.7771 p=0.0000 3 0 1 2 4

两模型销售量预测比较控制价格差x1=0.2元，投入广告费x2=6.5百万元 (百万支) 区间 [7.8230，8.7636] (百万支) 区间 [7.8953，8.7592] 略有增加预测区间长度更短

两模型与x1,x2关系的比较 x1 x1 x2=6.5 x2 x2 x1=0.2

交互作用影响的讨论价格差 x1=0.1 价格差 x1=0.3 价格优势会使销售量增加 x2 加大广告投入使销售量增加价格差较小时增加的速率更大价格差较小时更需要靠广告来吸引顾客的眼球

MATLAB中有命令rstool直接求解完全二次多项式模型 MATLAB中有命令rstool直接求解 x1 x2 从输出 Export 可得

10.2 软件开发人员的薪金建立模型研究薪金与资历、管理责任、教育程度的关系分析人事策略的合理性，作为新聘用人员薪金的参考 10.2 软件开发人员的薪金建立模型研究薪金与资历、管理责任、教育程度的关系分析人事策略的合理性，作为新聘用人员薪金的参考编号薪金资历管理教育 01 13876 1 02 11608 3 03 18701 04 11283 2  42 27837 16 43 18838 44 17483 45 19207 17 46 19346 20 46名软件开发人员的档案资料资历~ 从事专业工作的年数；管理~ 1=管理人员，0=非管理人员；教育~ 1=中学，2=大学，3=更高程度

分析与假设 y~ 薪金，x1 ~资历（年） x2 = 1~ 管理人员，x2 = 0~ 非管理人员 1=中学2=大学3=更高中学：x3=1, x4=0 ；大学：x3=0, x4=1；更高：x3=0, x4=0 教育资历每加一年薪金的增长是常数；管理、教育、资历之间无交互作用线性回归模型 a0, a1, …, a4是待估计的回归系数，是随机误差

模型求解参数参数估计值置信区间 a0 11032 [ 10258 11807 ] a1 546 [ 484 608 ] a2 6883 [ 10258 11807 ] a1 546 [ 484 608 ] a2 6883 [ 6248 7517 ] a3 -2994 [ -3826 -2162 ] a4 148 [ -636 931 ] R2=0.957 F=226 p=0.000 资历增加1年薪金增长546 管理人员薪金多6883 中学程度薪金比更高的少2994 大学程度薪金比更高的多148 R2,F, p 模型整体上可用中学：x3=1, x4=0;大学：x3=0, x4=1; 更高：x3=0, x4=0. x2 = 1~ 管理，x2 = 0~ 非管理 x1~资历(年) a4置信区间包含零点，解释不可靠!

结果分析残差分析方法残差组合 1 2 3 4 5 6 管理教育管理与教育的组合 e 与资历x1的关系 e与管理—教育组合的关系教育管理与教育的组合残差 e 与资历x1的关系 e与管理—教育组合的关系残差全为正，或全为负，管理—教育组合处理不当残差大概分成3个水平， 6种管理—教育组合混在一起，未正确反映。应在模型中增加管理x2与教育x3, x4的交互项

进一步的模型增加管理x2与教育x3, x4的交互项参数参数估计值置信区间 a0 11204 [11044 11363] a1 497 [11044 11363] a1 497 [486 508] a2 7048 [6841 7255] a3 -1727 [-1939 -1514] a4 -348 [-545 –152] a5 -3071 [-3372 -2769] a6 1836 [1571 2101] R2=0.999 F=554 p=0.000 e ~ x1 e ~组合 R2,F有改进，所有回归系数置信区间都不含零点，模型完全可用消除了不正常现象异常数据(33号)应去掉

去掉异常数据后的结果 R2： 0.957  0.999  0.9998 残差图十分正常 F： 226  554  36701 e ~ x1 参数参数估计值置信区间 a0 11200 [11139 11261] a1 498 [494 503] a2 7041 [6962 7120] a3 -1737 [-1818 -1656] a4 -356 [-431 –281] a5 -3056 [-3171 –2942] a6 1997 [1894 2100] R2= 0.9998 F=36701 p=0.0000 e ~组合 R2： 0.957  0.999  0.9998 F： 226  554  36701 置信区间长度更短残差图十分正常最终模型的结果可以应用

模型应用制订6种管理—教育组合人员的“基础”薪金(资历为0）大学程度管理人员比更高程度管理人员的薪金高 x1= 0； x2 = 1~ 管理，x2 = 0~ 非管理中学：x3=1, x4=0 ；大学：x3=0, x4=1；更高：x3=0, x4=0 组合管理教育系数 “基础”薪金 1 a0+a3 9463 2 a0+a2+a3+a5 13448 3 a0+a4 10844 4 a0+a2+a4+a6 19882 5 a0 11200 6 a0+a2 18241 大学程度管理人员比更高程度管理人员的薪金高大学程度非管理人员比更高程度非管理人员的薪金略低

软件开发人员的薪金对定性因素(如管理、教育)，可以引入0-1变量处理，0-1变量的个数应比定性因素的水平少1 残差分析方法可以发现模型的缺陷，引入交互作用项常常能够改善模型剔除异常数据，有助于得到更好的结果注：可以直接对6种管理—教育组合引入5个0-1变量

10.3 酶促反应问题方案研究酶促反应（酶催化反应）中嘌呤霉素对反应速度与底物（反应物）浓度之间关系的影响 10.3 酶促反应研究酶促反应（酶催化反应）中嘌呤霉素对反应速度与底物（反应物）浓度之间关系的影响问题建立数学模型，反映该酶促反应的速度与底物浓度以及经嘌呤霉素处理与否之间的关系方案设计了两个实验：酶经过嘌呤霉素处理；酶未经嘌呤霉素处理。实验数据见下表: 底物浓度(ppm) 0.02 0.06 0.11 0.22 0.56 1.10 反应速度处理 76 47 97 107 123 139 159 152 191 201 207 200 未处理 67 51 84 86 98 115 131 124 144 158 160 /

线性化模型对1 , 2非线性对1, 2线性经嘌呤霉素处理后实验数据的估计结果参数参数估计值（×10-3）置信区间（×10-3） 1 5.107 [3.539 6.676] 2 0.247 [0.176 0.319] R2=0.8557 F=59.2975 p=0.0000

参数估计时，x较小（1/x很大）的数据控制了回归参数的确定线性化模型结果分析 1/y 1/x x y 1/x较小时有很好的线性趋势，1/x较大时出现很大的起落 x较大时，y有较大偏差参数估计时，x较小（1/x很大）的数据控制了回归参数的确定

[beta,R,J] = nlinfit (x,y,’model’,beta0) 非线性模型参数估计 MATLAB 统计工具箱 [beta,R,J] = nlinfit (x,y,’model’,beta0) 输入 x~自变量数据矩阵 y ~因变量数据向量 beta0~线性化模型估计结果 x= ; y= ; beta0=[195.8027 0.04841]; [beta,R,J]=nlinfit(x,y,’f1’,beta0); betaci=nlparci(beta,R,J); beta, betaci model ~模型的函数M文件名 beta0 ~给定的参数初值输出 beta ~参数的估计值R ~残差，J ~估计预测误差的Jacobi矩阵 beta的置信区间 function y=f1(beta, x) y=beta(1)*x./(beta(2)+x); betaci =nlparci(beta,R,J)

非线性模型结果分析其它输出最终反应速度为半速度点(达到最终速度一半时的x值 )为命令nlintool 给出交互画面参数参数估计值置信区间 1 212.6819 [197.2029 228.1609] 2 0.0641 [0.0457 0.0826 ] o ~原始数据 + ~ 拟合结果最终反应速度为半速度点(达到最终速度一半时的x值 )为其它输出命令nlintool 给出交互画面拖动画面的十字线，得 y的预测值和预测区间画面左下方的Export 输出其它统计结果。剩余标准差s= 10.9337

混合反应模型在同一模型中考虑嘌呤霉素处理的影响 x1为底物浓度， x2为一示性变量 x2=1表示经过处理，x2=0表示未经处理 β1是未经处理的最终反应速度 γ1是经处理后最终反应速度的增长值 β2是未经处理的反应的半速度点 γ2是经处理后反应的半速度点的增长值

混合模型求解参数初值估计结果和预测 2置信区间包含零点，表明2对因变量y的影响不显著经嘌呤霉素处理的作用不影响半速度点参数用nlinfit 和 nlintool命令参数初值 (基于对数据的分析) o ~原始数据 + ~拟合结果估计结果和预测未经处理经处理参数参数估计值置信区间 1 160.2802 [145.8466 174.7137] 2 0.0477 [0.0304 0.0650 ] 1 52.4035 [32.4130 72.3941 ] 2 0.0164 [-0.0075 0.0403] 剩余标准差s= 10.4000 2置信区间包含零点，表明2对因变量y的影响不显著经嘌呤霉素处理的作用不影响半速度点参数

简化的混合模型估计结果和预测简化的混合模型形式简单，参数置信区间不含零点剩余标准差 s = 10.5851，比一般混合模型略大参数 o ~原始数据 + ~拟合结果未经处理经处理参数参数估计值置信区间 1 166.6025 [154.4886 178.7164] 2 0.0580 [0.0456 0.0703 ] 1 42.0252 [28.9419 55.1085] 简化的混合模型形式简单，参数置信区间不含零点剩余标准差 s = 10.5851，比一般混合模型略大

一般混合模型与简化混合模型预测比较简化混合模型的预测区间较短，更为实用、有效预测区间为预测值  Δ 实际值一般模型预测值 Δ(一般模型）简化模型预测值 Δ(简化模型） 67 47.3443 9.2078 42.7358 5.4446 51 84 89.2856 9.5710 84.7356 7.0478 … 191 190.8329 9.1484 189.0574 8.8438 201 207 200.9688 11.0447 198.1837 10.1812 200 简化混合模型的预测区间较短，更为实用、有效

嘌呤霉素处理对反应速度与底物浓度关系的影响酶促反应机理分析反应速度与底物浓度的关系非线性关系求解线性模型发现问题，得参数初值求解非线性模型嘌呤霉素处理对反应速度与底物浓度关系的影响引入0-1变量混合模型检查参数置信区间是否包含零点简化模型注：非线性模型拟合程度的评价无法直接利用线性模型的方法，但R2 与s仍然有效。

根据对未来GNP及PI的估计，预测未来投资额 10.4 投资额与国民生产总值和物价指数问题建立投资额模型，研究某地区实际投资额与国民生产总值 ( GNP ) 及物价指数 ( PI ) 的关系根据对未来GNP及PI的估计，预测未来投资额该地区连续20年的统计数据年份序号投资额国民生产总值物价指数年份序号投资额国民生产总值物价指数 1 90.9 596.7 0.7167 11 229.8 1326.4 1.0575 2 97.4 637.7 0.7277 12 228.7 1434.2 1.1508 3 113.5 691.1 0.7436 13 206.1 1549.2 1.2579 4 125.7 756.0 0.7676 14 257.9 1718.0 1.3234 5 122.8 799.0 0.7906 15 324.1 1918.3 1.4005 6 133.3 873.4 0.8254 16 386.6 2163.9 1.5042 7 149.3 944.0 0.8679 17 423.0 2417.8 1.6342 8 144.2 992.7 0.9145 18 401.9 2631.7 1.7842 9 166.4 1077.6 0.9601 19 474.9 2954.7 1.9514 10 195.0 1185.9 1.0000 20 424.5 3073.0 2.0688

若采用普通回归模型直接处理，将会出现不良后果投资额与国民生产总值和物价指数分析许多经济数据在时间上有一定的滞后性以时间为序的数据，称为时间序列时间序列中同一变量的顺序观测值之间存在自相关若采用普通回归模型直接处理，将会出现不良后果需要诊断并消除数据的自相关性，建立新的模型 … 1.3234 1718.0 257.9 14 0.7676 756.0 125.7 4 1.2579 1549.2 206.1 13 0.7436 691.1 113.5 3 1.1508 1434.2 228.7 12 0.7277 637.7 97.4 2 1.0575 1326.4 229.8 11 0.7167 596.7 90.9 1 物价指数国民生产总值投资额年份序号年份序号

基本回归模型 t ~年份， yt ~ 投资额，x1t~ GNP, x2t ~ 物价指数投资额与 GNP及物价指数间均有很强的线性关系 0, 1, 2 ~回归系数 t ~对t相互独立的零均值正态随机变量

基本回归模型的结果与分析剩余标准差 s=12.7164 模型优点 R2＝0.9908，拟合度高模型缺点没有考虑时间序列数据的滞后性影响 MATLAB 统计工具箱参数参数估计值置信区间 0 322.7250 [224.3386 421.1114] 1 0.6185 [0.4773 0.7596] 2 -859.4790 [-1121.4757 -597.4823 ] R2= 0.9908 F= 919.8529 p=0.0000 剩余标准差 s=12.7164 模型优点 R2＝0.9908，拟合度高模型缺点没有考虑时间序列数据的滞后性影响可能忽视了随机误差存在自相关；如果存在自相关性，用此模型会有不良后果

自相关性的定性诊断模型残差 et为随机误差t 的估计值在MATLAB工作区中输出作残差 et~et-1 散点图残差诊断法模型残差 et-1 et et为随机误差t 的估计值在MATLAB工作区中输出作残差 et~et-1 散点图大部分点落在第1, 3象限 t 存在正的自相关大部分点落在第2, 4象限 t 存在负的自相关基本回归模型的随机误差项t 存在正的自相关自相关性直观判断

自回归性的定量诊断 D-W检验自回归模型 0, 1, 2 ~回归系数 ρ~自相关系数 ut ~对t相互独立的零均值正态随机变量 ρ= 0 无自相关性 ρ> 0 存在正自相关性存在负自相关性 ρ< 0 如何估计ρ D-W统计量如何消除自相关性广义差分法

 D-W统计量与D-W检验检验水平,样本容量，回归变量数目由DW值的大小确定自相关性检验临界值dL和dU n较大 DW 4-dU 4 2 正自相关负自不能确定无自相关检验水平,样本容量，回归变量数目 D-W分布表由DW值的大小确定自相关性检验临界值dL和dU

广义差分变换原模型变换新模型以*0, 1 , 2 为回归系数的普通回归模型步骤原模型 DW值 D-W检验无自相关原模型继续此过程有自相关新模型增加数据量；选用其它方法不能确定

投资额新模型的建立原模型残差et DWold=0.8754 样本容量n=20，回归变量数目k=3，=0.05 原模型有正自相关 DWold < dL 查表临界值dL=1.10, dU=1.54 作变换 DW 4-dU 4 4-dL dU dL 2 正自相关负自不能确定无自相关

投资额新模型的建立总体效果良好剩余标准差 snew= 9.8277 < sold=12.7164 参数参数估计值置信区间 *0 163.4905 [1265.4592 2005.2178] 1 0.6990 [0.5751 0.8247] 2 -1009.0333 [-1235.9392 -782.1274] R2= 0.9772 F=342.8988 p=0.0000 总体效果良好剩余标准差 snew= 9.8277 < sold=12.7164

新模型的自相关性检验新模型残差et DWnew=1.5751 样本容量n=19，回归变量数目k=3，=0.05 4-dU 4 4-dL dU dL 2 正自相关负自不能确定无自相关新模型残差et DWnew=1.5751 样本容量n=19，回归变量数目k=3，=0.05 dU< DWnew < 4-dU 新模型无自相关性查表临界值dL=1.08, dU=1.53 新模型还原为原始变量一阶自回归模型

模型结果比较基本回归模型一阶自回归模型一阶自回归模型残差et比基本回归模型要小新模型 et~ *，原模型 et~ + 残差图比较新模型 ŷt ~ *，新模型 ŷt ~ + 拟合图比较一阶自回归模型残差et比基本回归模型要小

投资额预测对未来投资额yt 作预测，需先估计出未来的国民生产总值x1t 和物价指数 x2t 一阶自回归模型 2.0688 3073.0 424.5 20 1.9514 2954.7 474.9 19 1.7842 2631.7 401.9 18 0.7436 691.1 113.5 3 0.7277 637.7 97.4 2 0.7167 596.7 90.9 1 物价指数国民生产总值投资额年份序号年份序号设已知 t=21时， x1t =3312，x2t=2.1938 基本回归模型一阶自回归模型 ŷt 较小是由于yt-1=424.5过小所致