§4.2 序列相关性 Serial Correlation
§4.2 序列相关性 一、序列相关性概念 二、实际经济问题中的序列相关性 三、序列相关性的后果 四、序列相关性的检验 §4.2 序列相关性 一、序列相关性概念 二、实际经济问题中的序列相关性 三、序列相关性的后果 四、序列相关性的检验 五、具有序列相关性模型的估计 六、案例
如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了序列相关性。 一、序列相关性概念 对于模型 Yi=0+1X1i+2X2i+…+kXki+i i=1,2, …,n 随机项互不相关的基本假设表现为 Cov(i , j)=0 ij, i,j=1,2, …,n 如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了序列相关性。
或
i=i-1+i -1<<1 如果仅存在 E(i i+1)0 i=1,2, …,n 称为一阶列相关,或自相关(autocorrelation) 自相关往往可写成如下形式: i=i-1+i -1<<1 其中:被称为自协方差系数(coefficient of autocovariance)或一阶自相关系数(first-order coefficient of autocorrelation) i是满足以下标准的OLS假定的随机干扰项: 由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标t代表i。
二、实际经济问题中的序列相关性 1、经济变量固有的惯性 例如,绝对收入假设下居民总消费函数模型: 大多数经济时间数据都有一个明显的特点:惯性,表现在时间序列不同时间的前后关联上。 例如,绝对收入假设下居民总消费函数模型: Ct=0+1Yt+t t=1,2,…,n 由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关 )。
2、模型设定的偏误 所谓模型设定偏误(Specification error)是指所设定的模型“不正确”。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。 例如,本来应该估计的模型为 Yt=0+1X1t+ 2X2t + 3X3t + t 但在模型设定中做了下述回归: Yt=0+1X1t+ 1X2t + vt 因此, vt=3X3t + t,如果X3确实影响Y,则出现序列相关。
但建模时设立了如下模型: 又如:如果真实的边际成本回归模型应为: 其中:Y=边际成本,X=产出, Yt= 0+1Xt+vt Yt= 0+1Xt+2Xt2+t 其中:Y=边际成本,X=产出, 但建模时设立了如下模型: Yt= 0+1Xt+vt 因此,由于vt= 2Xt2+t, ,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。
3、数据的“编造” 因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。 在实际经济问题中,有些数据是通过已知数据生成的。 因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。 例如:季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动性,从而使随机干扰项出现序列相关。 还有就是两个时间点之间的“内插”技术往往导致随机项的序列相关性。
二、序列相关性的后果 计量经济学模型一旦出现序列相关性,如果仍采用OLS法估计模型参数,会产生下列不良后果: 1、参数估计量非有效 因为,在有效性证明中利用了 E(NN’)=2I 即同方差性和互相独立性条件。 而且,在大样本情况下,参数估计量虽然具有一致性,但仍然不具有渐近有效性。
在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。 2、变量的显著性检验失去意义 在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。 其他检验也是如此。
3、模型的预测失效 区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。 所以,当模型出现序列相关性时,它的预测功能失效。
三、序列相关性的检验
三、序列相关性的检验 基本思路: 序列相关性检验方法有多种,但基本思路相同: 然后,通过分析这些“近似估计量”之间的相关性,以判断随机误差项是否具有序列相关性。
1、图示法
2、回归检验法 如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。 …… 如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。 回归检验法的优点是:(1)能够确定序列相关的形式,(2)适用于任何类型序列相关性问题的检验。
3、杜宾-瓦森(Durbin-Watson)检验法 D-W检验是杜宾(J.Durbin)和瓦森(G.S. Watson)于1951年提出的一种检验序列自相关的方法,该方法的假定条件是: (1)解释变量X非随机; (2)随机误差项i为一阶自回归形式: i=i-1+i (3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式: Yi=0+1X1i+kXki+Yi-1+i (4)回归含有截距项
但是,他们成功地导出了临界值的下限dL和上限dU ,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。 D.W. 统计量: 杜宾和瓦森针对原假设:H0: =0, 即不存在一阶自回归,构如下造统计量: 该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精确的分布很难得到。 但是,他们成功地导出了临界值的下限dL和上限dU ,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。
D.W检验步骤: (1)计算DW值 (2)给定,由n和k的大小查DW分布表,得临界值dL和dU (3)比较、判断 dL<D.W.<dU 不能确定 dU <D.W.<4-dU 无自相关 4-dU <D.W.<4- dL 不能确定 4-dL <D.W.<4 存在负自相关 不能确定 不能确定 无自相关 正相关 负相关 0 dL dU 2 4-dU 4-dL
当D.W.值在2左右时,模型不存在一阶自相关。 证明: 展开D.W.统计量: (*)
这里, 为一阶自回归模型 i=i-1+i 的参数估计。 如果存在完全一阶正相关,即=1,则 D.W. 0 完全一阶负相关,即= -1, 则 D.W. 4 完全不相关, 即=0,则 D.W.2
4、拉格朗日乘数(Lagrange multiplier)检验 拉格朗日乘数检验克服了DW检验的缺陷,适合于高阶序列相关以及模型中存在滞后被解释变量的情形。 它是由布劳殊(Breusch)与戈弗雷(Godfrey)于1978年提出的,也被称为GB检验。 对于模型 如果怀疑随机扰动项存在p阶序列相关:
GB检验可用来检验如下受约束回归方程 约束条件为: H0: 1=2=…=p =0 约束条件H0为真时,大样本下 其中,n为样本容量,R2为如下辅助回归的可决系数: 给定,查临界值2(p),与LM值比较,做出判断, 实际检验中,可从1阶、2阶、…逐次向更高阶检验。
如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型。 四、序列相关的补救 如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型。 最常用的方法是广义最小二乘法(GLS: Generalized least squares)和广义差分法(Generalized Difference)。
1、广义最小二乘法 对于模型 Y=X+ 如果存在序列相关,同时存在异方差,即有 是一对称正定矩阵,存在一可逆矩阵D,使得 =DD’
该模型具有同方差性和随机误差项互相独立性: 变换原模型: D-1Y=D-1X +D-1 即 Y*=X* + * (*) 该模型具有同方差性和随机误差项互相独立性: (*)式的OLS估计: 这就是原模型的广义最小二乘估计量(GLS estimators),是无偏的、有效的估计量。
如何得到矩阵? 对的形式进行特殊设定后,才可得到其估计值。 如设定随机扰动项为一阶序列相关形式 i=i-1+i 则
2、广义差分法 广义差分法是将原模型变换为满足OLS法的差分模型,再进行OLS估计。 如果原模型 存在 可以将原模型变换为:
注意: 广义差分法就是上述广义最小二乘法,但是却损失了部分样本观测值。 如:一阶序列相关的情况下,广义差分是估计 这相当于 去掉第一行后左乘原模型Y=X+ 。即运用了GLS法,但第一次观测值被排除了。
3、随机误差项相关系数的估计 应用广义最小二乘法或广义差分法,必须已知随机误差项的相关系数1, 2, … , L 。 实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。 常用的估计方法有: 科克伦-奥科特(Cochrane-Orcutt)迭代法。 杜宾(durbin)两步法
(1)科克伦-奥科特迭代法。 以一元线性模型为例: 首先,采用OLS法估计原模型 Yi=0+1Xi+i i=1i-1+2i-2+Li-L+i
求出i新的“近拟估计值”, 并以之作为样本观测值,再次估计 i=1i-1+2i-2+Li-L+i
类似地,可进行第三次、第四次迭代。 关于迭代的次数,可根据具体的问题来定。 一般是事先给出一个精度,当相邻两次1,2, ,L的估计值之差小于这一精度时,迭代终止。 实践中,有时只要迭代两次,就可得到较满意的结果。两次迭代过程也被称为科克伦-奥科特两步法。
该方法仍是先估计1,2,,l,再对差分模型进行估计 (2)杜宾(durbin)两步法 该方法仍是先估计1,2,,l,再对差分模型进行估计 第一步,变换差分模型为下列形式 进行OLS估计,得各Yj(j=i-1, i-2, …,i-l)前的系数1,2, , l的估计值
应用软件中的广义差分法 在Eview/TSP软件包下,广义差分采用了科克伦-奥科特(Cochrane-Orcutt)迭代法估计。 在解释变量中引入AR(1)、AR(2)、…,即可得到参数和ρ1、ρ2、…的估计值。 其中AR(m)表示随机误差项的m阶自回归。在估计过程中自动完成了ρ1、ρ2、…的迭代。
注意: 如果能够找到一种方法,求得Ω或各序列相关系数j的估计量,使得GLS能够实现,则称为可行的广义最小二乘法(FGLS, Feasible Generalized Least Squares)。 FGLS估计量,也称为可行的广义最小二乘估计量(feasible general least squares estimators) 可行的广义最小二乘估计量不再是无偏的,但却是一致的,而且在科克伦-奥科特迭代法下,估计量也具有渐近有效性。 前面提出的方法,就是FGLS
4、虚假序列相关问题 由于随机项的序列相关往往是在模型设定中遗漏了重要的解释变量或对模型的函数形式设定有误,这种情形可称为虚假序列相关(false autocorrelation) ,应在模型设定中排除。 避免产生虚假序列相关性的措施是在开始时建立一个“一般”的模型,然后逐渐剔除确实不显著的变量。
五、案例:中国商品进口模型 经济理论指出,商品进口主要由进口国的经济发展水平,以及商品进口价格指数与国内价格指数对比因素决定的。 由于无法取得中国商品进口价格指数,我们主要研究中国商品进口与国内生产总值的关系。(下表)。
1. 通过OLS法建立如下中国商品进口方程: (2.32) (20.12) 2. 进行序列相关性检验。
DW检验 拉格朗日乘数检验 dl=1.27, du=1.45 由于 DW=0.628< dl ,故: 存在正自相关。 取=5%,由于n=24,k=2(包含常数项),查表得: dl=1.27, du=1.45 由于 DW=0.628< dl ,故: 存在正自相关。 拉格朗日乘数检验 2阶滞后: (0.23)(-0.50) (6.23) (-3.69) R2=0.6614 于是,LM=220.6614=14.55 取=5%,2分布的临界值20.05(2)=5.991 LM > 20.05(2) 故: 存在正自相关
表明: 存在正自相关;但ět-3的参数不显著,说明不存在3阶序列相关性。 3阶滞后: (0.22) (-0.497) (4.541) (-1.842) (0.087) R2=0.6615 于是,LM=210.6614=13.89 取=5%,2分布的临界值20.05(3)=7.815 LM > 20.05(3) 表明: 存在正自相关;但ět-3的参数不显著,说明不存在3阶序列相关性。
3、运用广义差分法进行自相关的处理 (1)采用杜宾两步法估计 第一步,估计模型 第二步,作差分变换: (1.76) (6.64) (-1.76) (5.88) (-5.19) (5.30) 第二步,作差分变换:
取=5%,DW>du=1.43 (样本容量24-2=22) 表明:已不存在自相关 则M*关于GDP*的OLS估计结果为: (2.76) (16.46) 取=5%,DW>du=1.43 (样本容量24-2=22) 表明:已不存在自相关 于是原模型为: 与OLS估计结果的差别只在截距项:
(2)采用科克伦-奥科特迭代法估计 在Eviews软包下,2阶广义差分的结果为: (3.81) (18.45) (6.11) (-3.61) 取=5% ,DW>du=1.66(样本容量:22) 表明:广义差分模型已不存在序列相关性。 可以验证: 仅采用1阶广义差分,变换后的模型仍存在1阶自相关性; 采用3阶广义差分,变换后的模型不再有自相关性,但AR[3]的系数的t值不显著。