时间序列回归
平稳性时间序列的条件 平稳时间序列的期望、方差、自协方差、自相关系数等数字特征均不随时间推移而改变。
非平稳时间序列 非平稳时间序列的两个例子: 1. 趋势 2. 突变
一个平稳的时间序列在图形上往往表现出一种围绕其均值不断波动的过程; 而非平稳序列则往往表现出在不同的时间段具有不同的均值(如持续上升或持续下降)。
什么是趋势 趋势(trend)是指变量随时间持续长期的运动。 时间趋势中有确定性和随机性两种类型的趋势。其中确定性趋势是时间的非随机函数。例如,确定性趋势为时间的线性函数,若通货膨胀中有每季度上升0. 1个百分点的确定性时间趋势,则该趋势可表为0.1t,其中t表示季度。
随机性趋势是随机的且随时间变化的趋势。例如通货膨胀中的随机性趋势显示出较长时间的下降之后伴随着较长时间的上升。 建立含随机性趋势的经济时间序列模型要比建立含确定性趋势的时间序列模型更为恰当。因为经济是一个很复杂的东西,很难调和确定性趋势暗含的可预测性和面临的复杂因素和意外。但这些变动同样也是复杂经济力量的结果,由于这些力量的变化不可预测,因此通常认为这些趋势中存在着较大的不可测或随机成分。
趋势的随机游走模型 AR(1) 为平稳时间序列的条件是: |β1| <1
其中ut是一个简单的随机时间序列:具有零均值同方差的独立分布序列: t~N(0,2) ut被称为是一个白噪声(white noise)。 由于ut具有相同的均值与方差,且协方差为零,白噪声序列ut是平稳的。
随机游走的基本思想是序列明天的取值就是它今天的取值再加上一个不可测变化,因为Yt前进的路径是由随机项ut组成的,所以这一路径为一个“随机游走”。
带漂移的随机游走 随机游走是非平稳的
证明一: 证明二:假设Y0=0 Y1=Y0+u1=u1 Y2=Y1+u2=u1+u2 Yt=u1+u2+…+ut 最终会趋向于无穷。
随机游走的例子: use random,clear tsset t reg r1 L.r1 line r1 t
一般来说,对Y取一阶差分(first difference): Xt=Xt-Xt-1=t 由于t是一个白噪声,则差分后序列是平稳的。 后面将会看到:如果一个时间序列是非平稳的,它常常可通过取差分的方法而形成平稳序列。 事实上,随机游走过程是下面我们称之为1阶自回归AR(1)过程的特例 Yt=ßYt-1+t
不难验证: 1。 |ß|<1,平稳。 2。 |ß|=1,是一个随机游走过程,不平稳。 3。 |ß|>1,该随机过程生成的时间序列是发散的,表现为持续上升(>1)或持续下降(<-1),因此是非平稳的;
随机性趋势带来的问题 若回归变量中包含随机性趋势(有单位根),则其系数的OLS估计量及其OLS t统计量即使在大样本下也不服从标准(即非正态)分布。 (1)当AR(1)中的自回归系数真值为1时其估计量偏向于0; (2)包含随机性趋势的回归变量系数的t统计量即使在大样本下也服从非正态分布; (3)随机性趋势带来的风险的极端例子是包含有随机性趋势的两个独立序列会以较高的概率错误地呈现出相关关系,即所谓的伪回归。
问题1:偏向于零的自回归系数 自回归系数向左偏向于0。假设对于AR(1): 其真实值为β1=1。然而,OLS 估计出的β1 却不是渐近正态分布,甚至不是对称分布,即使是在大样本下,而是向左偏向于0。这是因为,由于{Yt} 不是平稳序列,中心极限定理不再适用。
问题2:t统计量的非正态分布 若回归变量中包含随机性趋势,则常用的OLS t统计量在原假设成立时即使在大样本下也服从非正态分布。这意味着常用的置信区间是不正确的,也不能像往常一样进行假设检验。由于这个t统计量的分布依赖于有问题的回归变量和其他回归变量之间的关系,因此一般无法列表给出其分布。
问题3:伪回归 随机性趋势会使两个没有相关关系的时间序列呈现出相关性,这个问题称为伪回归。
1965---1981 1982---2004
这个矛盾结论的来源是两个序列都含有随机性趋势。这两个趋势碰巧在1965-1981年间保持一致,但在1982-2009年期间却没有。事实上,也不存在令人信服的经济或政治理由相信这两个序列中的趋势是相关的。简言之,这些回归是虚假的。 一种确保某些基于回归的方法可靠的特例是两个序列的趋势成分相同,即序列中包含了共同的随机性趋势。如果是这样的话,序列称为是协整的。
随机性趋势探测:单位AR根的检验
因此,针对式 Yt=β0+Yt-1+t 我们关心的检验为:零假设 H0:=0。 备择假设 H1:<0 上述检验可通过OLS法下的t检验完成。 然而,在零假设(序列非平稳)下,即使在大样本下t统计量也是有偏误的(向下偏倚),通常的t 检验无法使用。 Dicky和Fuller于1976年提出了这一情形下t统计量服从的分布(这时的t统计量称为统计量),即DF分布(见下表)。 由于t统计量的向下偏倚性,它呈现围绕小于零值的偏态分布。
因此,可通过OLS法估计 Yt=β0+Yt-1+t 并计算t统计量的值,与DF分布表中给定显著性水平下的临界值比较: 如果:t<临界值,则拒绝零假设H0: =0, 认为时间序列不存在单位根,是平稳的。
2、ADF检验 进一步的问题:在上述对时间序列进行平稳性检验中,实际上假定了时间序列是由具有白噪声随机误差项的一阶自回归过程AR(1)生成的。 但在实际检验中,时间序列可能由更高阶的自回归过程生成的,如AR(3),或者随机误差项并非是白噪声,这样用OLS法进行估计均会表现出随机误差项出现自相关(autocorrelation),导致DF检验无效。 另外,如果时间序列包含有明显的随时间变化的某种趋势(如上升或下降),则也容易导致上述检验中的自相关随机误差项问题。 因此,Dicky和Fuller对DF检验进行了扩充,形成了ADF(Augment Dickey-Fuller )检验。
单位根检验的stata命令:dfuller 打开示例文件,检验时间序列是否含有单位根。 一般来说:时间序列的差分可以消除单位根。
避免由随机性趋势带来的问题
结构突变 突变来自总体回归系数在某一特定日期上的离散变化或来自系数在较长时期内的渐变。 例如:考察1978-2006年中国居民人均消费与人均国内总产值数据(当年价格)。是否在1992年邓小平“南巡”以后(含1992年)发生了结构变化。
另一个例子1972年固定汇率的布雷顿森林体系解休使美元对英镑的汇率的时间序列行为产生了突变。
突变的检验 突变时间已知时的突变检验 方法:增加虚拟变量。 建立如下方程:
原假设:没有突变 备则假设:指定点有突变 上述系数至少有一个为0。
Chow检验 考察1978-2006年中国居民人均消费与人均国内总产值数据(当年价格)。估计中国消费函数,并检验中国的消费函数是否在1992年邓小平“南巡”以后(含1992年)发生了结构变化。 use consumption_china,clear gen d=(year>1991) (生成虚拟变量) gen y_d=y*d (生成虚拟变量与GDP的互动项) reg c y d y_d test d y_d