第十章 时间序列的特性
本章内容 随机时间序列的类型 平稳时间序列特性 自回归与移动平均过程 自回归函数
时间序列数据 时间序列数据有严格的时间先后顺序。 在利用时间序列数据建立模型时需要认识到,我们获得的样本不再具有从总体中随机抽取的性质。 我们所面对的是一个实际实现的随机过程。
时间序列的趋势 经济数据序列经常表现出明显的时间趋势。 我们不能仅仅根据两个序列具有相类似的趋势而断定其存在因果关系。 这是因为,这种共同趋势常常是由于其他因素所造成的。 如果有相关的信息,我们可以直接控制其他因素的影响,否则只能通过消除趋势的方式来处理。
消除趋势的方法 每个序列对时间趋势变量做回归 得到的残差项构成“消除趋势”的序列。 在回归模型中加上一个时间趋势变量可以起到类似的作用。 线性趋势/指数趋势/多项式趋势 得到的残差项构成“消除趋势”的序列。 在回归模型中加上一个时间趋势变量可以起到类似的作用。 利用消除趋势的数据建立回归模型有一个优点,这涉及到对回归方程拟合优度的评价: 利用时间序列做回归趋于得到非常高的R2,这是由于对趋势能够很好地做出解释。 用消除趋势的变量做回归可以更可靠地反映出X对Y的解释能力。
季节性 (Seasonality) 很多时间序列表现出某种周期性 可以通过在模型中引入季节虚变量的方式来处理数据体现出的季节性。 例:商品零售额常常呈现季节性变化 可以通过在模型中引入季节虚变量的方式来处理数据体现出的季节性。 也可以在建立模型前对数据做处理,即获得调整季节性的序列。
随机时间序列的类型 平稳时间序列(stationary time series )指均值、方差和自回归函数不随时间变化的时间序列; 非平稳时间序列(Nonstationary time series )指均值、方差和自回归函数随时间而变化的时间序列。 具有上升或下降趋势的时间序列为非稳定序列。
弱依赖时间序列 (Weakly Dependent Time Series) 当随着h的增大后xt 和xt+h 趋近于相互独立的分布时,我们将这样的序列称作弱依赖时间序列。 对于一个方差平稳过程,若当h → ∞时Corr(xt, xt+h) → 0 ,我们说此方差平稳过程是弱依赖的。
平稳随机过程 (Stationary Stochastic Process) 当时间序列xt为平稳随机过程时,对于任意的一个时段1≤ t1 < …<tm和h1 , (xt1, …, xtm) 的联合分布等同于(xt1+h, … xtm+h)的联合分布。 因而平稳性意味着: 所有的xt都具有相同的分布 在整个时期内,任何两个相邻项之间的相关程度都相同。
方差平稳过程 (Variance stationary process) 对于任意的t且当h ≥ 1时,若 E(xt)和 Var(xt) 均为常数,Cov(xt, xt+h) 仅依赖h而与 t无关,那么该序列表现为方差平稳过程。 因而,上述平稳性的弱形式仅仅要求均值和方差不随时间而变化,方差仅仅取决于两个观察值之间的距离。
具有趋势的时间序列 具有趋势的时间序列不可能是平稳的,这是由于其均值随时间而不断变化。 具有趋势的时间序列可以是弱依赖性的。 若时间序列是弱依赖性的,并且将其消除趋势后成为平稳序列,那么这种序列被称作趋势平稳过程(Trend stationary) 。
不同类型的平稳性 有趋势的平稳过程 I(d)过程 一般而言,非平稳性序列: 序列由一个趋势函数和具有平稳性的误差组合而成 经过d次差分后可变为平稳过程的序列(difference stationary) 一般而言,非平稳性序列: 可以通过差分转变为平稳序列 估计量具有不标准的分布(例:随机行走过程)。
趋势平稳与差分平稳的区别 趋势平稳 差分平稳 自回归系数 迅速下降 缓慢下降 动态乘数 很快消失 长期存在 平均平方误(MSE) 收敛 发散 均值 趋于恢复均衡 逐步偏离均衡 Dyt的长期方差 非0
时间序列的特征 在做多元回归之前,有必要先了解每个时间序列的特性。 在很多应用研究中,人们常常对具有增长趋势的时间序列取对数后进行分析。 取对数后,这样的序列常常更接近于一条直线。大多数宏观经济数据表现出这一特征。 取对数后的变量差分(LnYt-LnYt-1)近似反映了两个时期之间该序列的增长率。
我国的实际GDP(1970-2002)
MA(1)过程 一阶移动平均过程MA(1)可以表示为: yt = et + 1et-1, t = 1, 2, … 式中et 为均值为0、方差为se2的相同独立分布随机变量(iid) 。 满足上述条件的序列yt是一个平稳和具有弱依赖性的序列(weakly dependent sequence) 从公式可以注意到,前后两期变量之间存在着相关,但间隔再长的变量之间则不存在相关。
AR(1)过程 一阶自回归过程AR(1)可以表示为: AR(1)满足弱依赖性的条件是|r| < 1 此时有: yt = ryt-1 + et , t = 1, 2,… 式中et为均值为0、方差为se2的相同独立分布随机变量。 AR(1)满足弱依赖性的条件是|r| < 1 此时有: Corr(yt ,yt+h) = Cov(yt ,yt+h)/(sysy) = rh 随着h 的增大,相关系数下降。
随机行走 (Random Walks) 随机行走是一种AR(1)过程,此时要求r1=1,这意味着,序列不是弱依赖性的。 yt = yt-1 + et , t = 1, 2,… 对于具有随机行走特征的序列,yt的期望值总是等于y0,与时间t无关。 然而方差Var(yt) = se2t随着时间t增大。 我们说随机行走是高度持续的(persistent),因为对于所有的h ≥ 1,都有E(yt+h|yt) = yt 。 We say a random walk is highly persistent since E(yt+h|yt) = yt for all h ≥ 1
随机行走 (Random Walks) 随机行走是一种存在单元根过程的特殊情况。 需要注意的是,趋势和持续有不同的含义: 序列可以有趋势,但同时是弱依赖的; 序列也可以是无趋势但高度持续。 具有漂移特性的随机行走是有趋势并高度持续的序列的一个例子。 yt =a +ryt-1 + et , t = 1, 2,… A random walk with drift is an example of a highly persistent series that is trending
变换持续序列 为了使用高度持续的序列,并利用其得到有意义的模型估计和利用模型正确地做出推断,我们需要将其变换为弱依赖过程。 这里所说的弱依赖过程为零阶整合序列I(0)。 随机行走过程是一个一阶整合序列I(1),对其做差分后的序列为零阶整合序列。 In order to use a highly persistent series and get meaningful estimates and make correct inferences, we want to transform it into a weakly dependent process
自相关 (Autocorrelation) 对于通常的经济数据序列,原始序列Y的当前值与滞后值之间的相关程度较高,但其差分序列Y的当前值与滞后值相关程度较低。 根据这一性质,我们可以利用过去已知的Y来推断今后的Y,但知道过去的Y则无助于推测今后的Y。 人们把这种情况说成是:“Y能够记忆过去,但Y则不能”。这是利用时间序列模型做预测的基础。 一般而言,此时的Y是一个非平稳序列,而Y则是一个平稳序列。
自相关函数 (Autocorrelation Function) 通过估计自相关函数,可以了解时间序列的特征: 时间趋势 平稳性 自相关函数是时间序列的当前值与过去值之间的相关系数。 令p=Cor(Yt,Yt-p) 可以注意到,p的值是滞后期数p的函数。
AC和PAC函数 AC和PAC函数描述时间序列的特性 AC函数可以用来根据该值等于0发生的时间j来选择MA(q)模型,j > q; PAC函数可以用来根据该值等于0发生的时间j来选择AR(p)模型,j > p。
整合过程 (Integrated Process) 许多非平稳时间序列可以通过一阶或高阶差分,转变为平稳时间序列。 这种时间序列被称作d阶整合时间序列用I(d)表示。
差分 (Differencing) 差分的方式是:Yt = Yt – Yt-1 Yt反映时间t与t-1之间Y的变化; 若Y是取对数的变量,那么Yt 反映比例变化; Yt表示一阶差分 差分后的序列通常表现出: 没有明显的时间趋势 剧烈波动
我国的实际GDP(1970-2002)
虚假回归 考虑以下情况: 当-1<1 <1时,序列为I(0) 当1 =1时,序列为I(1) yt =0 + 1 xt + et 式中e t =1 e t-1 + vt 当-1<1 <1时,序列为I(0) 当1 =1时,序列为I(1) 当利用I(1)变量建立回归模型时,我们遇到虚假回归问题。即使在真实的1=0时,估计得到的1 也将非常显著。 在实践中,有相当多的经济数据为I(1)序列。
利用EVIEWS估计AC和PAC 建立数据文件 选择Quick→ Series statistics→ Correlogram 在窗口中给出序列名、水平或差分变量、包括的滞后期等信息 输出结果包括AC和PAC 根据有关结果判断一元时间序列模型的形式和滞后期数。