第六章 动态模型
本章要点 ARDL模型的概念、优点、结构与构造 ARIMA类模型的概念 AR模型稳定性的条件,AR模型和MA模型的相互转化 AR模型、MA模型、ARMA模型自相关函数、偏自相关函数的特点 信息准则的基本原理 VAR模型的概念、构造及格兰杰因果检验、脉冲响应 GARCH类模型的概念 ARCH效应的检验
第一节 ARDL模型的概念和构造
ARDL模型的概念 ARDL(autoregressive distributed lag)称为自回归分布滞后模型。 计量软件Microfit,可用来对ARDL模型进行方便的估计. ARDL模型的优点 相比于标准的协整检验,不论变量是否同为过程,或同为过程,既不需要变量同阶单整,都可以用ARDL模型来检验变量之间的长期关系。
ARDL模型的的结构 一个典型的 模型的结构如下: 其中 一个典型的 模型的结构如下: 其中 表示 滞后的阶数, 表示第i个自变量 滞后的阶数, 。L是滞后算子(lag operator),它可用下式定义: , 是s行、1列的确定向量
ARDL建模的基本方法 ARDL建模的方法包括两个阶段: 第一阶段,建立与该ARDL模型相对应的误差修正模型(ECM),并计算出ECM模型中的F统计量。以此判断变量间是否存在长期稳定的关系。 第二阶段,运用ARDL模型,估计变量之间长期关系的系数。
实例-ARDL模型在金融数据中的应用 研究对象 美国非耐用消费品支出LC与真实可支配收入LY,通胀率DP之间的关系 数据 1960年1季度到1994年1季度的季度数据
首先,我们调用Microfit软件读入该数据文件。对原始数据进行取对数作差分的处理。 对应于ARDL(4,4,4)中变量LC,LY和DP的误差修正模型(ECM)如下: 原假设:变量间不存在稳定的长期关系,即: 择备假设: 或 或
计算F统计量,检验三者之间是否具有长期关系 图 6-3 假设检验的结果
用Microfit软件中的ARDL选项来估计变量间的长期系数以及相应的误差修正模型ECM
图6-6 ARDL(2,2,3)估计结果
图6-8 AIC准则选定的误差修正模型结果
图6-10 预测结果
第二节 ARIMA模型的概念和构造
ARIMA模型的概念 所谓ARIMA模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。 ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA)、自回归过程(AR)、自回归移动平均过程(ARMA)以及ARIMA过程。
移动平均过程 一个q阶的移动平均(MA)过程可用下式表示: 其中u为常数项, 为白噪音过程 引入滞后算子L,原式可以写成: 或者 其中
MA(q)过程的特征 1、 2、 3、自协方差 ①当k>q时 =0 ②当k<q时 对于任意的,MA(q)是平稳的。
自回归过程 一个p阶自回归(AR)过程可以用下式表示: 其中, 为白噪音过程 引入滞后算子,则原式可写成 或者 其中
AR(p)过程平稳的条件 如果特征方程: 的根全部落在单位圆之外,则该AR(p)过程是平稳的。
AR(p)过程的特征 =0, 的无条件期望是相等的,若设为u,则得到 :
再看方差和协方差 …… 将上述p+1个方程联立,得到所谓的Yule-Walker方程组,共p+1个方程,p+1个未知数,得出AR(p)过程的方差及各级协方差。
自回归移动平均(ARMA)过程 将MA(q)过程与AR(p) 过程合并,我们就可以得 到一个ARMA(p,q)过程,其形式如下: 其中 为白噪音过程。 若引入滞后算子,可以写成 其中
ARMA过程平稳性的条件 ARMA过程的平稳性取决于它的自回归部分。 当满足条件: 特征方程的根全部落在单位圆以外时,ARMA(p,q)是一个平稳过程。
ARMA(p, q)过程的特征 1、 2、 对于ARMA(p, q)过程的方差和协方差,由于 其较复杂,我们不再涉及。
自回归单整移动平均过程 如果序列 经过 d 次差分得到平稳序列 ,并且用ARMA(p,q)过程对W t建立模型,即W t为一个ARMA(p,q)过程,则我们称Y t为(p,d,q)阶自回归单整移动平均过程,简称ARIMA(p,d,q)。 引入滞后算子L, ARIMA(p,d,q)过程可表示为: 其中, 为白噪音过程,
AR、MA过程的相互转化 结论一:对于一个平稳的AR(p)过程,它可以转化为一个MA(∞)过程,可采用递归迭代法完成转化。 结论二:对于一个MA(q)过程, 其中 若其特征方程 的根都落在单位圆外,则称该 MA(q)过程具有可逆性,此时MA(q)过程可转化为AR(∞)。 注意:平稳性和可逆性的概念在数学语言上是完全等价的,所不同的是,前者是对AR过程而言的,而后者是对MA过程而言的。
Box-Jenkins方法论 建立回归模型时,应遵循节俭性(parsimony)的原则 。 博克斯和詹金斯(Box and Jenkins)提出了在节俭性原则下建立ARIMA模型的系统方法论,即Box-Jenkins方法论 。 Box-Jenkins方法论 的步骤: 步骤1:模型识别 步骤2:模型估计, 步骤3:模型的诊断检验 步骤4:模型预测。
ARIMA模型的识别 在ARIMA模型的识别过程中,我们主要用到两个工具:自相关函数(autocorrelation function,简称ACF),偏自相关函数(partial autocorrelation function,简称PACF)以及它们各自的相关图(即ACF、PACF相对于滞后长度描图)。 我们首先介绍自相关函数和偏自相关函数的定义。
自相关函数和偏自相关函数 (1)自相关函数 对于一个序列 来说,它的第j阶自相关系数(记作 )定义为它的j阶自协方差除以它的方差,即 , 的取值范围是 。 可以看到, (j=0,1,2...)可看作是关于j的函数,因此我们也称之为自相关函数,通常记ACF(j) (2)偏自相关函数 偏自相关系数度量了消除中间滞后项影响后两滞后变量之间的相关关系。偏自相关函数记为PACF(j) 。
(3)自相关函数和偏自相关函数的联系 2阶以上的偏自相关函数计算公式较为复杂,这里不再给出。
MA、AR、ARMA过程自相关函数及偏自相关函数的特点 ⑴MA(q)过程的自相关函数 1≤j≤q j>q时,ACF(j)=0,此现象为截尾,是MA(q)过程的一个特征 如下图:
图6-11 MA(2)过程
⑵ AR(p)过程的偏自相关函数 时,偏自相关函数的取值不为0 时,偏自相关函数的取值为0 AR(p)过程的偏自相关函数p阶截尾 如下图:
图6-12 AR(1)过程
图6-13 AR(1)过程
⑶AR(p)过程的自相关函数以及MA(q)过程的偏自相关函数 平稳的AR(p)过程可以转化为一个MA(∞)过程,则AR(p)过程的自相关函数是拖尾的 一个可逆的MA(q)过程可转化为一个AR(∞)过程,因此其偏自相关函数是拖尾的。
⑷ARMA(p,q)过程的自相关函数和偏自相关函数
利用自相关函数、偏自相关函数 对ARIMA模型进行识别 对ARIMA(p,d,q)过程进行识别,我们首先要确定的是该过程是否是平稳的,如果不是,通过几次差分可以得到平稳序列,即首先我们需要确定d的值。对此,我们可以用前面一章提到的ADF检验,也可以通过自相关函数来判断。如果d次差分后的序列其自相关函数很快下降为0,则说明差分后的序列是平稳的,反之则不平稳。
在确定d的值后,接下来我们利用自相关函数、偏自相关函数以及它们的图形来确定p, q的值。一般而言,可遵循如下的经验准则: (1)如果某序列的自相关函数是截尾的,即过了某一滞后项数(设为q)后,自相关函数值变得不显著,接近于0,并且偏自相关函数是拖尾的,则我们可以把该序列设为MA(q)过程。
(2)如果某序列的偏自相关函数是截尾的,即过了某一滞后项数(设为p)后,偏自相关函数值变得不显著,接近于0,并且自相关函数是拖尾的,则我们可以把该序列设为AR(P)过程。 (3)如果某序列的自相关函数、偏自相关函数都是拖尾的,则可以把该序列设为ARMA(p,q)过程。而关于p, q的值需要不断地从低阶试探,但一般而言,ARMA(1,1)过程在文献中是最常见的。
ARIMA模型的估计 矩估计 这种方法就是利用样本自协方差函数和 样本自相关函数,对模型的参数作估计。 矩估计 这种方法就是利用样本自协方差函数和 样本自相关函数,对模型的参数作估计。 极大似然估计 它又包括无条件极大似然估计、条件极大似然估计、精确似然估计等方法。 非线性估计 它主要是利用了迭代搜索的思想。 最小二乘估计 对于不包含MA部分的ARIMA模型(即AR模型),我们可以利用普通最小二乘法对参数进行估计。
ARIMA模型的诊断 在对模型参数进行估计后,下一步我们要对所估计的模型是否很好的拟合了数据进行诊断。如果模型很好的拟合了数据,那么残差应该是一个白噪音过程,即不同时期的残差是不相关的。 为检验残差是否各期不相关,我们可以求得残差各阶的自相关系数 、 …, 然后对联合假设: 进行检验。如果不能拒绝原假设,说明残差是各期不相关的;如果拒绝原假设,则说明残差存在自相关,原模型没有很好的拟合数据。
在上述检验中,经常用到的一个检验统计量是Box和Pierce提出的Q统计量,它的定义如下: ,近似服从(大样本中) 分布 其中n为样本容量,m为滞后长度。 需要注意的是,Box和Pierce提出的Q统计量具有不佳的小样本性质,于是Ljung和Box(1978)提出了一个具有更好小样本性质的统计量,称之为LB统计量。 定义如下: 服从分布 ,其中n为样本容量,m为滞后长度。
对ARIMA模型的诊断还有另一方面,即尽管现在的模型能够很好的拟合数据,但我们想知道是否还存在一个更好的模型,能够更好的拟合数据和进行预测。 一般的做法是在模型中增加滞后项(因为我们是从低阶试起的),然后根据信息准则(information criteria)来判断。
常用的信息准则有以下几个: Akaike 信息准则 Schwarz 信息准则 Hannan-Quinn 信息准则 其中 为残差平方, 是所有估计参数的个数,T为样本容量。
ARIMA模型的预测 以平稳的AR(2)过程为例: 其中 为零均值白噪音过程 由模型的平稳性,我们有: ……
在t时刻,预测 的值: = 同理: … 可以看到,在应用AR(2)模型进行预测时,除向前一步预测是无条件预测外,其它的预测都要用到前期的预测值。 另外,我们不加证明的给出下面的结论:随着预测时间的增大,AR过程的预测值将趋向于序列的均值。
… 下面我们再来看利用MA过程进行的预测。以一 个MA(2)过程为例: 我们可以求得: 可以看到,对于MA(2)过程,2期以后的预测值都 果常数项为0的话,那么2期之后的预测都将为0。
利用ARMA过程进行预测 利用ARMA过程进行预测的过程,实际上相当于对AR过程和MA过程进行预测的结合,方法与分别利用AR过程和MA过程进行预测是相同的,我们不再介绍。 由于ARMA(p,q)过程中MA(q)过程仅有q期的记忆力,因此利用ARMA(p, q)向前进行q期以外的预测,结果与利用AR(p)过程预测的结果是一样的。随着预测期数的增加,预测值将趋向于均值。 因此,ARMA模型一般用于短期预测(即预测期数不大于p+q太多)。而对于ARIMA模型,只需将平稳序列ARMA过程的预测结果进行反向d次(差分次数)求和,就可以得到原序列的预测值。
实例:ARIMA模型在金融数据中的应用 数据: 1991年1月到2005年1月的我国货币供应量(广义货币M2)的月度时间序列数据 目的: 说明在Eviews3.1 软件中利用B-J方法论建立合适的ARIMA(p,d,q)模型
第三节 VAR模型的概念和构造
VAR模型的起源 巨大的模型均未预测到20世纪70年代早期由于石油危机而引发的世界经济的衰退和随之而来的滞胀,也未能就治理滞胀开出有效的“药方”。由此导致了对结构模型的批判,其中最具影响的便是著名的“卢卡斯批判(the Lucas critique)”。 卢卡斯指出:使用计量经济模型(结构模型)预测未来经济政策的变化所产生的效用是不可信的。他认为,如果一个模型的某些参数所反映的是私人行为对以前的经济政策的反应函数的适应性,如果政策反应函数被改变,则私人行为对新的反应函数将再适应,其结果是,所估计的参数将不再描述这种适应。 卢卡斯批判所隐含的是,如果政策反应函数出现变化,这种变化也将改变模型的参数,于是,联立方程的简约形式也将随之发生变化。
此外,在联立方程模型设定过程中,必须人为的假定一些外生变量,并且假定外生变量事先给定,不受模型中内生变量的影响;为达到识别的目的,常常假定某些前定变量仅仅出现在某些方程中,这些假定也招致了希姆斯(C.A.Sims)的严厉批判。 希姆斯认为,为使结构模型可识别而施加了许多约束,这种约束是不可信的。他认为,如果在一组变量之间有真实的联立性,那么就应该对这些变量平等的加以对待,而不应事先区分内生变量和外生变量。 本着这一精神,希姆斯提出了VAR(Vector Autoregressive)模型。在VAR模型中,没有内生变量和外生变量之分,而是所有的变量都被看作内生变量,初始对模型系数不施加任何约束,即每个方程都有相同的解释变量——所有被解释变量若干期的滞后值。
VAR模型的形式和特点 在一个含有n个方程(被解释变量)的VAR模型中,每个被解释变量都对自身以及其它被解释变量的若干期滞后值回归,若令滞后阶数为k,则VAR模型的一般形式可用下式表示: 其中, 表示由第t期观测值构成的n维列向量, 为n*n系数矩阵, 是由随机误差项构成的n维列向量,其中随机误差项 (i=1,2,…n)为白噪音过程,且满足(i,j=1,2,…,n,且ij)。
为便于直观理解,我们假定n=2,k=2,则VAR模型可写成: 即被解释变量分别对自身以及对方的2阶滞后值回归
VAR模型的识别、估计、检验和预测 (一)VAR模型的识别
VAR模型的识别 ⑴似然比检验法(likelihood ratio test) 似然比检验构造的检验统计量如下: 它服从自由度为m的分布。 例如,如果某VAR模型有a个方程,要检验所有方程最后b 个滞后项系数是否为0,则一共有 个约束。
⑵信息准则法 Akaike 信息准则:AIC= Schwartz 信息准则: SC= 其中, 代表由估计残差的方差和协方差组成的矩阵的行列式,T代表样本容量, 表示的是所有方程中回归项的个数(包括常数项)。例如,对于一个含有a个方程,滞后项数为b的VAR模型, 。
(二)VAR模型的估计 前面我们提到,如果VAR模型中变量是平稳的,并且方程右边包含相同的解释变量,随机误差项满足基本假定,则我们可以分别应用普通最小二乘法对单个方程予以估计,所得到的估计值是一致的、渐进有效的。当上述条件不满足时,我们需要用到估计联立方程模型的其它方法。 由于所用到的数学知识已经超出了本书的范围,并且在Eviews软件中可以方便的实现对VAR模型的估计(我们会在例子中予以介绍),在此我们不再多做介绍。
(三) VAR模型的检验 前面已经提到,VAR模型是缺乏理论依据的。在VAR模型中,很难逐一解释各个变量系数的意义,特别是在很多情况下,解释变量系数会随滞后期数的变化而改变符号,同时模型内部不同方程之间也存在联系,因此很难判断当某个变量发生变化时,其他变量的未来值会有什么样的变化。 为弥补上述VAR模型的缺陷,发挥VAR模型的作用,应用中一般做如下的检验:
1、对某变量全部滞后项系数的联合检验 在VAR模型中,单个变量系数的意义是很难确认的,但有时我们会对如下的问题感兴趣:即对于模型内的某一方程,某变量的全部滞后值是否对被解释变量有显著的解释作用。 我们可以发现,如果VAR模型仅包含两个方程,这实际上就是我们在第五章提到的因果检验:如果该变量的所有滞后值对被解释变量有显著的解释作用,则就说该变量是被解释变量的“格兰杰原因”,反之则不是。
2、脉冲响应 脉冲响应度量的是被解释变量对单位冲击的响应。例如假定某误差项仅在第t期发生突变,而后各期重新恢复平静,脉冲响应测量的是各期(t,t+1,t+2…)的被解释变量对该冲击的反应。 通过测量脉冲响应,我们能够清楚地看到某一时期的冲击对未来各期被解释变量的影响。在实际中,对于拥有多个方程、滞后项数较多的VAR模型,一般采用的是将VAR模型转变为VMA(vector moving average,向量移动平均)模型,并得出脉冲响应函数 。
(四)VAR模型的预测 前面提到,一个较小的VAR模型产生的预测结果甚至要好于一个大的联立方程模型产生的预测结果,因此VAR模型的一个主要作用就是预测,下面通过一个例子说明如何在VAR模型中进行预测。
考虑一个含有两个方程、滞后阶数为2的VAR模型: 首先我们来考虑一步向前预测(one-step-ahead-forecast)。如果我们要在第n期预测 、 ,由于在第n期,所有的解释变量的值已经知道,所以这是一个无条件预测: 接下来我们来考虑多步向前预测,由于在第n期,有些解释变量的值是未知的,因此预测为有条件预测,我们可以以解释变量的预测值来代表未知解释变量的条件期望。
同理,可得出在第n期的预测值为 可以看到,在向前两步预测时要用到我们在向前一步预测时 得到的预测值,这与前一节中我们用AR模型预测是一样 的。类似的,我们可以利用前一期的预测值进行向前三步、 四步…预测。
VAR模型的补充说明——VAR模型的发展 即模型中方程左边不仅包括内生变量,也包括一些仅作为解释变量的外生变量;不仅包括内生变量的滞后值,也包括内生变量的当期值。 (二)VECM模型 即模型内方程的右边不仅包括变量的差分项,也包括变量之间的协整关系项,从而使模型能够同时反映系统内变量间的长期均衡关系和短期动态特征,保持信息的完整性。
实例——VAR模型在金融数据中的运用 VAR模型的一个经典应用是检验货币政策的有效性。即研究货币供应量与产出、物价水平之间的关系。下面,我们就在Eviews软件中利用VAR模型对我国货币政策的有效性进行检验。 我们的样本取我国1994年第一季度到2004年第二季度的季度数据,变量包括狭义货币供应量M1,商品零售物价指数P,以及代表产出水平的国内生产总值GDP。 所有的数据我们都取它们的增长率,以保证序列的平稳性。
图 6-24 VAR模型设定
图6-25 VAR模型估计结果
图6-26 VAR脉冲响应设定
第四节 (G)ARCH模型的概念和构造
(G)ARCH模型的概念 自回归条件异方差(autoregressive conditional heteroscedasticity ,简称ARCH)模型是近年来新发展起来的时间序列模型,它反映了随机过程的一种特殊特性:即方差随时间变化而变化,且具有丛集性、波动性。ARCH模型已广泛地应用于金融领域的建模及研究过程中。
一、ARCH模型 由均值方程和条件方差方程给出: 表示t-1时刻所有可得信息的集合, 为条件方差 用极大似然估计法对方程进行估计
二、GARCH模型 一般的GARCH(p,q)模型如下表示 可用极大似然估计法估计 GARCH(p,q)的推广
(G)ARCH模型的识别、估计、 类型和预测 一、 ARCH效应的识别—ARCH LM Test 1. ARCH效应的识别的含义 通常是对于残差项中是否存在自回归条件异方差现象的拉格朗日乘数检验(Lagrange multiplier test, Engle 1982) 2. ARCH LM Test 中的统计量 F统计量 Obs*R-squared 统计量
(一)ARCH效应的识别 其中e是残差 原假设 : 辅助回归方程 原假设 : 辅助回归方程 其中e是残差 ARCH LM Test 对最小二乘法,两阶段最小二乘法,非线性最小二乘法都适用
(二)(G)ARCH模型的估计 方法: 最大似然估计法(以建立对数似然方程来实现,见下例)
(G)ARCH模型的估计(例) 对于AR(1)- GARCH (1,1)模型: 可以通过最大化下述对数函数来估计模型参数
(三)(G)ARCH模型的类型 1. GARCH-M模型 2. TARCH模型 3. EGARCH模型
(四)(G)ARCH模型的预测 1. 主要作用 ARMA-EGARCH(1,1)-M模型 预测时间序列的方差,从而研究时间序列的波动性 结合动态模型组成方程组来模拟一些金融问题的特性,例如 ARMA-EGARCH(1,1)-M模型
实例 (G)ARCH模型在金融数据中的应用 研究对象 我国股市收益的波动性、波动的非对称性以及溢出效应 样本范围 1997年1月2日到2002年12月31日每个交易日上证指数和深证成份指数的,共计6年1444个观察值 数据表示 收盘价以 表示 收益率定义为: ,沪市收益率用rh表示,深市收益率为rz。
(一)沪深股市收益率的波动性研究 1. 收益率 的描述性统计 2. 的平稳性检验
沪深股市收益率的波动性研究 3.均值方程的确定及残差序列自相关检验
沪深股市收益率的波动性研究 4.GARCH类模型建模 对两市收益率{ }序列分别用GARCH(1,1),和GARCH-M(1,1)建模
图6-31 Equation Specification窗口
(二)股市收益波动非对称性的研究 使用TARCH和EGARCH模型度量非对称性问题
(三)沪深股市波动溢出效应的研究 溢出效应的涵义 当某个资本市场出现大幅波动而引起投资者在另外的资本市场的投资行为的改变,既所谓的“溢出效应”
实例结论 沪深股市收益率都存在明显的GARCH效应 沪深股市都存在明显的GARCH-M效应,而且沪市的正向风险溢价要高于深市 深股市都存在明显的杠杆效应 沪深股市之间波动存在溢出效应,而且是单向的,深市的波动将引起沪市的波动
本章小节 本章介绍了在处理金融时间序列数据时构造动态模型的方法。首先第一节介绍ARDL模型的概念、优点及构造过程,着重介绍了AEDL模型检验不同阶变量之间长期关系的方法。在第二节中我们主要介绍了如何利用B-J建模方法建立ARIMA模型,并介绍了ARIMA模型的一些特点。我们可以看到,ARIMA模型可广泛的应用于时间序列数据,并在预测方面有独特的优势。 我们在第三节中主要介绍了VAR模型,它是一种不同于结构联立方程组的多方程模型,同ARIMA模型一样,它也是缺乏理论依据的,主要用于预测,VAR模型的出现使得现在的文献中已经很少看到利用联立方程模型建模。最后一节介绍了(G)ARCH模型,(G)ARCH模型在金融领域的应用极为广泛,本书中介绍了(G)ARCH模型多种形式,着重以实例说明(G)ARCH模型的作用。