第八章 联立方程计量经济模型 理论方法 Theory and Methodology of Simultaneous-Equations Econometrics Model
教学基本要求 本章是课程的重点内容之一,与单方程模型并列。通过教学,要求学生达到: 掌握:线性联立方程计量经济学模型的基本概念,线性联立方程模型的矩阵表示,结构式与简约式的定义及联系,有关模型识别的概念和实用的识别方法,几种主要的单方程估计方法(间接最小二乘法、两阶段最小二乘法、工具变量法、)的原理与应用。
第一节 引言:问题的提出 第二节 联立方程计量经济学模型的若干基本概念 第三节 联立方程计量经济学模型的识别 第四节:联立方程模型的参数估计
第一节 引言:问题的提出 一、经济研究中的联立方程计量经济学问题 二、计量经济学方法中的联立方程问题
一、经济研究中的联立方程计量经济学问题
⒈ 研究对象 经济系统,而不是单个经济活动 “系统”的相对性 相互依存、互为因果,而不是单向因果关系 必须用一组方程才能描述清楚
⒉一个简单的宏观经济系统 由国内生产总值Y、居民消费总额C、投资总额I和政府消费额G等变量构成简单的宏观经济系统。
在消费方程和投资方程中,国内生产总值决定居民消费总额和投资总额; 在国内生产总值方程中,它又由居民消费总额和投资总额所决定。
二、计量经济学方法中的联立方程问题
⒈随机解释变量问题 解释变量中出现随机变量,而且与误差项相关。 为什么?
⒉损失变量信息问题 如果用单方程模型的方法估计某一个方程,将损失变量信息。 为什么?
⒊损失方程之间的相关性信息问题 联立方程模型系统中每个随机方程之间往往存在某种相关性。 表现于不同方程随机误差项之间。 如果用单方程模型的方法估计某一个方程,将损失不同方程之间相关性信息。
⒋结论 必须发展新的估计方法估计联立方程计量经济学模型,以尽可能避免出现这些问题。 这就从计量经济学理论方法上提出了联立方程问题。
第二节 联立方程计量经济学模型的若干基本概念 第二节 联立方程计量经济学模型的若干基本概念 变量 方程 结构式模型 简化式模型 参数关系体系
一、变量
⒈内生变量 (Endogenous Variables) 对联立方程模型系统而言,已经不能用被解释变量与解释变量来划分变量,而将变量分为内生变量和外生变量两大类。 内生变量是具有某种概率分布的随机变量,它的参数是联立方程系统估计的元素。 内生变量是由模型系统决定的,同时也对模型系统产生影响。 内生变量一般都是经济变量。
一般情况下,内生变量与随机项相关,即 在联立方程模型中,内生变量既作为被解释变量,又可以在不同的方程中作为解释变量。
⒉外生变量 (Exogenous Variables) 外生变量一般是确定性变量,或者是具有临界概率分布的随机变量,其参数不是模型系统研究的元素。 外生变量影响系统,但本身不受系统的影响。 外生变量一般是经济变量、条件变量、政策变量、虚变量。 一般情况下,外生变量与随机项不相关。
⒊ 先决变量(Predetermined Variables),也称前定变量 外生变量与滞后变量(Lagged Endogenous Variables)统称为先决变量(或前定变量)。 滞后变量是联立方程计量经济学模型中重要的不可缺少的一部分变量,有滞后内生变量与滞后外生变量,用以反映经济系统的动态性与连续性。联立方程模型一般涉及滞后内生变量。 先决变量只能作为解释变量。
二、结构式模型 Structural Model
⒈定义 根据经济理论和行为规律建立的描述经济变量之间直接结构关系的计量经济学方程系统称为结构式模型。 模型的每个方程都有具体的经济意义。 结构式模型中的每一个方程都是结构方程( Structural Equations )。 各个结构方程的参数被称为结构参数( Structural Parameters or Coefficients ) 。 将一个内生变量表示为其它内生变量、先决变量和随机误差项的函数形式,被称为结构方程的正规形式。
⒉结构方程的方程类型 结构方程的正规形式。 无随机误差项,参数已知.
⒊完备的结构式模型 具有g个内生变量、k个先决变量、g个结构方程的模型被称为完备的结构式模型。 在完备的结构式模型中,独立的结构方程的数目等于内生变量的数目,每个内生变量都分别由一个方程来描述。
实际的方程组有g个方程. 线性模型结构式的一般形式 设线性联立方程组模型包含g个内生变量Y1,Y2,…,Yg;k个前定变量X1,X2,…,Xk。模型规范形式为: (8.1) 实际的方程组有g个方程.
⒋完备的结构式模型的矩阵表示 习惯上用Y表示内生变量,X表示先决变量,μ表示随机项,β表示内生变量的结构参数,γ表示先决变量的结构参数,如果模型中有常数项,可以看成为一个外生的虚变量,它的观测值始终取1。
讨论(8.1)中B和 的形式。
⒌简单宏观经济模型的矩阵表示
三、简化式模型 Reduced-Form Model
⒈定义 用所有先决变量作为每个内生变量的解释变量,所形成的模型称为简化式模型。 简化式模型并不反映经济系统中变量之间的直接关系,并不是经济系统的客观描述。 由于简化式模型中作为解释变量的变量中没有内生变量,可以采用普通最小二乘法估计每个方程的参数,所以它在联立方程模型研究中具有重要的作用。 简化式模型中每个方程称为简化式方程(Reduced-Form Equations),方程的参数称为简化式参数(Reduced-Form Coefficients) 。
⒉简化式模型的矩阵形式
⒊简单宏观经济模型的简化式模型
四、参数关系体系
⒈定义 (8.4)式描述了简化式参数与结构式参数之间的关系,称为参数关系体系。
⒉作用 利用参数关系体系,首先估计简化式参数,然后可以计算得到结构式参数。 从参数关系体系还可以看出,简化式参数反映了先决变量对内生变量的直接与间接影响之和,这是简化式模型的另一个重要作用。 下面举例子说明。 注意:简化式参数与结构式参数之间的区别与联系。
第三节 联立方程计量经济学模型的识别 The Identification Problem 一、识别的概念 二、从定义出发识别模型 三、结构式识别条件 四、实际应用中的经验方法
一、识别的概念
⒈为什么要对模型进行识别? 从一个例子看 消费方程是包含C、Y和常数项的直接线性方程。 投资方程和国内生产总值方程的某种线性组合(消去I)所构成的新方程也是包含C、Y和常数项的直接线性方程。
如果利用C、Y的样本观测值并进行参数估计后,很难判断得到的是消费方程的参数估计量还是新组合方程的参数估计量。 只能认为原模型中的消费方程是不可估计的。 这种情况被称为不可识别。 只有可以识别的方程才是可以估计的。
模型的识别问题是从能否由被估计出的简化式参数中求出结构式参数的计算问题引申出来的。分为两个层次的判断问题: 1)结构参数能否求出的问题——模型可识别? 2)若能求出,所得参数值是否唯一——恰好识别? 这涉及代数理论中的方程组解的概念,比较具体有三种定义。
⒉识别的定义 3种定义: “如果联立方程模型中某个结构方程不具有确定的统计形式,则称该方程为不可识别。” “如果联立方程模型中某些方程的线性组合可以构成与某一个方程相同的统计形式,则称该方程为不可识别。” “根据参数关系体系,在已知简化式参数估计值时,如果不能得到联立方程模型中某个结构方程的确定的结构参数估计值,则称该方程为不可识别。”
⒊模型的识别 上述识别的定义是针对结构方程而言的。 模型中每个需要估计其参数的随机方程都存在识别问题。 如果一个模型中的所有随机方程都是可以识别的,则认为该联立方程模型系统是可以识别的。反过来,如果一个模型系统中存在一个不可识别的随机方程,则认为该联立方程模型系统是不可以识别的。 恒等方程由于不存在参数估计问题,所以也不存在识别问题。但是,在判断随机方程的识别性问题时,应该将恒等方程考虑在内。
⒋恰好识别(Just Identification)与过度识别 (Overidentification) 如果某一个随机方程具有一组参数估计量,称其为恰好识别; 如果某一个随机方程具有多组参数估计量,称其为过度识别。
二、从定义出发识别模型
2.例题2:唯一的统计形式 第2与第3个方程的线性组合得到的新方程具有与消费方程相同的统计形式,所以消费方程也是不可识别的。
第1与第3个方程的线性组合得到的新方程具有与投资方程相同的统计形式,所以投资方程也是不可识别的。 于是,该模型系统不可识别。 参数关系体系由3个方程组成,剔除一个矛盾方程,2个方程不能求得4个结构参数的确定值。也证明消费方程与投资方程都是不可识别的。
3.例题3 消费方程是可以识别的,因为任何方程的线性组合都不能构成与它相同的统计形式。(少I与 ,说明解释变量少容易可识别) 投资方程仍然是不可识别的,因为第1、第2与第3个方程的线性组合(消去C)构成与它相同的统计形式。 于是,该模型系统仍然不可识别。
参数关系体系由6个方程组成,剔除2个矛盾方程,由4个方程是不能求得所有5个结构参数的确定估计值。 可以得到消费方程参数的确定值,证明消费方程可以识别;因为只能得到它的一组确定值,所以消费方程是恰好识别的方程。 投资方程都是不可识别的。 注意:与例题2相比,在投资方程中增加了1个变量,消费方程变成可以识别。
4.例题4 消费方程仍然是可以识别的,因为任何方程的线性组合都不能构成与它相同的统计形式。 投资方程也是可以识别的,因为任何方程的线性组合都不能构成与它相同的统计形式。 于是,该模型系统是可以识别的。
参数关系体系由9个方程组成,剔除3个矛盾方程,在已知简化式参数估计值时,由6个方程能够求得所有6个结构参数的确定估计值。 所以也证明消费方程和投资方程都是可以识别的。 而且,只能得到所有6个结构参数的一组确定值,所以消费方程和投资方程都是恰好识别的方程。 注意:与例题2相比,在消费方程中增加了1个变量,投资方程变成可以识别。
6.例题6 消费方程和投资方程仍然是可以识别的,因为任何方程的线性组合都不能构成与它们相同的统计形式。 于是,该模型系统是可以识别的。
参数关系体系由12个方程组成,剔除4个矛盾方程,在已知简化式参数估计值时,由8个方程能够求得所有7个结构参数的确定估计值。 所以也证明消费方程和投资方程都是可以识别的。 但是,求解结果表明,对于消费方程的参数,只能得到一组确定值,所以消费方程是恰好识别的方程; 而对于投资方程的参数,能够得到多组确定值,所以投资方程是过度识别的方程。
注意: 在求解线性代数方程组时,如果方程数目大于未知数数目,被认为无解;如果方程数目小于未知数数目,被认为有无穷多解。 但是在这里,无穷多解意味着没有确定值,所以,如果参数关系体系中有效方程数目小于未知结构参数估计量数目,被认为不可识别。 如果参数关系体系中有效方程数目大于未知结构参数估计量数目,那么每次从中选择与未知结构参数估计量数目相等的方程数,可以解得一组结构参数估计值,换一组方程,又可以解得一组结构参数估计值,这样就可以得到多组结构参数估计值,被认为可以识别,但不是恰好识别,而是过度识别。
⒌如何修改模型使不可识别的方程变成可以识别 或者在其它方程中增加变量; 或者在该不可识别方程中减少变量。 必须保持经济意义的合理性。
三、结构式识别条件
⒈结构式识别条件 直接从结构模型出发 一种规范的判断方法 每次用于1个随机方程 具体描述为:
识别的秩条件和阶条件 注意:秩条件是方程可识别的充分必要条件,而阶条件只是必要条件,即秩条件成立时方程一定可识别,阶条件成立,方程也不一定可识别。
一般将该条件的前一部分称为秩条件(Rank Condition),用以判断结构方程是否识别; 将后一部分称为阶条件(Order Conditon),用以判断结构方程恰好识别或者过度识别。
⒉例题一 Ct It Yt 1 Yt-1 Ct-1 Pt-1 B
判断第1个结构方程的识别状态 所以,该方程可以识别。 因为 所以,第1个结构方程为恰好识别的结构方程。
判断第2个结构方程的识别状态 所以,该方程可以识别。 因为 所以,第2个结构方程为过度识别的结构方程。
第3个方程是平衡方程,不存在识别问题。 综合以上结果,该联立方程模型是可以识别的。 与从定义出发识别的结论一致。
模型系数矩阵:
1)第一个结构方程的识别: 根据模型系数矩阵
四、实际应用中的经验方法
当一个联立方程计量经济学模型系统中的方程数目比较多时,无论是从识别的概念出发,还是利用规范的结构式或简化式识别条件,对模型进行识别,困难都是很大的,或者说是不可能的。 理论上很严格的方法在实际中往往是无法应用的,在实际中应用的往往是一些经验方法。 关于联立方程计量经济学模型的识别问题,实际上不是等到理论模型已经建立了之后再进行识别,而是在建立模型的过程中设法保证模型的可识别性。
“在建立某个结构方程时,要使该方程包含前面每一个方程中都不包含的至少1个变量(内生或先决变量);同时使前面每一个方程中都包含至少1个该方程所未包含的变量,并且互不相同。” 该原则的前一句话是保证该方程的引入不破坏前面已有方程的可识别性。只要新引入方程包含前面每一个方程中都不包含的至少1个变量,那么它与前面方程的任意线性组合都不能构成与前面方程相同的统计形式,原来可以识别的方程仍然是可以识别的。 该原则的后一句话是保证该新引入方程本身是可以识别的。只要前面每个方程都包含至少1个该方程所未包含的变量,并且互不相同。那么所有方程的任意线性组合都不能构成与该方程相同的统计形式。
在实际建模时,将每个方程所包含的变量记录在如下表所示的表式中,将是有帮助的。
Klein模型1 消费函数: 投资函数: 劳动要求: 恒等式: 其中 C=消费支出,I=投资支出,G=政府支出,P=利润,W=民间工资,W‘=政府工资,K=资本存量,T=税收,Y=税后收入,t=时间,内生变量为C、I、W、Y、P和K,其余为前定变量。
作业: P291----3\4\7\9
第四节:联立方程模型的参数估计
完全信息方法 2)方程组系统估计法,包括:三阶段最小二乘法(3SLS)、完全信息最大似然估计法(FIML)等。这些方法是对模型中所有结构方程的参数同时进行估计,从而获得模型全部参数的估计值。它利用了模型的全部方程信息,称为完全信息方法。 基础的计量经济学一般讲述有限信息方法。
对结构式方程中的随机误差变量 ,有假设: 1、均值为0, 2、 3、 此处的 相当于单方程模型中的u。
1)算法:考虑如下模型
模型可写成矩阵形式: 系数矩阵为: - -
2)ILS步骤:
利用结构式与简约式系数的关系式 可得方程组: 若已知πij,即可解出惟一的cij,第一个结构方程得以估计。这样,结构方程的参数估计值用传统的OLS就得到了。
ILS的步骤 一、先对模型作识别判断,找出恰好识别的方程; 二、利用简约式和结构式参数的关系式 求出线性方程式 三、对简约式求OLS,得到 ,将 代入关系式,求出
间接最小二乘方法步骤 一、求恰好识别方程结构式参数与简约式模型参数的唯一关系式; 二、对简约式模型逐个方程求OLS,得到简约式模型中所有的参数估计值; 三、将简约式参数估计值代入关系式,求结构方程参数的估计值
ILS和TSLS的工具变量 1、ILS的工具变量:若一个恰好识别的方程被解释变量为 ,出现在右边作为解释变量的内生变量为 ,未出现的前定变量为 ,用这些未出现的前定变量代替作为解释变量的内生变量,就成为ILS的工具变量。所以,此时 工具变量即为全部前定变量。而原解释变量为
如果一个过度识别的方程,出现在右边作为解释变量的内生变量为 2、TSLS的工具变量 如果一个过度识别的方程,出现在右边作为解释变量的内生变量为 但未出现的前定变量个数要多于 ,不能象ILS一样用前定变量代替。根据TSLS的原理,工具变量中那些内生解释变量是用估计值代替的,即有: 其中: 是方程中出现的前定变量。 原解释变量
三者之间的关系 ILS是TSLS的一种特殊形式,而ILS和TSLS都是工具变量法。即有:
工具变量法的几个概念: 1、工具变量只针对随机解释变量;但写法上要写出所有替代或未替代的解释变量。 2、在联立方程结构方程中,要替代的只是出现在解释变量中的内生变量; 3、恰好识别的方程中,作为解释变量出现的内生变量个数与未出现的前定变量个数相同,所以用未出现的前定变量来替代内生变量,形成工具变量。所以ILS的工具变量正好是全部的前定变量; 4、过度识别方程中,内生解释变量个数要少于未出现的前定变量个数,所以可考虑用自身简约式的估计值来代替内生解释变量。TSLS的工具变量就是将原解释变量中的内生变量用估计值代替形成。
联立方程模型参数估计的Eviews实现 在做参数估计前,须先对随机结构方程作识别判断,确定估计方法.若方程是恰好识别的,则可用间接OLS;若方程是过度识别的,则须用二阶段最小二乘估计. 在Eviews中,上述两种方法都采用二阶段的OLS,即TSLS.
步骤 首先,确定模型中的内生变量及外生变量,建立工作文件,并将各变量的样本数据输入,建立序列. 其次,点总菜单quick—Estimate Equation,在方法框里选TSLS,显示
估计是逐个方程展开。以Eviews附带的工作文件cs.wf为例。工作文件界面为: 其中CS(人均消费)、INV(投资)和GDP为内生变量。Gov_net为外生变量。
建立模型如下: cs=c(1)+c(2)*gdp+u1 inv=c(3)+c(4)*gdp+c(5)*gdp(-1)+u2 Gdp=cs+inv+gov_net 经模型的识别判断,第一个消费方程过度识别,第二个投资方程为恰好识别,模型可以识别,故可用TSLS来估计参数。
可以逐个方程回归。因第一个方程过度识别,所以要用全部前定变量为工具变量(常变量可不写)。出现界面为:
结果: 各项指标较令人满意。 Dependent Variable: CS Method: Two-Stage Least Squares Date: 12/18/05 Time: 13:27 Sample(adjusted): 1947:2 1994:4 Included observations: 191 after adjusting endpoints Instrument list: GOV_NET GDP(-1) Variable Coefficient Std. Error t-Statistic Prob. C -195.7920 8.749597 -22.37726 0.0000 GDP 0.706348 0.002676 263.9937 0.0000 R-squared 0.997296 Mean dependent var 1953.966 Adjusted R-squared 0.997282 S.D. dependent var 848.4387 S.E. of regression 44.23232 Sum squared resid 369778.1 F-statistic 69692.66 Durbin-Watson stat 0.122247 Prob(F-statistic) 0.000000 各项指标较令人满意。
第二个方程恰好识别,工具变量正是全体前定变量,命令截图如下:
结果: R2和修正的R2显然不合理,模型中GDP与滞后一期的值有较强的共线性。此时可考虑用其它方法来估计参数。 Dependent Variable: INV Method: Two-Stage Least Squares Date: 12/18/05 Time: 13:34 Sample(adjusted): 1947:2 1994:4 Included observations: 191 after adjusting endpoints Instrument list: GOV_NET GDP(-1) Variable Coefficient Std. Error t-Statistic Prob. C -455.098521307 133.037097245 -3.42083923004 0.00076578 GDP 14.1088937141 12.3798414198 1.13966675627 0.255875108 GDP(-1) -13.9602274136 12.434575533 -1.12269432732 0.262999 R-squared -1.36062640573 Mean dependent var 303.927224124 Adjusted R-squared -1.3857394526 S.D. dependent var 261.368286007 S.E. of regression 403.705248945 Sum squared resid 30639850.4689 F-statistic 37.6556812684 Durbin-Watson stat 1.25547782065 Prob(F-statistic) 1.76479958893e-14 R2和修正的R2显然不合理,模型中GDP与滞后一期的值有较强的共线性。此时可考虑用其它方法来估计参数。
三阶段最小二乘估计(3SLS)简介 3SLS是由Zellner和Theil于1962年提出的同时估计联立方程模型全部结构方程的系统估计方法。 ⒈概念 3SLS是由Zellner和Theil于1962年提出的同时估计联立方程模型全部结构方程的系统估计方法。 其基本思路是 3SLS=2SLS+GLS 即首先用2SLS估计模型系统中每一个结构方程,然后再用GLS估计模型系统。
⒉三阶段最小二乘法的步骤 ⑴ 用2SLS估计结构方程 得到方程随机误差项的估计值。
OLS估计 OLS估计
⑵ 求随机误差项方差—协方差矩阵的估计量 (#)
(#)中 表示“直积”,即用符号后面的矩阵去乘符号前面矩阵的每个元素。协方差矩阵 是由(g×g)个子矩阵组成,每个子矩阵都是一个主对角阵,且主对角线元素相同。(#) 的成立建立在联立方程模型的两条基本假设上(前面提到),放弃两条假设,每个子矩阵就不是一个主对角阵,且主对角线元素也不相同。 假设一: 假设二:
⑶ 用GLS估计原模型系统 得到结构参数的3SLS估计量为:
也就是说,用TSLS得到第一组参数估计值,并借此计算残差值,进而构造 的值,得到广义最小二乘估计GLS所需要的矩阵 ,再利用GLS求出模型中参数的最终估计值。 Eviews提供了3SLS方法,但需用系统来求估计值。一般了解3SLS的原理,并知道如何用软件来求估计值,对结果能作分析即可。
⒊三阶段最小二乘法估计量的统计性质 ⑴如果联立方程模型系统中所有结构方程都是可以识别的,并且非奇异,则3SLS估计量是一致性估计量。 ⑵ 3SLS估计量比2SLS估计量更有效。为什么? ⑶如果Σ是对角矩阵,即模型系统中不同结构方程的随机误差项之间无相关性,那么可以证明3SLS估计量与2SLS估计量是等价的。 ⑷这反过来说明,3SLS方法主要优点是考虑了模型系统中不同结构方程的随机误差项之间的相关性。
上面提及的CS模型中,用3SLS估计先要建立系统(system),点object\new object\system
在New Object选System并给出名字后,点OK后出现: 上图中公式与工具变量(INST)是后来输入的,刚出来的System界面是空的。注意:公式中的参数必须是C的序列。
在系统界面的菜单里点Estimate,出现界面为:
方法选3SLS,点OK后,有结果(1) System: SYS1 Estimation Method: Three-Stage Least Squares Date: 12/18/05 Time: 13:53 Sample: 1947:2 1994:4 Included observations: 191 Total system (balanced) observations 382 Instruments: GDP(-1) GOV_NET C Coefficient Std. Error t-Statistic Prob. C(1) -195.7920 8.703667 -22.49535 0.0000 C(2) 0.706348 0.002662 265.3868 0.0000 C(3) -338.9928 131.3486 -2.580862 0.0102 C(4) 0.600260 12.18907 0.049246 0.9607 C(5) -0.391842 12.24296 -0.032006 0.9745 Determinant residual covariance 6733141.
结果(2) 从拟合度和参数估计值经济意义的合理性上看,3SLS的结果比TSLS要好得多。 Equation: CS=C(1)+C(2)*GDP Observations: 191 R-squared 0.997296 Mean dependent var 1953.966 Adjusted R-squared 0.997282 S.D. dependent var 848.4387 S.E. of regression 44.23232 Sum squared resid 369778.1 Durbin-Watson stat 0.122247 Equation: INV=C(3)+C(4)*GDP+C(5)*GDP(-1) R-squared 0.926725 Mean dependent var 303.9272 Adjusted R-squared 0.925946 S.D. dependent var 261.3683 S.E. of regression 71.12603 Sum squared resid 951075.4 Durbin-Watson stat 0.080463 从拟合度和参数估计值经济意义的合理性上看,3SLS的结果比TSLS要好得多。