什么是计量经济学? 计量经济学(Econometrics),又译成经济计量学,是1926年挪威经济学家R. Frish仿照生物计量学(Biometrics)一词首先提出来的,它的提出标志着计量经济学的诞生。 但是,人们一般认为,1930年12月29日世界计量经济学会成立和由它创办的学术刊物Econometrica于1933年正式出版,才标志着计量经济学作为一个独立的学科正式诞生了。 从字面上解释,计量经济学(econometrics)意谓“经济测量”。虽然测量是计量经济学的一个重要部分,但计量经济学涉及的范围要广泛得多。
P. A. Samuelson, T. C. Koopmans and J. R. N P.A. Samuelson, T.C. Koopmans and J.R.N. Stone, 在Report of the Evaluative Committee for Econometrica(计量经济学科评议委员会报告)中谈到,“计量经济学可定义为实际经济现象的数量分析。这种分析是基于理论与观测的并行发展,而理论与观测又通过适当的推断方法而得以联系”。 著名计量经济学家、诺贝尔经济学奖获得者R.Klein 在 A Textbook of Econometrics 的序言中评价到:“计量经济学已经在经济学科中居于最重要的地位”,“在大多数大学和学院中,计量经济学的讲授已经成为经济学课程表中最权威的一部分”。
近二十年来,计量经济学是经济学中最活跃的学科 20世纪80年代以来,计量经济学在我国得到迅速传播和发展。1980年以宾州大学克莱因教授为团长的美国经济学家代表团与中国社会科学院合作,在北京颐和园举办了为期7周的“经济计量学讲习班”,史称“颐和园讲习班”。克莱因,邹至庄,刘遵义,萧政等计量经济学家都是当时讲习班的教师,有100名经济工作者参加培训。在当年的受训人员中,有不少成为中国当今著名计量经济学家,如乌家培,李子奈,汪同三教授等。
2006年,以洪永淼教授为首的厦门大学王亚南经济研究院举办了“2006计量经济学和金融计量学研究生暑期班”,为期一个月,聘请了12位来自美国、英国和台湾“中央”研究院的国际知名教授,录取了226名学员,学员涵盖了社科院、北大、清华、南大等国内著名的大学和研究机构的博士生、硕士生和青年教师。
计量经济学为什么是一门独立的学科? 经济理论所做的命题或假定大多数是定性的;而计量经济学家的工作就是要提供这一定性数值的定量估计。 数量经济学的主要问题,是用数学形式表述经济理论而不去问理论的可度量性或其经验方面的可论证性。计量经济学的主要兴趣在于经济理论的经验论证。 经济统计学的问题,主要是收集、加工并通过图或表的形式展现经济数据。而如何用这些收集来的数据去检验经济理论,去估计参数,则是计量经济学家的事了
计量经济学的方法论 传统计量经济学分析问题的路线: 理论或假说的陈述→理论的数学模型→计量经济模型的设定→收集数据→参数估计→假设测验→预测→利用模型进行控制或制定政策 例子:凯恩斯消费理论为例 (1)理论或假说的陈述 凯恩斯:人们倾向于随着他们收入的增加而增加其消费,但比不上收入增加的那么多。即MPC(marginal propensity to consume)是大于零而小于1的
(2)消费的数学模型的设定 数理经济学家常常这样表述凯恩斯的消费函数: Y ——消费支出 X ——收入 ——模型的参数 ——截距 ——斜率系数 ——就是MPC的度量 方程左边的变量叫因变量;方程右边的变量(一个或多个)叫自变量或解释变量 (3)消费的计量经济模型的设定 由方程(I.3.1)给出的消费Y和收入X之间的关系是准确的或确定性的关系(exact or deterministic relationship)。
u——代指所有未经指明的对消费有所影响的那些因素。 计量经济学研究的一般是非准确关系: u被称为干扰(disturbance)或误差项(error term),它是一个随机变量(random or stochastic variable),它有良好的概率性质 u——代指所有未经指明的对消费有所影响的那些因素。 上述方程就是一个econometric model。用专业的语言说,它是一个linear regression model。 不包括直线的图叫散点图(scatter diagram或scattergram) 做散点图是计量经济学分析的重要技术之一:初步的工作
(4)获得数据 获取数据是参数估计的前提,占80%的工作量 (5)计量经济模型的估计 参数估计的基本方法是OLS法(Ordinary least squares) 利用数据可以估计出 和 的估计值为-184.08和0.7064。消费函数便为: 可见,在1980—1992年,美国的MPC≈0.71,实际收入↑1美元,实际消费↑71美分
(6)假设检验 通过参数估计所拟合的模型只能是现实的一个较好的近似,还必须制定适当的准则,用来判断所估计的值是否与待检验的理论预期值相一致 在很多假设检验中,我们要检验参数(系数)是否显著为零,或不为零。 (7)预报或预测 如果我们估计的参数通过了检验,并且所选的模型确认了我们所考虑的假设或理论,就可以根据解释变量或预测元(predictor)X的已知或预期未来值来预测应变量或预报变量(forecast variable)Y的未来值 比如,我们已经得出
假定实际GDP在1997上的预期值是7.2698万亿美元(现在是1993年),就可以求得1997年的预期消费支出: 如果投资↓,对经济的影响如何? 国民收入决定理论告诉我们,收入乘数M: 即投资↓1美元,收入↓3.33美元。这就为政策制定者提供了有用的信息 (8)利用模型进行控制或制定政策 假如政府认为4.9万亿美元的消费支出水平可以维持当前约4.2%的失业率,那么什么样的收入水平能够保证消费支出的这一目标值? (万亿美元 )
通过适当的财政政策和货币政策的配合,政府可操纵控制变量(control variable)X以产生目标变量(target variable)Y的预期水平 总之,经典计量经济学建模方法为: 经济理论 ↓ 理论的数学模型 理论的计量经济模型 数据
参数估计 ↓ 假设检检 预测 控制或制定政策
第二章 多元线性回归模型
学习目标: 熟悉多元线性回归模型的设定。 掌握多元线性回归的普通最小二乘估计法和极大似然估计法的原理。 掌握多元线性回归参数估计量的性质和模型的各种统计检验方法。 了解多元线性回归模型的置信区间的计算方法。 熟悉受约束回归的检验方法与检验步骤。 熟悉EViews软件进行多元线性回归模型估计的详细步骤。
第一节 多元线性回归模型及假定 第二节 多元线性回归模型的参数估计 第三节 多元线性回归模型的统计检验 第四节 多元线性回归模型的置信区间 第五节 受约束回归 第六节 案例分析
第一节 多元线性回归模型及假定 一、多元线性回归模型 其一般形式为: 由于习惯上把常数项看成为一个虚变量的系数,在 参数估计过程中该虚变量的样本观测值始终取1。这 样,模型中解释变量的数目为(K+1)。 代表众多影响变化的微小因素。
当给定一个样本 时,上 述模型表示为
经济意义: 与 存在线性关系, 是 的重要解释 变量。 代数意义: 与 存在线性关系。 几何意义: 表示一个多维平面。
多元总体回归函数: 的总体条件均值表示为多个解 释变量 的函数; 该方程被称为条件期望函数或总体回归函数或简称 总体回归。它仅仅表明在给定 下的 分布的均值 与 存在着函数关系。
多元线性回归模型表示的n个随机方程的矩阵表达式为: 其中,
以上多元线性回归模型也可表示向量表达式的形式 其中,
二、多元线性回归模型的若干假定 假定1:解释变量是非随机的,即在重复抽样中, 解释变量 取固定值,且相互之间互不 解释变量 取固定值,且相互之间互不 相关。这表明模型中的解释变量和随机干扰项对被 解释变量的影响是完全独立的。 假定2:随机干扰项与解释变量之间不相关。 这个假定说明 Xji与随机干扰项ui相互独立,互不相 关,它们对被解释变量Yi的影响同样也是独立的。
假定3:随机干扰项服从零均值,同方差,零协方差。 用矩阵形式表示就是随机干扰项的方差—协方差矩阵 形如:
假定4:随机干扰项服从正态分布。即 假定5:正确设定回归模型。 与一元回归模型一样,多元回归模型的正确设定也 有三个方面的要求: 1.选择正确的变量进入模型; 2.对模型的形式进行正确的设定;3.对模型的解释 变量被解释变量及随机干扰项做了正确的假定。 上述假定条件称为多元线性回归模型的经典假定。
第二节 多元线性回归模型的参数估计 一、 普通最小二乘法 (一) 普通最小二乘估计 对于多元线性回归模型,利用最小二乘法估计模 型的参数,同样应该使残差平方和达到最小,即 取最小值。 根据多元函数的极值原理, 分别对 求一阶偏导数,并令其为零。
即: 得到下列方程组:
可写成矩阵形式: 得出 叫做正规方程组; 因而 ,这就是向量 的 估计值 。
(二) 随机干扰项方差估计值 的普通最小二乘估计 (二) 随机干扰项方差估计值 的普通最小二乘估计 随机干扰项的方差的无偏估计为 其中, 为自由度,这是因为在估计 时,必须先求出 , 即消耗了 个自由度。
对于多元线性回归模型 于是, 的概率函数为
因为 是相互独立的,所以 是随机抽取的n组样本 观测值的联合概率,即似然函数为:
由于 是的单调函数,使 极大的参数值也将使 极大,即 ,所以 对数似然函数为:
可以求出 和 的估计参数
三、参数估计量的性质 (一)线性性 参数估计量是线性估计量,即是随机变量的线性函数。 由于 可见,参数估计量是被解释变量 的线性组合。
(二)无偏性 将 代入 ,得
(三)最小方差性 由于 为单位矩阵。
例3-1
(四)随机干扰项方差估计量的性质 由于被解释变量的估计值与观察值之间的残差 于是 随机干扰项方差的估计量为
第三节 多元线性回归模型的统计检验 一、模型的拟合优度检验 二、回归方程的显著性检验 三、显著性检验
一、模型的拟合优度检验 (一)R2检验 1.总离差平方和的分解 对于有k个解释变量的多元线性回归模型 其对应的回归方程为:
将 与其平均值 之间的离差分解如下: 总离差平方和: 回归平方和: 残差平方和:
总离差平方和分解为回归平方和与残差平方 和两部分。
可用回归平方和占总离差平方和的比重来衡量 样本回归线对样本观测值的拟合程度。 2.多元样本决定系数与拟合优度检验 多元样本决定系数: 可用回归平方和占总离差平方和的比重来衡量 样本回归线对样本观测值的拟合程度。
可由样本回归线解释的部分越大,残差平方和 越小,样本回归线与样本观测值的拟合程度越高;反之则拟合得越差。 可用回归平方和占总离差平方和的比重来衡量样本回归线对样本观测值的拟合程度。 的数值越接近1,表明 中总离差平方和中 可由样本回归线解释的部分越大,残差平方和 越小,样本回归线与样本观测值的拟合程度越高;反之则拟合得越差。
3. 修正样本决定系数 R2的大小与模型中解释变量的数目有关,解释 变量的个数越多,它的值就越大,在实际运用中 需要对其进行调整。
调整的思想是将残差平方和与总离差平方和之比 的分子分母分别用各自的自由度去除,变成均方 差之比,以剔除解释变量个数对拟合优度的影响。 于是,修正的样本决定系数为
调整的可决系数与未经调整的可决系数之间存在 如下关系: 或 仅仅说明了在给定的样本条件下,估计 的回归方程对于样本观测值的似合优度。
在实际应用中, 或 究竟要多大才算模型 通过了检验,没有绝对的标准,要视具体情况而 定。 模型的拟合优度并不是评价模型优劣的唯一 标准,有时为了追求模型的经济意义宁可牺牲一 点拟合优度。
(二)赤池信息准则和施瓦茨准则 赤池信息准则: 施瓦茨准则: 表示解释变量的个数(包括常数项) 这两个准则均要求仅当所增加的解释变量能够减 少AIC值或SC值时才在原模型中增加该解释变量。
二、回归方程的显著性检验 (一)回归方程的显著性检验 回归方程的显著性检验是指在一定的显著性水平下,从总体上对模型中被解释变量与解释变量之间的线性关系是否显著成立而进行的一种统计检验。
对于多元线性回归模型: 为了从总体上检验模型中被解释变量与解释变量之间的线性关系是否显著,必须对其进行显著性检验。
检验的原假设与备择假设分别为: 检验的思想来自于总离差平方和的分解式: ESS是解释变量的联合对被解释变量的线性作用的结 果,可通过该比值ESS/RSS的大小对总体线性关系进 行推断。
根据数理统计学中的定义,在 成立的条件下,构造一个统计量: 则该统计量服从自由度为 的 分布。
根据变量的样本观测值和估计值,计算 统计 量的数值;给定一个显著性水平 ,查 分布表, 得到一个临界值 。 如果 ,则在 显著性水平下 拒绝原假设,即模型的线性关系显著成立,模型通 过方程显著性检验。
(二)拟合优度 检验与方程总体线性的显著性检验 之间的关系 拟合优度检验与方程总体线性的显著性检验之间有 如下关系: 检验可用于度量总体回归直线的显著性,也可用 于检验 的显著性。
三、解释变量的显著性检验 (一)解释变量的显著性检验 解释变量的显著性检验,是指在一定的显著性 水平下,检验模型的解释变量是否对被解释变量有 显著影响的一种统计检验。
检验的原假设与备择假设分别为: 构造如下的t检验统计量: 若 ,则在 水平下拒绝原假设, 即 对应的解释变量Xj是显著的; 若 ,则在 水平下接受原假设, 即 对应的解释变量Xj是不显著的;
第四节 多元线性回归模型的置信区间 一、点估计值 二、参数估计量的置信区间 三、预测值的置信区间
一、点估计值 点估计值就是求解释变量 对应的 被解释变量 的估计值。 预测值与实际值之间存在的误差为:
二、参数估计量的置信区间 要判断样本参数的估计值在多大程度上可以近 似地替代总体参数的真值,往往需要通过构造一个 以样本参数的估计值为中心的区间来考察它以多大 的概率包含着真实的参数值。这种方法就是参数检 验的置信区间估计。
因为 分布的分布曲线对称于纵坐标轴,所以在给 定的置信水平下1- ,我们选取对称于原点的区 间使得,
于是得到参数估计量 的置信水平为 的置信区间为: 1- 缩小置信区间的办法?
三、预测值的置信区间 (一) 的预测区间 是服从正态分布的, 将随机干扰项的方差 用其无偏估计量 代替,可构造如下 统计量:
于是,得到置信度为 下 的置信区间: 1-
(二) 的预测区间 设 是实际预测值 与预测值 之差: 将上式中的 用它的估计值 代替;
则得到 的标准差估计值,其中,
构造t 统计量: 对于给定的显著性水平 ,可以从t分布表中查 得临界值 。 于是,对于给定的置信水平1-,预测值 的置 信区间为:
第五节 受约束回归 一、模型参数的线性约束 二、对回归模型增加或减少解释变量 三、参数的稳定性 四、三大经典的非线性约束检验
在建立回归模型时,有时根据经济理论需要对 模型中变量的参数施加一定的约束条件。 模型施加约束条件后进行回归,称受约束回归, 与此对应,不加任何约束的回归称为无约束回归。
例如,在估计柯布-道格拉斯生产函数 ( 分别为劳动和资本的产出弹性)时,如果规 模报酬不变,即每一同比例的投入变化有同比例的 产出变化,则 函数有 约束。
一、模型参数的线性约束 对模型 施加约束 得: 或 如果对式 回归得出参数的估计结果 则由约束条件可得:
然而,对所考查的具体问题能否施加约束条 件,需进一步进行相应的检验。 常用的检验有: 检验、 检验与 检验,这 里主要介绍 检验。
在同一样本下,记无约束样本回归模型为 受约束样本回归模型为 于是 受约束样本回归模型的残差平方和RSSR 于是
为无约束样本回归模型的残差平方和RSSU 由式 RSSR RSSU 从而 ESSR ESSU 这意味着,通常情况下,对模型施加约束条件会降低模型的解释能力。
但是,如果约束条件为真,则受约束回归模型与无约束回归模型具有相同的解释能力,RSSR 与 RSSU的差异变小。可用RSSR - RSSU的大小来检验约束的真实性。
即约束条件为真 即不可施加约束条件。 如果约束条件为真,则受约束回归模型与无约束 回归模型具有相同的解释能力, 与 的差 异变小。
根据数理统计学的知识: 于是:
如果约束条件无效, RSSR 与 RSSU的差异较大,计算的F值也较大。 其中,kU, kR分别为无约束与受约束回归模型的解释变量的个数(不包括常数项), kU-kR恰为约束条件的个数。
例3-2
二、对回归模型增加或减少解释变量 考虑如下两个回归模型:
相应的F统计量为: 统计量的另一个等价式:
如果约束条件为真,即额外的变量 没有解释能力,则F统计量较小; 否则,约束条件为假,意味着额外的变量对F 有较强的解释能力,则F统计量较大。 因此,可通过F的计算值与临界值的比较,来 判断额外变量是否应包括在模型中。
2017/3/19 计量经济学
2017/3/19 计量经济学
2017/3/19 计量经济学
2017/3/19 计量经济学
三、参数的稳定性 的关系可能会发生结构变化,这可能是由经济系 统的需求或供给冲击带来的,也可能是制度转变 的结果。 对于时间序列数据,因变量和解释变量之间 的关系可能会发生结构变化,这可能是由经济系 统的需求或供给冲击带来的,也可能是制度转变 的结果。 因此,建立模型时往往希望模型的参数和设 定关系是稳定的,即所谓的结构不变,那么如何 检验结构变化?
在两个连续的时间序列(1,2,…,n1)与(n1+1,…,n1+n2)中,相应的模型分别为 (一)邹氏参数稳定性检验 假设需要建立的模型为 在两个连续的时间序列(1,2,…,n1)与(n1+1,…,n1+n2)中,相应的模型分别为 合并两个时间序列为( 1,2,…,n1 ,n1+1,…,n1+n2 ) ,则可写出如下无约束回归模型
如果 =,表示没有发生结构变化,因此可针对如下假设进行检验:H0: = 式施加上述约束后变换为受约束回归模型
因此, 检验的统计量为: 记RSS1与RSS2为在两时间段上分别回归后所得的残差平方和,容易验证, 于是
参数稳定性的检验步骤: 1.分别以两连续时间序列作为两个样本进行回归,得到相应的残差平方: 与 ; 2.将两序列并为一个大样本后进行回归,得到大样本下的残差平方和 ; 3.计算统计量的值 邹氏参数稳定性检验 。
(二)邹氏预测检验 邹氏预测检验的基本思想: 先用前一时间 段个样本估计原模型,再用估计出的参数进行后一时间段 个样本的预测。 如果预测误差较大,则说明参数发生了变化,否则说明参数是稳定的。
分别以 、 表示第一与第二时间段的参数,则 矩阵式为:
如果参数没有发生变化,则 ,矩阵式简化为 检验:
邹氏预测检验步骤: 1.在两时间段的合成大样本下做OLS回归,得受约束 模型的残差平方和 ; 2.对前一时间段的 个子样做回归,得残差平方和 ; 3.计算检验的 统计量,做出判断。给定显著性水 平 ,查 分布表,得临界值 ; 如果 ,则拒绝原假设,认为预 测期发生了结构变化。
四、三大经典的非线性约束检验 估计线性模型时也可对模型参数施加非线性约束。 如对模型 施加非线性约束 ,得到受约束回归模型:
该模型无法运用普通最小二乘法进行估计的, 必须采用非线性最小二乘法进行估计。 非线性约束检验是建立在最大似然原理基础上 的,有最大似然比检验、沃尔德检验与拉格朗日乘 数检验。
约束回归模型,运用最大似然估计法,检验两个似 然函数的值的差异是否“足够”大。 (一)最大似然比检验(LR) 最大似然比检验需要估计无约束回归模型与受 约束回归模型,运用最大似然估计法,检验两个似 然函数的值的差异是否“足够”大。 似然比: 如果比值不接近于1 ,说明两似然函数值差距较大,则应拒绝约束条件为真的假设;如果比值 接近于1,说明两似然函数值很接近,应接受约 束条件为真的假设。
具体检验时,由于大样本下: h是约束条件的个数。因此:通过LR 统计量的2分布特性来进行判断。
2017/3/19 计量经济学
2017/3/19 计量经济学
(二)沃尔德检验(WD) LR检验既要估计约束条件下的极大似然函数值,又要估计无约束下的极大似然函数值,当约束模型的估计很困难时,此方法尤为适用。 沃尔德检验中,只须估计无约束模型。如对 要检验约束 ,只须对该模型进行回归,并判断 与1的差距是否足够大。
在所有古典假设都成立的条件下,容易证明 因此,在 1+2=1 的约束条件下 建立沃尔德统计量:
如果有h个约束条件, WD检验的原假设和备择假设为 如果约束条件是成立的,我们用参数估计值 来代替参数 , 应该很接近0;而如果约束条件不成立, 将显著地偏离0。因此构造以下统计量: 在原假设成立的条件下,在大样本下Wald统计量具有以下渐近分布: q为约束条件的个数
2017/3/19 计量经济学
2017/3/19 计量经济学
(三)拉格朗日乘数检验(LM) 与WD检验不同的是拉格朗日乘数检验只须估计 受约束模型。所以当施加约束条件后模型形式变得 简单时,更适用这种检验。 拉格朗日乘数检验则只需估计受约束模型。受约 束回归是求最大似然法的极值问题: 其中, 是拉格朗日乘数行向量,衡量各约束条件对 最大似然函数值的影响程度。
如果某一约束为真,则该约束条件对最大似 然函数值的影响很小,于是,相应的拉格朗日乘 数的值应接近于零。因此,拉格朗日乘数检验就 是检验某些拉格朗日乘数的值是否“足够大”, 如果“足够大”,则拒绝约束条件为真的假设。 在各约束条件为真的情况下,拉格朗日统计量服 从一自由度恰为约束条件个数的渐近 分布。
如果为线性约束, 服从一精确的 分布: 其中,n为样本容量,R2为如下辅助回归的可决系数 为受约束回归模型的残差序列。
2017/3/19
2017/3/19 计量经济学
对三个检验统计量的说明 1. 可以证明,当样本容量趋于无穷大时,三种检验统计量都具有同样的极限分布,检验结果是一致的,即三者在大样本下,同时拒绝原假设或同时不拒绝原假设,这被称为渐近等价; 而对于小或中等样本容量来说,三者的表现不同且未知,检验结果可能不一致。 在实际应用中,对于小或中等样本容量,在进行线性约束检验时,通常的F统计量可能更为有效。
三种检验统计量均采用极大似然估计量。LR检 验同时进行有约束和无约束的极大似然估计;Wald 只需做无约束极大似然估计;而LM只需做有约束 的极大似然估计。 3. 对于线性回归模型而言,在有限样本或小样本中 。