y = b0 + b1x + u http://international.cengage.com ch2 简单二元回归 y = b0 + b1x + u http://international.cengage.com 1
综合练习一 三人一组,自己选择研究对象,完成选题、收集数据、建 立模型、估计模型和检验模型解释模型的全过程。(如果 出现违背G-M假设条件,修正之) 5月4日(前交电子稿)打印稿。 尽可能使用校图书馆、国家统计局数据库、统计年鉴、证 监会、中国人民银行等网站数据,以减少收集数据的工作 量。 列出数据表,以便于检查。
格式 标题 研究背景、目的及意义 (文献回顾) 样本、研究方法(模型的建立、变量的选择) 实证结果及分析‥(经济意义检验、统计、计量、 预测检验,修正模型--最终模型,解释分析结果) 结论 参考文献
归纳总结所学检验 格式 (6月22日交手写纸质稿) (1)名称 t-统计量 (2)作用 系数参数的显著性检验 (3)原理 格式 (6月22日交手写纸质稿) (1)名称 t-统计量 (2)作用 系数参数的显著性检验 (3)原理 (4)原假设、备择假设 (5)接受拒绝原假设的含义 对 有没有显著影响 (6)如何构造统计量 (7)统计量的分布 t分布 (8)如何下结论 拒绝原假设
归纳总结所学模型/估计 格式 (6月15日交手写纸质稿) (1)模型/估计的名称 (2)适用的数据 (3)假设条件 格式 (6月15日交手写纸质稿) (1)模型/估计的名称 (2)适用的数据 (3)假设条件 (4)估计方法/原理/步骤 (5)估计量及其统计性质
本章大纲 简单回归模型的定义 普通最小二乘法的推导 OLS的操作技巧 测量单位和函数形式 OLS估计量的期望值和方差 过原点回归 6
讲义大纲 一些术语的注解 一个简单假定 条件期望零值假定 何为普通最小二乘法 普通最小二乘法的推导 7
reference Jensen,M.C.(1968) The Performance of Mutual Funds in the Period 1945-1968, Journal of Economical 6,389-416 Clare, A.D. and Thomas, S.H.(1995) The Overreaction Hypothesis and the UK Stock Market , Journal of Business Finance and Accounting 22(7), 961-973
简单回归模型的定义 要写出用x解释y的模型 (1) x与y没有确切的关系,如何考虑其他影响y的因素? (2) x和y的函数关系怎样?
计量经济学模型 △ 模型:对现实的描述和模拟 △ 数学模型:用数学语言描述现实 △ 经济数学模型:用数学方法描述经济活动 △ 计量经济学模型:揭示经济活动中个因素之间的定量关系,用随机的数学方程加以描述 △ 经济理论分析(行为分析)→数理分析 →数量分析
★左边变量y通常被称为因变量,被解释变量,响应变量、 被预测变量或回归子。 术语注解 简单一元回归模型 y = b0 + b1x + u 只有一个非常数回归元,称之为简单回归模型, 两 变量回归模型或双变量回归模型. ★左边变量y通常被称为因变量,被解释变量,响应变量、 被预测变量或回归子。 ★右边变量x通常被称为自变量,解释变量,控制变量,预 测变量、回归元,或协变量。 11
术语注解 b0 , b1被称为回归系数(regression coefficient)。 b0 也被称为常数项或截矩项,或截矩参数(intercept parameter) 。 b1代表了回归元x的边际效果,也被 成为斜率参数。 y = b0 + b1x + u 12
术语注解 y = b0 + b1x + u u 为误差项(error)或扰动项(disturbance),它代表了除了x 之外可以影响y的因素。 13
随机误差项主要包括下列因素: 在解释变量中被忽略的因素的影响; 变量观测值的观测误差的影响; 残缺数据 模型关系的设定误差的影响; 其他随机因素的影响。 产生并设计随机误差项的主要原因: 理论的含糊性; 数据的欠缺; 节省原则。
术语注解 线性的含义: y 和x 之间并不一定存在线性关系, 但是,只要通过转换可以使y的转换形式和x的转 换形式存在相对于参数的线性关系,该模型即称 为线性模型。 15
上述简单工资函数描述了受教育年限和工资之间的 关系, b1 衡量了多接受一年教育工资可以增加多少. 简单二元回归模型例子 A simple wage equation wage= b0 + b1(years of education) + u b1 : if education increase by one year, how much more wage will one gain. 上述简单工资函数描述了受教育年限和工资之间的 关系, b1 衡量了多接受一年教育工资可以增加多少. 16
我们假定总体中误差项u的平均值为零. 该假定是 否具有很大的限制性呢? If for example, E(u)=5. Then y = (b0 +5)+ b1x + (u-5), therefore, E(u’)=E(u-5)=0. 上述推导说明我们总可以通过调整常数项来实现 误差项的均值为零, 因此该假定的限制性不大. 17
我们需要对u和 x之间的关系做一个关键假定。理 想状况是对x的了解并不增加对u的任何信息。换句 话说,我们需要u和 x完全不相关。 条件期望零值假定 我们需要对u和 x之间的关系做一个关键假定。理 想状况是对x的了解并不增加对u的任何信息。换句 话说,我们需要u和 x完全不相关。 18
条件期望零值假定 由于我们已经假定了E(u) = 0,因此有 E(u|x) = E(u) = 0 (2.6) 19
E(u|x) = E(u) = 0 (2.6) 该假定是何含义? 不相关 u的均值独立于x u和x完全独立 零条件均值假定
条件期望零值假定 在教育一例中,假定u 代表内在能力,条件期望零 值假定说明不管解释教育的年限如何,该能力的平 均值相同。 21
假设期末成绩分数取决于出勤次数和影响学生现场 发挥的因素,如学生个人素质。那么上述模型中假 设(2.6)何时能够成立? 条件期望零值假定 假设期末成绩分数取决于出勤次数和影响学生现场 发挥的因素,如学生个人素质。那么上述模型中假 设(2.6)何时能够成立? 22
Intermediate Econometrics Yan Shen 条件期望零值假定 (2.6)说明总体回归函数应满足E(y|x) = b0 + b1x。 该函数是x的线性函数,y的分布以它为中心。 Intermediate Econometrics Yan Shen 23
Intermediate Econometrics Yan Shen f(y) 给定x时y的 条件分布 . E(y|x) = b0 + b1x . x1=5 x2 =10 Intermediate Econometrics Yan Shen 24
总体回归函数 回归分析关心的是根据解释变量的已知或给定值,考察被解释变量的总体均值,即当解释变量取某个确定值时,与之统计相关的被解释变量所有可能出现的对应值的平均值。 如何理解?
为达到此目的,将该100户家庭划分为组内收入差不多的10组,以分析每一收入组的家庭消费支出。 例2.1 例2.1:一个假想的社区有100户家庭组成,要研究该社区每月家庭消费支出Y与每月家庭可支配收入X的关系。 即如果知道了家庭的月收入,能否预测该社区家庭的平均月消费支出水平。 为达到此目的,将该100户家庭划分为组内收入差不多的10组,以分析每一收入组的家庭消费支出。
由于不确定因素的影响,对同一收入水平X,不同家庭的消费支出不完全相同; 术语:给定X值Y的条件分布 由于不确定因素的影响,对同一收入水平X,不同家庭的消费支出不完全相同; 但由于调查的完备性,给定收入水平X的消费支出Y的分布是确定的,即以X的给定值为条件的Y的条件分布(Conditional distribution)是已知的,例如:P(Y=561|X=800)=1/4。
术语:总体回归线 因此,给定收入X的值Xi,可得消费支出Y的条件均值(conditional mean)或条件期望(conditional expectation):E(Y|X=Xi)。 该例中:E(Y | X=800)=602 描出散点图发现:随着收入的增加,消费 “平均地说”也在增加,且Y的条件均值均落 在一根正斜率的直线上。这条直线称为总体 回归线。
总体回归线 500 1000 1500 2000 2500 3000 3500 4000 每月可支配收入X(元) 每 月 消 费 支 出 Y (元)
称为(双变量)总体回归函数(population regression function, PRF)。总体回归函数是固定而又未知的。 术语:总体回归函数 在给定解释变量Xi条件下被解释变量Yi的期望轨迹称为总体回归线(population regression line),或更一般地称为总体回归曲线(population regression curve)。 相应的函数: 称为(双变量)总体回归函数(population regression function, PRF)。总体回归函数是固定而又未知的。
函数形式:可以是线性或非线性的。 叙述 含义:回归函数(PRF)说明被解释变量Y的平 均状态(总体条件期望)随解释变量X变化的 规律。 例2.1中,将居民消费支出看成是其可支配收入的线性函数时: 为一线性函数。其中,0,1是未知参数,称为回归系数(regression coefficients)。
yi = b0 + b1xi + ui。 普通最小二乘法的推导 回归的基本思想是从样本去估计总体参数。 我们用 {(xi,yi): i=1, …,n} 来表示一个随机样本,并假定每 一观测值满足 yi = b0 + b1xi + ui。 。 33
Intermediate Econometrics Yan Shen 总体回归线,样本观察点和相应误差 y E(y|x) = b0 + b1x . y4 u4 { . y3 u3 } . y2 u2 { u1 . y1 } x1 x2 x3 x4 x Intermediate Econometrics Yan Shen 34
普通最小二乘法的推导 为推导OLS估计量,假设E(u|x) = E(u) = 0 ,则 Cov(x,u) = E(xu) = 0 Why? 根据概率论基础知识, Cov(X,Y) = E(XY) – E(X)E(Y) 由E(u|x) =0 E(u) = Ex [E(u|x)]=0 (2.10) 可得 Cov(x,u) = Cov[x, E(u|x)]=0。 (2.11) 35
普通最小二乘法的推导 由于 u = y – b0 – b1x,根据x, y, 和 b1 ,可写出2个限制条件, E[x(y – b0 – b1x)] = 0 E(y – b0 – b1x) = 0 称之为矩条件。 可将u = y – b0 – b1x代入(2.10)(2.11)式,以得上述两个矩 条件。 36
使用矩方法推导普通最小二乘法 矩方法是将总体的矩限制应用于样本中。 37
三、参数的矩法 K阶矩: K阶样本矩: K阶中心矩: K阶样本中心矩:
矩方法 假设: 样本矩条件:
普通最小二乘法的推导 目标是通过选择参数值,使得在样本中矩条件也可以成立。 选择估计值 ,求解(2.10)(2.11)的样本对应值: 40
普通最小二乘法的推导 根据样本均值的定义以及加总的性质,可将第一个条件写为 41
普通最小二乘法的推导 42
因此OLS估计出的斜率为 等于总体的协 方差除以 的方 差 等于 的样本协方差除以 的样本方差 43
OLS估计量
简单一元回归 定义 在 时的拟合值(fitted value)为 这是给定截距、斜率下, 时的预测值。也称为样本回归函 数(sample regression function SRF),是总体回归函数的一个 样本估计 第i次观测的残差(residual)是 的观测值与拟合值之差: 简单一元回归可写成:
斜率估计量等于样本中x 和 y 的协方差除以x的方差。 若x 和 y 正相关则斜率为正,反之为负。 OLS斜率估计法总结 斜率估计量等于样本中x 和 y 的协方差除以x的方差。 若x 和 y 正相关则斜率为正,反之为负。 46
OLS法是要找到一条直线,使残差平方和最小。 残差是对误差项的估计,因此,它是拟合直线(样 本回归函数)和样本点之间的距离。 47
. . . . { } 样本回归线,样本数据点和相关的误差估计项 y y4 û4 y3 } û3 y2 û2 { û1 y1 x1 x2 48
推导方法二 正式解一个最小化问题,即通过选取参数而使下列值最小: 问题:为什么不是最小化残差的其它某个函数? (1)求解过程 (2)统计性质 49
推导方法二 如果直接解上述方程我们得到下面两式,这两个式子等 于前面两式乘以n 50
推导方法三 最大似然估计
介绍通过随机样本的数据运用普通最小二乘法估计 斜率和截距的参数值 讲义总结 介绍简单线性回归模型 介绍通过随机样本的数据运用普通最小二乘法估计 斜率和截距的参数值 52
简单一元回归(2) y = b0 + b1x + u 53
本章大纲 简单回归模型的定义 推导普通最小二乘法的估计量 OLS的操作技巧 测量单位和回归方程形式 OLS估计量的期望值和方差 过原点的回归 54
讲义大纲 OLS的代数特性 拟合优度 使用gretl做OLS 回归 改变测量单位对OLS统计量的效果 55
OLS的操作技巧 例:CEO的薪水和资本权益报酬率 56
例:CEO的薪水和资本权益报酬率 变量salary衡量了已1000美元为单位的年薪,其最 小值,均值和最大值分别如上。 Roe=净收入/所有者权益,为三年平均值。 Data:CEOSAL1.RAW 57
例 CAPM Data:wind
例:CEO的薪水和资本权益报酬率 对估计量的解释: 常数项的估计值衡量了当roe为零时CEO的薪水。 b1 的估计值反应了ROE若增加一个百分点工资将增加18500美元。 59
OLS的代数性质 OLS 残差和为零 (p24) 因此 OLS 的样本残差平均值也为零. 60
OLS的代数性质 回归元(解释变量)和OLS残差之间的样本协方差为零 (p25) 61
OLS的代数性质 OLS回归线总是通过样本的均值。 每个拟合值 都在OLS回归线上。 62
OLS的代数性质 我们可把每一次观测看作由被解释部分和未解释部分构成. 预测值和残差在样本中是不相关的 63
OLS的代数性质 64
定义总平方和(total sum of squares SST)为 更多术语 定义总平方和(total sum of squares SST)为 总平方和是对y在样本中所有变动的度量,即它度 量了y在样本中的分散程度 将总平方和除以n-1,我们得到y的样本方差。 65
更多术语 解释平方和(explained sum of squares SSE)定义为 它度量了y的预测值的在样本中的变异 回归平方和、模型平方和 66
更多术语 残差平方和(residual sum of squares)定义为 残差平方和度量了残差的样本变异 67
SST、SSR and SSE y 的总变动可以表示为已解释的变动SSE和 未解释的变动SSR之和,即 SST=SSE+SSR 68
证明 SST = SSE + SSR 69
证明 SST = SSE + SSR 该证明中我们使用了一个事实, 即样本中因变量的拟合值和 残差不相关. 70
我们如何衡量样本回归线是否很好地拟合了样本 数据呢? 可以计算模型解释的总平方和的比例,并把它定 义为回归的R-平方 拟合优度 我们如何衡量样本回归线是否很好地拟合了样本 数据呢? 可以计算模型解释的总平方和的比例,并把它定 义为回归的R-平方 R2 = SSE/SST = 1 – SSR/SST 71
它因此可被看作是y的样本变动中被可以被x解释的 部分 R-平方的值总是在0和1之间 拟合优度 R-平方是已解释的变动占所有变动的比例 它因此可被看作是y的样本变动中被可以被x解释的 部分 R-平方的值总是在0和1之间 72
拟合优度
拟合优度
在社会科学中,特别是在截面数据分析中, 回归方 程得到低的R-平方值并不罕见。 值得强调的是表面上低的R-平方值不一定说明 拟合优度 在社会科学中,特别是在截面数据分析中, 回归方 程得到低的R-平方值并不罕见。 值得强调的是表面上低的R-平方值不一定说明 OLS回归方程是没有价值的 75
拟合优度 Example 2.8 CEO薪水和净资产回报 Example 2.9 竞选结果和选举活动开支 76
我们已经推导出公式计算参数的OLS估计值,所幸 的是我们不必亲手去计算它们。 用 gretl进行OLS回归 我们已经推导出公式计算参数的OLS估计值,所幸 的是我们不必亲手去计算它们。 在gretl中进行回归非常简单,要让y对x进行回归, 只需要输入 77
假定薪水的单位是美元,而不是千美元, salarys. 在Salarys对roe进行回归时OLS截距和斜率的估 计值是多少? 测量单位 假定薪水的单位是美元,而不是千美元, salarys. 在Salarys对roe进行回归时OLS截距和斜率的估 计值是多少? 78
测量单位 一般而言,当因变量乘上常数c,而自变量不改变时,OLS 的截距和斜率估计量也要乘上c。 79
测量单位 如果定义 roedec = roe/100,那么样本回归线将会从 (estimated salary)=963.191 + 18.501roe to 改变到 一 般而言,如果自变量除以或乘上某个非零常数,c,那 么OLS斜率将乘以或除以c,而截距则不改变。 80
在简单回归中加入非线性 线性关系并不适合所有的经济学运用 然而,通过对因变量和自变量进行恰当的定义, 我 们可以在简单回归分析中非常容易地处理许多y和x 之间的非线性关系. 81
自然对数 82
在工资-教育的例子中,假定每增加一年的教育, 工资的百分比增长都是相同的 能够给出不变的百分比效果的模型是 If , we have Data: wage1.raw 83
Example 2.10 将对数工资方程 和该方程相比 84
自然对数的另一个重要用途是用于获得弹性为常 数的模型 在CEO的薪水和企业销售额的例子中,常数弹性 模型是 85
Intermediate Econometrics Yan Shen 变量的原始形式和其自然对数的不同组合 Intermediate Econometrics Yan Shen 86
简单二元回归 (3) y = b0 + b1x + u 87
本章大纲 二元回归模型的定义 推导普通最小二乘法的估计量 OLS的操作技巧 测量单位和函数形式 OLS估计量的期望值和方差 过原点回归 88
最小二乘估计量的性质 当模型参数估计出后,需考虑参数估计值的 精度,即是否能代表总体参数的真值,或者说需 考察参数估计量的统计性质。 一个用于考察总体的估计量,可从如下几个方面考察其优劣性: (1)线性性,即它是否是另一随机变量的线性函数;
(2)无偏性,即它的均值或期望值是否等于总 体的真实值; (3)有效性,即它是否在所有线性无偏估计量 中具有最小方差。 这三个准则也称作估计量的小样本性质。 拥有这类性质的估计量称为最佳线性无偏估计量(best liner unbiased estimator, BLUE)。
(4)渐近无偏性,即样本容量趋于无穷大时,是否它的均值序列趋于总体真值; 当不满足小样本性质时,需进一步考察估计量的大样本或渐近性质: (4)渐近无偏性,即样本容量趋于无穷大时,是否它的均值序列趋于总体真值; (5)一致性,即样本容量趋于无穷大时,它是否依概率收敛于总体的真值; (6)渐近有效性,即样本容量趋于无穷大时,是否它在所有的一致估计量中具有最小的渐近方差。
高斯—马尔可夫定理(Gauss-Markov theorem) 在给定经典线性回归的假定下,最小二乘估计量是具有最小方差的线性无偏估计量。
OLS估计量的期望值和方差 从总体中抽取的不同的随机样本可得到不同的OLS估计量, 我们将研究这些OLS估计量的分布。 93
其中 b0 和 b1 分别是总体的截距参数和斜率参数 假定SLR.1 (关于参数是线性的) 在总体模型中,因变量 y 和自变量 x 和残差 u 的关系可写作 y = b0 + b1x + u , 其中 b0 和 b1 分别是总体的截距参数和斜率参数 94
假定SLR.2 (随机抽样): 假定我们从总体模型随机抽取容量为n的样本, {(xi, yi): i=1, 2, …, n}, 那么可以写出样本模型为 yi = b0 + b1xi + ui 95
假定 SLR.3 和 SLR.4 SLR.3, 零条件期望: 假定 E(u|x) = 0 . 那么在随机样本中我们有 E(ui|xi) = 0 SLR.4 (自变量中的样本变异): 在样本中,自变量 x 并不等 于一个不变常数。 96
使用假定SLR.1到SLR.4,我们可以得到无论b0,和 b1 取什么值,它们的OLS估计量的期望值等于它 们各自的真值。 证明: 97
无偏性总结 b1 和 b0 的OLS估计量是无偏的 无偏性的证明依赖于我们的四个假定--如果任何假定不 成立,OLS未必是无偏的 记住无偏性是对估计量的描述--对于一个给定的样本我 们可能靠近也可能远离真实的参数值 99
Intermediate Econometrics Yan Shen Example 2.12 例2.12 学生的数学表现和学校的午餐项目 该例研究了是否参加学校的免费午餐项目是否能够提高学生 在数学考试中的成绩。我们用Math10来表示10年级学生的 数学成绩,用Lnchprg表示可以参加学校的免费午餐项目的 学生的比例。 Data: MEAP93.RAW Intermediate Econometrics Yan Shen 100
学生的数学成绩和学校的免费午餐项目 估计所得方程说明参加免费午餐的学生的比例越多,他们的 成绩越差。可信吗? 101
学生的数学成绩和学校的免费午餐项目 产生上述结果的一个可能是u 和 x是相关的。比如, u包 括了贫困率,它影响学生的学习表现,又和是否有资格 参加免费午餐项目高度相关。 102
了解这一点(分布的分散程度),将对我们如何能 够在所有的估计量中,或至少在无偏估计量这 一类估计量中选出最优的一个具有一定的指导 意义。 OLS估计量的抽样方差 现在我们知道估计量的随机抽样分布以真值为 中心 想知道的是这个分布散开的程度 了解这一点(分布的分散程度),将对我们如何能 够在所有的估计量中,或至少在无偏估计量这 一类估计量中选出最优的一个具有一定的指导 意义。 103
OLS估计量的抽样方差 在一个附加假定下计算这个方差会容易的多,因此 有 假定 SLR.5 (同方差性): Var(u|x) = s2 (Homoskedasticity) 高斯—马尔可夫(Gauss-Markov)假设:SLR1-5 104
同方差的情形 y f(y|x) . E(y|x) = b0 + b1x . x1 x2 105
异方差的情形 f(y|x) y . . E(y|x) = b0 + b1x . x1 x2 x3 x 106
y的条件期望线性于x,但给定x时y 的方差却是常数。 OLS的抽样方差(继续) Var(u|x) = E(u2|x)-[E(u|x)]2 E(u|x) = 0, so s2 = E(u2|x) = E(u2) = Var(u) Var(u)=Ex(E(u2|x)])+Varx[(E(u|x)] 因此 s2 也是无条件方差,被称作误差方差 s, 误差方差的平方根被称作是标准误差 Can say: E(y|x)=b0 + b1x and Var(y|x) = s2 y的条件期望线性于x,但给定x时y 的方差却是常数。 107
工资方程中的异方差性 当Var(u|x)值和x 相关是,我们称误差项存在异方差。 举例来说,如果我们假设工资一式满足同方差,那 么就意味着不管educ值为何水平,工资的分布相对 于教育水平而言都是相同的。 如果接受高等教育的人面临的机会更多,收入的差 异可能更大,在这一情形中,上述假定未必成立。 108
OLS的方差(继续) 109
OLS的方差(继续) 110
定理 2.2 ( OLS 估计量的抽样方差 ) 在假定 SLR.1 到 SLR.5 下,我们有(2.57): and 111
OLS估计量样本方差的总结 误差方差 s2 越大,斜率估计量的方差也越大 xi 的变动越大,斜率估计量的方差越小.因此我们应该选择 尽可能的分散开的xi 大的样本容量能够减小样本斜率估计量的方差。 112
OLS估计量样本方差的总结 在实验数据中这一点(增大xi的变动)有时是可能的,但在社 会科学中我们很少可以人为地增加xi的变动。 113
估计误差方差 我们不知道误差方差 s2 是多少,因为我们不能观 察到误差 ui 我们观测到的是残差 ûi 我们可以用残差构成误差方差的估计 114
估计误差方差 首先,我们注意到 s2=E(u2), 所以s2的无偏估 计量是 ui 是不可观测的,但我们找到一个ui的无偏 估计量 估计量是有偏的。 115
误差方差估计量(继续) 116
Intermediate Econometrics Yan Shen 误差方差估计量(继续) Intermediate Econometrics Yan Shen 117
Intermediate Econometrics Yan Shen 总结 OLS的无偏性 OLS的抽样方差 标准方差和标准误差的定义 估计误差方差 Intermediate Econometrics Yan Shen 118
(2)证明最小方差性 其中,ci=ki+di,di为不全为零的常数 则容易证明 普通最小二乘估计量(ordinary least Squares Estimators)称为最佳线性无偏估计量(best linear unbiased estimator, BLUE)
由于最小二乘估计量拥有一个“好”的估计量所应具备的小样本特性,它自然也拥有大样本特性。
简单一元回归(4) 过原点回归
过原点回归 (2.66)
样题,2.8 125
126
127
128
129