Y = b0 + b1x + u http://international.cengage.com ch2 简单二元回归 y = b0 + b1x + u http://international.cengage.com 1.

Slides:



Advertisements
Similar presentations
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.6 隐函数微分法 第二章 第二章 二、高阶导数 一、隐式定义的函数 三、可微函数的有理幂. 一、隐函数的导数 若由方程 可确定 y 是 x 的函数, 由 表示的函数, 称为显函数. 例如, 可确定显函数 可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此 隐函数求导方法.
§3.4 空间直线的方程.
3.4 空间直线的方程.
非线性时间序列模型 一般非线性时间序列模型介绍 条件异方差模型 上海财经大学 统计与管理学院.
第六章 回归分析.
第十章 相关与回归分析 PowerPoint 统计学.
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
第三章 函数逼近 — 最佳平方逼近.
Introductory Econometrics for Finance 回归分析的基本概念
《高等数学》(理学) 常数项级数的概念 袁安锋
第一章 行列式 第五节 Cramer定理 设含有n 个未知量的n个方程构成的线性方程组为 (Ⅰ) 由未知数的系数组成的n阶行列式
第二章 经典单方程计量经济学模型: 一元线性回归模型
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
计量经济学 第三章 多元线性回归模型.
简单回归模型 过原点回归 简单回归模型的定义 普通最小二乘法的推导 OLS的操作技巧 度量单位和函数形式 OLS估计量的期望值和方差
Chapter 2 簡單迴歸模型.
第2章 Z变换 Z变换的定义与收敛域 Z反变换 系统的稳定性和H(z) 系统函数.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
§3.3 多元线性回归模型的统计检验 一、拟合优度检验 二、方程的显著性检验(F检验) 三、变量的显著性检验(t检验) 四、参数的置信区间.
计量经济学 第三章 多元线性回归模型.
一元线性回归(二).
第二章 回归模型 法、参数的普通最小二乘估计式及相关性质、对模型的经济意 义检验和统计检验,能应用Eviews软件进行最小二乘估计与统
第一章.
一元线性回归模型 § 1 回归分析概述 § 2 一元线性回归模型的参数估计 § 3 一元线性回归模型的统计检验
Stochastic Relationships and Scatter Diagrams
簡單迴歸模型的基本假設 用最小平方法(OLS-ordinary least square)找到一個迴歸式:
第二章 一元线性回归模型.
第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
第2章 一元线性回归分析 §2.1 :回归分析及回归模型 §2.2 :一元线性模型的参数估计 §2.3 :参数估计值的性质及统计推断
多元回归分析:估计 y = b0 + b1x1 + b2x bkxk + u 计量经济学导论 刘愿.
第十章 方差分析.
第七章 参数估计 7.3 参数的区间估计.
若2002年我国国民生产总值为 亿元,如果 ,那么经过多少年国民生产总值 每年平均增长 是2002年时的2倍? 解:设经过 年国民生产总值为2002年时的2倍, 根据题意有 , 即.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
Liner regression analysis
数列.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
多元回归分析:异方差性 y = b0 + b1x1 + b2x bkxk + u 计量经济学导论 刘愿.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
第二章 经典线性回归模型: 双变量线性回归模型
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
3.1 变化率与导数   3.1.1 变化率问题 3.1.2 导数的概念.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
第三章 两变量线性回归.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
分数再认识三 真假带分数的练习课.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
导 言 经济学的基本问题 经济学的基本研究方法 需求和供给.
概率论与数理统计B.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
§2 方阵的特征值与特征向量.
第二节 简单线性回归模型的最小二乘估计 用样本去估计总体回归函数,总要使用特定的方法,而任何估 计参数的方法都需要有一定的前提条件——假定条件 一、简单线性回归的基本假定 为什么要作基本假定? ●只有具备一定的假定条件,所作出的估计才具有良好的统计性质。 ●模型中有随机扰动项,估计的参数是随机变量,显然参数估计值的分布与扰动项的分布有关,只有对随机扰动的分布作出假定,才能比较方便地确定所估计参数的分布性质,也才可能进行假设检验和区间估计等统计推断。
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
第三节 函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.
多元线性回归分析.
数学模型实验课(二) 最小二乘法与直线拟合.
簡單迴歸分析與相關分析 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2019/8/3.
一元一次方程的解法(-).
Presentation transcript:

y = b0 + b1x + u http://international.cengage.com ch2 简单二元回归 y = b0 + b1x + u http://international.cengage.com 1

综合练习一 三人一组,自己选择研究对象,完成选题、收集数据、建 立模型、估计模型和检验模型解释模型的全过程。(如果 出现违背G-M假设条件,修正之) 5月4日(前交电子稿)打印稿。 尽可能使用校图书馆、国家统计局数据库、统计年鉴、证 监会、中国人民银行等网站数据,以减少收集数据的工作 量。 列出数据表,以便于检查。

格式 标题 研究背景、目的及意义 (文献回顾) 样本、研究方法(模型的建立、变量的选择) 实证结果及分析‥(经济意义检验、统计、计量、 预测检验,修正模型--最终模型,解释分析结果) 结论 参考文献

归纳总结所学检验 格式 (6月22日交手写纸质稿) (1)名称 t-统计量 (2)作用 系数参数的显著性检验 (3)原理 格式 (6月22日交手写纸质稿) (1)名称 t-统计量 (2)作用 系数参数的显著性检验 (3)原理 (4)原假设、备择假设 (5)接受拒绝原假设的含义 对 有没有显著影响 (6)如何构造统计量 (7)统计量的分布 t分布 (8)如何下结论 拒绝原假设

归纳总结所学模型/估计 格式 (6月15日交手写纸质稿) (1)模型/估计的名称 (2)适用的数据 (3)假设条件 格式 (6月15日交手写纸质稿) (1)模型/估计的名称 (2)适用的数据 (3)假设条件 (4)估计方法/原理/步骤 (5)估计量及其统计性质

本章大纲 简单回归模型的定义 普通最小二乘法的推导 OLS的操作技巧 测量单位和函数形式 OLS估计量的期望值和方差 过原点回归 6

讲义大纲 一些术语的注解 一个简单假定 条件期望零值假定 何为普通最小二乘法 普通最小二乘法的推导 7

reference Jensen,M.C.(1968) The Performance of Mutual Funds in the Period 1945-1968, Journal of Economical 6,389-416 Clare, A.D. and Thomas, S.H.(1995) The Overreaction Hypothesis and the UK Stock Market , Journal of Business Finance and Accounting 22(7), 961-973

简单回归模型的定义 要写出用x解释y的模型 (1) x与y没有确切的关系,如何考虑其他影响y的因素? (2) x和y的函数关系怎样?

计量经济学模型 △ 模型:对现实的描述和模拟 △ 数学模型:用数学语言描述现实 △ 经济数学模型:用数学方法描述经济活动 △ 计量经济学模型:揭示经济活动中个因素之间的定量关系,用随机的数学方程加以描述 △ 经济理论分析(行为分析)→数理分析 →数量分析

★左边变量y通常被称为因变量,被解释变量,响应变量、 被预测变量或回归子。 术语注解 简单一元回归模型 y = b0 + b1x + u 只有一个非常数回归元,称之为简单回归模型, 两 变量回归模型或双变量回归模型. ★左边变量y通常被称为因变量,被解释变量,响应变量、 被预测变量或回归子。 ★右边变量x通常被称为自变量,解释变量,控制变量,预 测变量、回归元,或协变量。 11

术语注解 b0 , b1被称为回归系数(regression coefficient)。 b0 也被称为常数项或截矩项,或截矩参数(intercept parameter) 。 b1代表了回归元x的边际效果,也被 成为斜率参数。 y = b0 + b1x + u 12

术语注解 y = b0 + b1x + u u 为误差项(error)或扰动项(disturbance),它代表了除了x 之外可以影响y的因素。 13

随机误差项主要包括下列因素: 在解释变量中被忽略的因素的影响; 变量观测值的观测误差的影响; 残缺数据 模型关系的设定误差的影响; 其他随机因素的影响。 产生并设计随机误差项的主要原因: 理论的含糊性; 数据的欠缺; 节省原则。

术语注解 线性的含义: y 和x 之间并不一定存在线性关系, 但是,只要通过转换可以使y的转换形式和x的转 换形式存在相对于参数的线性关系,该模型即称 为线性模型。 15

上述简单工资函数描述了受教育年限和工资之间的 关系, b1 衡量了多接受一年教育工资可以增加多少. 简单二元回归模型例子 A simple wage equation wage= b0 + b1(years of education) + u b1 : if education increase by one year, how much more wage will one gain. 上述简单工资函数描述了受教育年限和工资之间的 关系, b1 衡量了多接受一年教育工资可以增加多少. 16

我们假定总体中误差项u的平均值为零. 该假定是 否具有很大的限制性呢? If for example, E(u)=5. Then y = (b0 +5)+ b1x + (u-5), therefore, E(u’)=E(u-5)=0. 上述推导说明我们总可以通过调整常数项来实现 误差项的均值为零, 因此该假定的限制性不大. 17

我们需要对u和 x之间的关系做一个关键假定。理 想状况是对x的了解并不增加对u的任何信息。换句 话说,我们需要u和 x完全不相关。 条件期望零值假定 我们需要对u和 x之间的关系做一个关键假定。理 想状况是对x的了解并不增加对u的任何信息。换句 话说,我们需要u和 x完全不相关。 18

条件期望零值假定 由于我们已经假定了E(u) = 0,因此有 E(u|x) = E(u) = 0 (2.6) 19

E(u|x) = E(u) = 0 (2.6) 该假定是何含义? 不相关 u的均值独立于x u和x完全独立 零条件均值假定

条件期望零值假定 在教育一例中,假定u 代表内在能力,条件期望零 值假定说明不管解释教育的年限如何,该能力的平 均值相同。 21

假设期末成绩分数取决于出勤次数和影响学生现场 发挥的因素,如学生个人素质。那么上述模型中假 设(2.6)何时能够成立? 条件期望零值假定 假设期末成绩分数取决于出勤次数和影响学生现场 发挥的因素,如学生个人素质。那么上述模型中假 设(2.6)何时能够成立? 22

Intermediate Econometrics Yan Shen 条件期望零值假定 (2.6)说明总体回归函数应满足E(y|x) = b0 + b1x。 该函数是x的线性函数,y的分布以它为中心。 Intermediate Econometrics Yan Shen 23

Intermediate Econometrics Yan Shen f(y) 给定x时y的 条件分布 . E(y|x) = b0 + b1x . x1=5 x2 =10 Intermediate Econometrics Yan Shen 24

总体回归函数 回归分析关心的是根据解释变量的已知或给定值,考察被解释变量的总体均值,即当解释变量取某个确定值时,与之统计相关的被解释变量所有可能出现的对应值的平均值。 如何理解?

为达到此目的,将该100户家庭划分为组内收入差不多的10组,以分析每一收入组的家庭消费支出。 例2.1 例2.1:一个假想的社区有100户家庭组成,要研究该社区每月家庭消费支出Y与每月家庭可支配收入X的关系。 即如果知道了家庭的月收入,能否预测该社区家庭的平均月消费支出水平。 为达到此目的,将该100户家庭划分为组内收入差不多的10组,以分析每一收入组的家庭消费支出。

由于不确定因素的影响,对同一收入水平X,不同家庭的消费支出不完全相同; 术语:给定X值Y的条件分布 由于不确定因素的影响,对同一收入水平X,不同家庭的消费支出不完全相同; 但由于调查的完备性,给定收入水平X的消费支出Y的分布是确定的,即以X的给定值为条件的Y的条件分布(Conditional distribution)是已知的,例如:P(Y=561|X=800)=1/4。

术语:总体回归线 因此,给定收入X的值Xi,可得消费支出Y的条件均值(conditional mean)或条件期望(conditional expectation):E(Y|X=Xi)。 该例中:E(Y | X=800)=602 描出散点图发现:随着收入的增加,消费 “平均地说”也在增加,且Y的条件均值均落 在一根正斜率的直线上。这条直线称为总体 回归线。

总体回归线 500 1000 1500 2000 2500 3000 3500 4000 每月可支配收入X(元) 每 月 消 费 支 出 Y (元)

称为(双变量)总体回归函数(population regression function, PRF)。总体回归函数是固定而又未知的。 术语:总体回归函数 在给定解释变量Xi条件下被解释变量Yi的期望轨迹称为总体回归线(population regression line),或更一般地称为总体回归曲线(population regression curve)。 相应的函数: 称为(双变量)总体回归函数(population regression function, PRF)。总体回归函数是固定而又未知的。

函数形式:可以是线性或非线性的。 叙述 含义:回归函数(PRF)说明被解释变量Y的平 均状态(总体条件期望)随解释变量X变化的 规律。 例2.1中,将居民消费支出看成是其可支配收入的线性函数时: 为一线性函数。其中,0,1是未知参数,称为回归系数(regression coefficients)。

yi = b0 + b1xi + ui。 普通最小二乘法的推导 回归的基本思想是从样本去估计总体参数。 我们用 {(xi,yi): i=1, …,n} 来表示一个随机样本,并假定每 一观测值满足 yi = b0 + b1xi + ui。 。 33

Intermediate Econometrics Yan Shen 总体回归线,样本观察点和相应误差 y E(y|x) = b0 + b1x . y4 u4 { . y3 u3 } . y2 u2 { u1 . y1 } x1 x2 x3 x4 x Intermediate Econometrics Yan Shen 34

普通最小二乘法的推导 为推导OLS估计量,假设E(u|x) = E(u) = 0 ,则 Cov(x,u) = E(xu) = 0 Why? 根据概率论基础知识, Cov(X,Y) = E(XY) – E(X)E(Y) 由E(u|x) =0 E(u) = Ex [E(u|x)]=0 (2.10) 可得 Cov(x,u) = Cov[x, E(u|x)]=0。 (2.11) 35

普通最小二乘法的推导 由于 u = y – b0 – b1x,根据x, y, 和 b1 ,可写出2个限制条件, E[x(y – b0 – b1x)] = 0 E(y – b0 – b1x) = 0 称之为矩条件。 可将u = y – b0 – b1x代入(2.10)(2.11)式,以得上述两个矩 条件。 36

使用矩方法推导普通最小二乘法 矩方法是将总体的矩限制应用于样本中。 37

三、参数的矩法 K阶矩: K阶样本矩: K阶中心矩: K阶样本中心矩:

矩方法 假设: 样本矩条件:

普通最小二乘法的推导 目标是通过选择参数值,使得在样本中矩条件也可以成立。 选择估计值 ,求解(2.10)(2.11)的样本对应值: 40

普通最小二乘法的推导 根据样本均值的定义以及加总的性质,可将第一个条件写为 41

普通最小二乘法的推导 42

因此OLS估计出的斜率为 等于总体的协 方差除以 的方 差 等于 的样本协方差除以 的样本方差 43

OLS估计量

简单一元回归 定义 在 时的拟合值(fitted value)为 这是给定截距、斜率下, 时的预测值。也称为样本回归函 数(sample regression function SRF),是总体回归函数的一个 样本估计 第i次观测的残差(residual)是 的观测值与拟合值之差: 简单一元回归可写成:

斜率估计量等于样本中x 和 y 的协方差除以x的方差。 若x 和 y 正相关则斜率为正,反之为负。 OLS斜率估计法总结 斜率估计量等于样本中x 和 y 的协方差除以x的方差。 若x 和 y 正相关则斜率为正,反之为负。 46

OLS法是要找到一条直线,使残差平方和最小。 残差是对误差项的估计,因此,它是拟合直线(样 本回归函数)和样本点之间的距离。 47

. . . . { } 样本回归线,样本数据点和相关的误差估计项 y y4 û4 y3 } û3 y2 û2 { û1 y1 x1 x2 48

推导方法二 正式解一个最小化问题,即通过选取参数而使下列值最小: 问题:为什么不是最小化残差的其它某个函数? (1)求解过程 (2)统计性质 49

推导方法二 如果直接解上述方程我们得到下面两式,这两个式子等 于前面两式乘以n 50

推导方法三 最大似然估计

介绍通过随机样本的数据运用普通最小二乘法估计 斜率和截距的参数值 讲义总结 介绍简单线性回归模型 介绍通过随机样本的数据运用普通最小二乘法估计 斜率和截距的参数值 52

简单一元回归(2) y = b0 + b1x + u 53

本章大纲 简单回归模型的定义 推导普通最小二乘法的估计量 OLS的操作技巧 测量单位和回归方程形式 OLS估计量的期望值和方差 过原点的回归 54

讲义大纲 OLS的代数特性 拟合优度 使用gretl做OLS 回归 改变测量单位对OLS统计量的效果 55

OLS的操作技巧 例:CEO的薪水和资本权益报酬率 56

例:CEO的薪水和资本权益报酬率 变量salary衡量了已1000美元为单位的年薪,其最 小值,均值和最大值分别如上。 Roe=净收入/所有者权益,为三年平均值。 Data:CEOSAL1.RAW 57

例 CAPM Data:wind

例:CEO的薪水和资本权益报酬率 对估计量的解释: 常数项的估计值衡量了当roe为零时CEO的薪水。 b1 的估计值反应了ROE若增加一个百分点工资将增加18500美元。 59

OLS的代数性质 OLS 残差和为零 (p24) 因此 OLS 的样本残差平均值也为零. 60

OLS的代数性质 回归元(解释变量)和OLS残差之间的样本协方差为零 (p25) 61

OLS的代数性质 OLS回归线总是通过样本的均值。 每个拟合值 都在OLS回归线上。 62

OLS的代数性质 我们可把每一次观测看作由被解释部分和未解释部分构成. 预测值和残差在样本中是不相关的 63

OLS的代数性质 64

定义总平方和(total sum of squares SST)为 更多术语 定义总平方和(total sum of squares SST)为 总平方和是对y在样本中所有变动的度量,即它度 量了y在样本中的分散程度 将总平方和除以n-1,我们得到y的样本方差。 65

更多术语 解释平方和(explained sum of squares SSE)定义为 它度量了y的预测值的在样本中的变异 回归平方和、模型平方和 66

更多术语 残差平方和(residual sum of squares)定义为 残差平方和度量了残差的样本变异 67

SST、SSR and SSE y 的总变动可以表示为已解释的变动SSE和 未解释的变动SSR之和,即 SST=SSE+SSR 68

证明 SST = SSE + SSR 69

证明 SST = SSE + SSR 该证明中我们使用了一个事实, 即样本中因变量的拟合值和 残差不相关. 70

我们如何衡量样本回归线是否很好地拟合了样本 数据呢? 可以计算模型解释的总平方和的比例,并把它定 义为回归的R-平方 拟合优度 我们如何衡量样本回归线是否很好地拟合了样本 数据呢? 可以计算模型解释的总平方和的比例,并把它定 义为回归的R-平方 R2 = SSE/SST = 1 – SSR/SST 71

它因此可被看作是y的样本变动中被可以被x解释的 部分 R-平方的值总是在0和1之间 拟合优度 R-平方是已解释的变动占所有变动的比例 它因此可被看作是y的样本变动中被可以被x解释的 部分 R-平方的值总是在0和1之间 72

拟合优度

拟合优度

在社会科学中,特别是在截面数据分析中, 回归方 程得到低的R-平方值并不罕见。 值得强调的是表面上低的R-平方值不一定说明 拟合优度 在社会科学中,特别是在截面数据分析中, 回归方 程得到低的R-平方值并不罕见。 值得强调的是表面上低的R-平方值不一定说明  OLS回归方程是没有价值的 75

拟合优度 Example 2.8 CEO薪水和净资产回报 Example 2.9 竞选结果和选举活动开支 76

我们已经推导出公式计算参数的OLS估计值,所幸 的是我们不必亲手去计算它们。 用 gretl进行OLS回归 我们已经推导出公式计算参数的OLS估计值,所幸 的是我们不必亲手去计算它们。 在gretl中进行回归非常简单,要让y对x进行回归, 只需要输入 77

假定薪水的单位是美元,而不是千美元, salarys. 在Salarys对roe进行回归时OLS截距和斜率的估 计值是多少? 测量单位 假定薪水的单位是美元,而不是千美元, salarys. 在Salarys对roe进行回归时OLS截距和斜率的估 计值是多少? 78

测量单位 一般而言,当因变量乘上常数c,而自变量不改变时,OLS 的截距和斜率估计量也要乘上c。 79

测量单位 如果定义 roedec = roe/100,那么样本回归线将会从 (estimated salary)=963.191 + 18.501roe to 改变到 一 般而言,如果自变量除以或乘上某个非零常数,c,那 么OLS斜率将乘以或除以c,而截距则不改变。 80

在简单回归中加入非线性 线性关系并不适合所有的经济学运用 然而,通过对因变量和自变量进行恰当的定义, 我 们可以在简单回归分析中非常容易地处理许多y和x 之间的非线性关系. 81

自然对数 82

在工资-教育的例子中,假定每增加一年的教育, 工资的百分比增长都是相同的 能够给出不变的百分比效果的模型是 If , we have Data: wage1.raw 83

Example 2.10 将对数工资方程 和该方程相比 84

自然对数的另一个重要用途是用于获得弹性为常 数的模型 在CEO的薪水和企业销售额的例子中,常数弹性 模型是 85

Intermediate Econometrics Yan Shen 变量的原始形式和其自然对数的不同组合 Intermediate Econometrics Yan Shen 86

简单二元回归 (3) y = b0 + b1x + u 87

本章大纲 二元回归模型的定义 推导普通最小二乘法的估计量 OLS的操作技巧 测量单位和函数形式 OLS估计量的期望值和方差 过原点回归 88

最小二乘估计量的性质 当模型参数估计出后,需考虑参数估计值的 精度,即是否能代表总体参数的真值,或者说需 考察参数估计量的统计性质。 一个用于考察总体的估计量,可从如下几个方面考察其优劣性: (1)线性性,即它是否是另一随机变量的线性函数;

(2)无偏性,即它的均值或期望值是否等于总 体的真实值; (3)有效性,即它是否在所有线性无偏估计量 中具有最小方差。 这三个准则也称作估计量的小样本性质。 拥有这类性质的估计量称为最佳线性无偏估计量(best liner unbiased estimator, BLUE)。

(4)渐近无偏性,即样本容量趋于无穷大时,是否它的均值序列趋于总体真值; 当不满足小样本性质时,需进一步考察估计量的大样本或渐近性质: (4)渐近无偏性,即样本容量趋于无穷大时,是否它的均值序列趋于总体真值; (5)一致性,即样本容量趋于无穷大时,它是否依概率收敛于总体的真值; (6)渐近有效性,即样本容量趋于无穷大时,是否它在所有的一致估计量中具有最小的渐近方差。

高斯—马尔可夫定理(Gauss-Markov theorem) 在给定经典线性回归的假定下,最小二乘估计量是具有最小方差的线性无偏估计量。

OLS估计量的期望值和方差 从总体中抽取的不同的随机样本可得到不同的OLS估计量, 我们将研究这些OLS估计量的分布。 93

其中 b0 和 b1 分别是总体的截距参数和斜率参数 假定SLR.1 (关于参数是线性的) 在总体模型中,因变量 y 和自变量 x 和残差 u 的关系可写作 y = b0 + b1x + u , 其中 b0 和 b1 分别是总体的截距参数和斜率参数 94

假定SLR.2 (随机抽样): 假定我们从总体模型随机抽取容量为n的样本, {(xi, yi): i=1, 2, …, n}, 那么可以写出样本模型为 yi = b0 + b1xi + ui 95

假定 SLR.3 和 SLR.4 SLR.3, 零条件期望: 假定 E(u|x) = 0 . 那么在随机样本中我们有 E(ui|xi) = 0 SLR.4 (自变量中的样本变异): 在样本中,自变量 x 并不等 于一个不变常数。 96

使用假定SLR.1到SLR.4,我们可以得到无论b0,和 b1 取什么值,它们的OLS估计量的期望值等于它 们各自的真值。 证明: 97

无偏性总结 b1 和 b0 的OLS估计量是无偏的 无偏性的证明依赖于我们的四个假定--如果任何假定不 成立,OLS未必是无偏的 记住无偏性是对估计量的描述--对于一个给定的样本我 们可能靠近也可能远离真实的参数值 99

Intermediate Econometrics Yan Shen Example 2.12 例2.12 学生的数学表现和学校的午餐项目 该例研究了是否参加学校的免费午餐项目是否能够提高学生 在数学考试中的成绩。我们用Math10来表示10年级学生的 数学成绩,用Lnchprg表示可以参加学校的免费午餐项目的 学生的比例。 Data: MEAP93.RAW Intermediate Econometrics Yan Shen 100

学生的数学成绩和学校的免费午餐项目 估计所得方程说明参加免费午餐的学生的比例越多,他们的 成绩越差。可信吗? 101

学生的数学成绩和学校的免费午餐项目 产生上述结果的一个可能是u 和 x是相关的。比如, u包 括了贫困率,它影响学生的学习表现,又和是否有资格 参加免费午餐项目高度相关。 102

了解这一点(分布的分散程度),将对我们如何能 够在所有的估计量中,或至少在无偏估计量这 一类估计量中选出最优的一个具有一定的指导 意义。 OLS估计量的抽样方差 现在我们知道估计量的随机抽样分布以真值为 中心 想知道的是这个分布散开的程度 了解这一点(分布的分散程度),将对我们如何能 够在所有的估计量中,或至少在无偏估计量这 一类估计量中选出最优的一个具有一定的指导 意义。 103

OLS估计量的抽样方差 在一个附加假定下计算这个方差会容易的多,因此 有 假定 SLR.5 (同方差性): Var(u|x) = s2 (Homoskedasticity) 高斯—马尔可夫(Gauss-Markov)假设:SLR1-5 104

同方差的情形 y f(y|x) . E(y|x) = b0 + b1x . x1 x2 105

异方差的情形 f(y|x) y . . E(y|x) = b0 + b1x . x1 x2 x3 x 106

y的条件期望线性于x,但给定x时y 的方差却是常数。 OLS的抽样方差(继续) Var(u|x) = E(u2|x)-[E(u|x)]2 E(u|x) = 0, so s2 = E(u2|x) = E(u2) = Var(u) Var(u)=Ex(E(u2|x)])+Varx[(E(u|x)] 因此 s2 也是无条件方差,被称作误差方差 s, 误差方差的平方根被称作是标准误差 Can say: E(y|x)=b0 + b1x and Var(y|x) = s2 y的条件期望线性于x,但给定x时y 的方差却是常数。 107

工资方程中的异方差性 当Var(u|x)值和x 相关是,我们称误差项存在异方差。 举例来说,如果我们假设工资一式满足同方差,那 么就意味着不管educ值为何水平,工资的分布相对 于教育水平而言都是相同的。 如果接受高等教育的人面临的机会更多,收入的差 异可能更大,在这一情形中,上述假定未必成立。 108

OLS的方差(继续) 109

OLS的方差(继续) 110

定理 2.2 ( OLS 估计量的抽样方差 ) 在假定 SLR.1 到 SLR.5 下,我们有(2.57): and 111

OLS估计量样本方差的总结 误差方差 s2 越大,斜率估计量的方差也越大 xi 的变动越大,斜率估计量的方差越小.因此我们应该选择 尽可能的分散开的xi 大的样本容量能够减小样本斜率估计量的方差。 112

OLS估计量样本方差的总结 在实验数据中这一点(增大xi的变动)有时是可能的,但在社 会科学中我们很少可以人为地增加xi的变动。 113

估计误差方差 我们不知道误差方差 s2 是多少,因为我们不能观 察到误差 ui 我们观测到的是残差 ûi 我们可以用残差构成误差方差的估计 114

估计误差方差 首先,我们注意到 s2=E(u2), 所以s2的无偏估 计量是 ui 是不可观测的,但我们找到一个ui的无偏 估计量 估计量是有偏的。 115

误差方差估计量(继续) 116

Intermediate Econometrics Yan Shen 误差方差估计量(继续) Intermediate Econometrics Yan Shen 117

Intermediate Econometrics Yan Shen 总结 OLS的无偏性 OLS的抽样方差 标准方差和标准误差的定义 估计误差方差 Intermediate Econometrics Yan Shen 118

(2)证明最小方差性 其中,ci=ki+di,di为不全为零的常数 则容易证明 普通最小二乘估计量(ordinary least Squares Estimators)称为最佳线性无偏估计量(best linear unbiased estimator, BLUE)

由于最小二乘估计量拥有一个“好”的估计量所应具备的小样本特性,它自然也拥有大样本特性。

简单一元回归(4) 过原点回归

过原点回归 (2.66)

样题,2.8 125

126

127

128

129