Y = b0 + b1x + u http://international.cengage.com ch2 简单二元回归 y = b0 + b1x + u http://international.cengage.com 1.

Slides:

Advertisements

Similar presentations

第五节函数的微分一、微分的定义二、微分的几何意义三、基本初等函数的微分公式与微分运算法则四、微分形式不变性五、微分在近似计算中的应用六、小结.

Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.

2.6 隐函数微分法第二章第二章二、高阶导数一、隐式定义的函数三、可微函数的有理幂. 一、隐函数的导数若由方程可确定 y 是 x 的函数, 由表示的函数, 称为显函数. 例如, 可确定显函数可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此隐函数求导方法.

§3.4 空间直线的方程.

3.4 空间直线的方程.

非线性时间序列模型一般非线性时间序列模型介绍条件异方差模型上海财经大学统计与管理学院.

第六章回归分析.

第十章相关与回归分析 PowerPoint 统计学.

圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.

第五章二次型. 第五章二次型知识点1---二次型及其矩阵表示二次型的基本概念 1. 线性变换与合同矩阵 2.

一、能线性化的多元非线性回归二、多元多项式回归（线性化）

第三章函数逼近 — 最佳平方逼近.

Introductory Econometrics for Finance 回归分析的基本概念

《高等数学》（理学）常数项级数的概念袁安锋

第一章行列式第五节 Cramer定理设含有n 个未知量的n个方程构成的线性方程组为 (Ⅰ) 由未知数的系数组成的n阶行列式

第二章经典单方程计量经济学模型：一元线性回归模型

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

2-7、函数的微分教学要求教学要点.

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

计量经济学第三章多元线性回归模型.

简单回归模型过原点回归简单回归模型的定义普通最小二乘法的推导 OLS的操作技巧度量单位和函数形式 OLS估计量的期望值和方差

Chapter 2 簡單迴歸模型.

第2章 Z变换 Z变换的定义与收敛域 Z反变换系统的稳定性和H(z) 系统函数.

第三章多维随机变量及其分布 §2 边缘分布边缘分布函数边缘分布律边缘概率密度.

§3.3 多元线性回归模型的统计检验一、拟合优度检验二、方程的显著性检验(F检验) 三、变量的显著性检验（t检验）四、参数的置信区间.

计量经济学第三章多元线性回归模型.

一元线性回归（二）.

第二章回归模型法、参数的普通最小二乘估计式及相关性质、对模型的经济意义检验和统计检验，能应用Eviews软件进行最小二乘估计与统

一元线性回归模型 § 1 回归分析概述 § 2 一元线性回归模型的参数估计 § 3 一元线性回归模型的统计检验

Stochastic Relationships and Scatter Diagrams

簡單迴歸模型的基本假設用最小平方法(OLS-ordinary least square)找到一個迴歸式：

第二章一元线性回归模型.

第2章一元线性回归 2 .1 一元线性回归模型 2 .2 参数的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验

第2章一元线性回归分析 §2.1 ：回归分析及回归模型 §2.2 ：一元线性模型的参数估计 §2.3 ：参数估计值的性质及统计推断

多元回归分析：估计 y = b0 + b1x1 + b2x bkxk + u 计量经济学导论刘愿.

第十章方差分析.

第七章参数估计 7.3 参数的区间估计.

若2002年我国国民生产总值为亿元，如果，那么经过多少年国民生产总值每年平均增长是2002年时的2倍？解：设经过年国民生产总值为2002年时的2倍, 根据题意有，即.

习题一、概率论 1.已知随机事件A，B，C满足在下列三种情况下，计算（1）A，B，C相互独立（2）A，B独立，A，C互不相容

Liner regression analysis

抽样和抽样分布基本计算 Sampling & Sampling distribution

多元回归分析：异方差性 y = b0 + b1x1 + b2x bkxk + u 计量经济学导论刘愿.

概率统计主讲教师叶宏山东大学数学院.

5.2 常用统计分布一、常见分布二、概率分布的分位数三、小结.

成绩是怎么算出来的？ 16级第一学期半期考试成绩班级姓名语文数学英语政治历史地理物理化学生物总分 1 张三1 115

正切函数的图象和性质周期函数定义：一般地，对于函数 (x),如果存在一个非零常数T，使得当x取定义域内的每一个值时，都有

第二章经典线性回归模型：双变量线性回归模型

§6.7 子空间的直和一、直和的定义二、直和的判定三、多个子空间的直和.

3．1　变化率与导数 3．1.1　变化率问题 3．1.2　导数的概念.

相关与回归非确定关系在宏观上存在关系，但并未精确到可以用函数关系来表达。青少年身高与年龄，体重与体表面积非确定关系：

第三章　函数的微分学第二节　导数的四则运算法则一、导数的四则运算二、偏导数的求法.

第三章两变量线性回归.

第一部分：概率产生随机样本：对分布采样均匀分布其他分布伪随机数很多统计软件包中都有此工具如在Matlab中：rand

分数再认识三真假带分数的练习课.

第15讲特征值与特征向量的性质主要内容：特征值与特征向量的性质.

§5.2 抽样分布　　确定统计量的分布——抽样分布，是数理统计的基本问题之一．采用求随机向量的函数的分布的方法可得到抽样分布．由于样本容量一般不止2或 3(甚至还可能是随机的)，故计算往往很复杂，有时还需要特殊技巧或特殊工具．　　由于正态总体是最常见的总体，故本节介绍的几个抽样分布均对正态总体而言．

导言经济学的基本问题经济学的基本研究方法需求和供给.

概率论与数理统计B.

第二节函数的极限一、函数极限的定义二、函数极限的性质三、小结思考题.

正弦、余弦函数的性质华容一中伍立华 2017年2月24日.

§2 方阵的特征值与特征向量.

第二节简单线性回归模型的最小二乘估计用样本去估计总体回归函数，总要使用特定的方法，而任何估计参数的方法都需要有一定的前提条件——假定条件一、简单线性回归的基本假定为什么要作基本假定？ ●只有具备一定的假定条件，所作出的估计才具有良好的统计性质。 ●模型中有随机扰动项，估计的参数是随机变量，显然参数估计值的分布与扰动项的分布有关，只有对随机扰动的分布作出假定，才能比较方便地确定所估计参数的分布性质，也才可能进行假设检验和区间估计等统计推断。

第三节随机区组设计的方差分析随机区组设计资料的总平方和可以分解为三项：（10.10）.

第三节函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.

多元线性回归分析.

数学模型实验课（二）最小二乘法与直线拟合.

簡單迴歸分析與相關分析莊文忠副教授世新大學行政管理學系計量分析一(莊文忠副教授) 2019/8/3.

一元一次方程的解法(－).

Presentation transcript:

y = b0 + b1x + u http://international.cengage.com ch2 简单二元回归 y = b0 + b1x + u http://international.cengage.com 1

综合练习一三人一组，自己选择研究对象，完成选题、收集数据、建立模型、估计模型和检验模型解释模型的全过程。（如果出现违背G-M假设条件，修正之） 5月4日（前交电子稿）打印稿。尽可能使用校图书馆、国家统计局数据库、统计年鉴、证监会、中国人民银行等网站数据，以减少收集数据的工作量。列出数据表，以便于检查。

格式标题研究背景、目的及意义（文献回顾）样本、研究方法（模型的建立、变量的选择）实证结果及分析‥（经济意义检验、统计、计量、预测检验，修正模型--最终模型，解释分析结果）结论参考文献

归纳总结所学检验格式（6月22日交手写纸质稿）（1）名称 t-统计量（2）作用系数参数的显著性检验（3）原理格式（6月22日交手写纸质稿）（1）名称 t-统计量（2）作用系数参数的显著性检验（3）原理（4）原假设、备择假设（5）接受拒绝原假设的含义对有没有显著影响（6）如何构造统计量（7）统计量的分布 t分布（8）如何下结论拒绝原假设

归纳总结所学模型/估计格式（6月15日交手写纸质稿）（1）模型/估计的名称（2）适用的数据（3）假设条件格式（6月15日交手写纸质稿）（1）模型/估计的名称（2）适用的数据（3）假设条件（4）估计方法/原理/步骤（5）估计量及其统计性质

本章大纲简单回归模型的定义普通最小二乘法的推导 OLS的操作技巧测量单位和函数形式 OLS估计量的期望值和方差过原点回归 6

讲义大纲一些术语的注解一个简单假定条件期望零值假定何为普通最小二乘法普通最小二乘法的推导 7

reference Jensen,M.C.(1968) The Performance of Mutual Funds in the Period 1945-1968, Journal of Economical 6,389-416 Clare, A.D. and Thomas, S.H.（1995） The Overreaction Hypothesis and the UK Stock Market , Journal of Business Finance and Accounting 22(7), 961-973

简单回归模型的定义要写出用x解释y的模型（1） x与y没有确切的关系，如何考虑其他影响y的因素？（2） x和y的函数关系怎样？

计量经济学模型 △ 模型:对现实的描述和模拟 △ 数学模型：用数学语言描述现实 △ 经济数学模型：用数学方法描述经济活动 △ 计量经济学模型：揭示经济活动中个因素之间的定量关系，用随机的数学方程加以描述 △ 经济理论分析（行为分析）→数理分析 →数量分析

★左边变量y通常被称为因变量，被解释变量，响应变量、被预测变量或回归子。术语注解简单一元回归模型 y = b0 + b1x + u 只有一个非常数回归元，称之为简单回归模型，两变量回归模型或双变量回归模型. ★左边变量y通常被称为因变量，被解释变量，响应变量、被预测变量或回归子。 ★右边变量x通常被称为自变量，解释变量，控制变量，预测变量、回归元，或协变量。 11

术语注解 b0 , b1被称为回归系数(regression coefficient)。 b0 也被称为常数项或截矩项，或截矩参数(intercept parameter) 。 b1代表了回归元x的边际效果，也被成为斜率参数。 y = b0 + b1x + u 12

术语注解 y = b0 + b1x + u u 为误差项(error)或扰动项(disturbance)，它代表了除了x 之外可以影响y的因素。 13

随机误差项主要包括下列因素：在解释变量中被忽略的因素的影响；变量观测值的观测误差的影响；残缺数据模型关系的设定误差的影响；其他随机因素的影响。产生并设计随机误差项的主要原因：理论的含糊性；数据的欠缺；节省原则。

术语注解线性的含义： y 和x 之间并不一定存在线性关系，但是，只要通过转换可以使y的转换形式和x的转换形式存在相对于参数的线性关系，该模型即称为线性模型。 15

上述简单工资函数描述了受教育年限和工资之间的关系, b1 衡量了多接受一年教育工资可以增加多少. 简单二元回归模型例子 A simple wage equation wage= b0 + b1(years of education) + u b1 : if education increase by one year, how much more wage will one gain. 上述简单工资函数描述了受教育年限和工资之间的关系, b1 衡量了多接受一年教育工资可以增加多少. 16

我们假定总体中误差项u的平均值为零. 该假定是否具有很大的限制性呢? If for example, E(u)=5. Then y = (b0 +5)+ b1x + (u-5), therefore, E(u’)=E(u-5)=0. 上述推导说明我们总可以通过调整常数项来实现误差项的均值为零, 因此该假定的限制性不大. 17

我们需要对u和 x之间的关系做一个关键假定。理想状况是对x的了解并不增加对u的任何信息。换句话说，我们需要u和 x完全不相关。条件期望零值假定我们需要对u和 x之间的关系做一个关键假定。理想状况是对x的了解并不增加对u的任何信息。换句话说，我们需要u和 x完全不相关。 18

条件期望零值假定由于我们已经假定了E(u) = 0，因此有 E(u|x) = E(u) = 0 （2.6） 19

E(u|x) = E(u) = 0 （2.6）该假定是何含义？不相关 u的均值独立于x u和x完全独立零条件均值假定

条件期望零值假定在教育一例中，假定u 代表内在能力，条件期望零值假定说明不管解释教育的年限如何，该能力的平均值相同。 21

假设期末成绩分数取决于出勤次数和影响学生现场发挥的因素，如学生个人素质。那么上述模型中假设（2.6）何时能够成立？条件期望零值假定假设期末成绩分数取决于出勤次数和影响学生现场发挥的因素，如学生个人素质。那么上述模型中假设（2.6）何时能够成立？ 22

Intermediate Econometrics Yan Shen 条件期望零值假定 (2.6)说明总体回归函数应满足E(y|x) = b0 + b1x。该函数是x的线性函数，y的分布以它为中心。 Intermediate Econometrics Yan Shen 23

Intermediate Econometrics Yan Shen f(y) 给定x时y的条件分布 . E(y|x) = b0 + b1x . x1=5 x2 =10 Intermediate Econometrics Yan Shen 24

总体回归函数回归分析关心的是根据解释变量的已知或给定值，考察被解释变量的总体均值，即当解释变量取某个确定值时，与之统计相关的被解释变量所有可能出现的对应值的平均值。如何理解？

为达到此目的，将该100户家庭划分为组内收入差不多的10组，以分析每一收入组的家庭消费支出。例2.1 例2.1：一个假想的社区有100户家庭组成，要研究该社区每月家庭消费支出Y与每月家庭可支配收入X的关系。即如果知道了家庭的月收入，能否预测该社区家庭的平均月消费支出水平。为达到此目的，将该100户家庭划分为组内收入差不多的10组，以分析每一收入组的家庭消费支出。

由于不确定因素的影响，对同一收入水平X，不同家庭的消费支出不完全相同；术语：给定X值Y的条件分布由于不确定因素的影响，对同一收入水平X，不同家庭的消费支出不完全相同；但由于调查的完备性，给定收入水平X的消费支出Y的分布是确定的，即以X的给定值为条件的Y的条件分布（Conditional distribution）是已知的，例如：P(Y=561|X=800）=1/4。

术语：总体回归线因此，给定收入X的值Xi，可得消费支出Y的条件均值（conditional mean）或条件期望（conditional expectation）：E(Y|X=Xi)。该例中：E(Y | X=800)=602 描出散点图发现：随着收入的增加，消费 “平均地说”也在增加，且Y的条件均值均落在一根正斜率的直线上。这条直线称为总体回归线。

总体回归线 500 1000 1500 2000 2500 3000 3500 4000 每月可支配收入X（元）每月消费支出 Y （元）

称为（双变量）总体回归函数（population regression function, PRF）。总体回归函数是固定而又未知的。术语：总体回归函数在给定解释变量Xi条件下被解释变量Yi的期望轨迹称为总体回归线（population regression line），或更一般地称为总体回归曲线（population regression curve）。相应的函数：称为（双变量）总体回归函数（population regression function, PRF）。总体回归函数是固定而又未知的。

函数形式：可以是线性或非线性的。叙述含义：回归函数（PRF）说明被解释变量Y的平均状态（总体条件期望）随解释变量X变化的规律。例2.1中，将居民消费支出看成是其可支配收入的线性函数时: 为一线性函数。其中，0，1是未知参数，称为回归系数（regression coefficients）。

yi = b0 + b1xi + ui。普通最小二乘法的推导回归的基本思想是从样本去估计总体参数。我们用 {(xi,yi): i=1, …,n} 来表示一个随机样本，并假定每一观测值满足 yi = b0 + b1xi + ui。。 33

Intermediate Econometrics Yan Shen 总体回归线，样本观察点和相应误差 y E(y|x) = b0 + b1x . y4 u4 { . y3 u3 } . y2 u2 { u1 . y1 } x1 x2 x3 x4 x Intermediate Econometrics Yan Shen 34

普通最小二乘法的推导为推导OLS估计量，假设E(u|x) = E(u) = 0 ，则 Cov(x,u) = E(xu) = 0 Why? 根据概率论基础知识， Cov(X,Y) = E(XY) – E(X)E(Y) 由E(u|x) =0 E(u) = Ex [E(u|x)]=0 （2.10）可得 Cov(x,u) = Cov[x, E(u|x)]=0。（2.11） 35

普通最小二乘法的推导由于 u = y – b0 – b1x，根据x, y, 和 b1 ,可写出2个限制条件， E[x(y – b0 – b1x)] = 0 E(y – b0 – b1x) = 0 称之为矩条件。可将u = y – b0 – b1x代入（2.10）（2.11）式，以得上述两个矩条件。 36

使用矩方法推导普通最小二乘法矩方法是将总体的矩限制应用于样本中。 37

三、参数的矩法 K阶矩： K阶样本矩： K阶中心矩： K阶样本中心矩：

矩方法假设：样本矩条件：

普通最小二乘法的推导目标是通过选择参数值，使得在样本中矩条件也可以成立。选择估计值，求解（2.10）（2.11）的样本对应值: 40

普通最小二乘法的推导根据样本均值的定义以及加总的性质，可将第一个条件写为 41

普通最小二乘法的推导 42

因此OLS估计出的斜率为等于总体的协方差除以的方差等于的样本协方差除以的样本方差 43

OLS估计量

简单一元回归定义在时的拟合值（fitted value）为这是给定截距、斜率下，时的预测值。也称为样本回归函数（sample regression function SRF），是总体回归函数的一个样本估计第i次观测的残差（residual）是的观测值与拟合值之差：简单一元回归可写成：

斜率估计量等于样本中x 和 y 的协方差除以x的方差。若x 和 y 正相关则斜率为正，反之为负。 OLS斜率估计法总结斜率估计量等于样本中x 和 y 的协方差除以x的方差。若x 和 y 正相关则斜率为正，反之为负。 46

OLS法是要找到一条直线，使残差平方和最小。残差是对误差项的估计，因此，它是拟合直线（样本回归函数）和样本点之间的距离。 47

. . . . { } 样本回归线，样本数据点和相关的误差估计项 y y4 û4 y3 } û3 y2 û2 { û1 y1 x1 x2 48

推导方法二正式解一个最小化问题，即通过选取参数而使下列值最小：问题：为什么不是最小化残差的其它某个函数？（1）求解过程（2）统计性质 49

推导方法二如果直接解上述方程我们得到下面两式，这两个式子等于前面两式乘以n 50

推导方法三最大似然估计

介绍通过随机样本的数据运用普通最小二乘法估计斜率和截距的参数值讲义总结介绍简单线性回归模型介绍通过随机样本的数据运用普通最小二乘法估计斜率和截距的参数值 52

简单一元回归（2） y = b0 + b1x + u 53

本章大纲简单回归模型的定义推导普通最小二乘法的估计量 OLS的操作技巧测量单位和回归方程形式 OLS估计量的期望值和方差过原点的回归 54

讲义大纲 OLS的代数特性拟合优度使用gretl做OLS 回归改变测量单位对OLS统计量的效果 55

OLS的操作技巧例：CEO的薪水和资本权益报酬率 56

例：CEO的薪水和资本权益报酬率变量salary衡量了已1000美元为单位的年薪，其最小值，均值和最大值分别如上。 Roe＝净收入/所有者权益，为三年平均值。 Data:CEOSAL1.RAW 57

例 CAPM Data：wind

例：CEO的薪水和资本权益报酬率对估计量的解释：常数项的估计值衡量了当roe为零时CEO的薪水。 b1 的估计值反应了ROE若增加一个百分点工资将增加18500美元。 59

OLS的代数性质 OLS 残差和为零（p24) 因此 OLS 的样本残差平均值也为零. 60

OLS的代数性质回归元（解释变量）和OLS残差之间的样本协方差为零 (p25) 61

OLS的代数性质 OLS回归线总是通过样本的均值。每个拟合值都在OLS回归线上。 62

OLS的代数性质我们可把每一次观测看作由被解释部分和未解释部分构成. 预测值和残差在样本中是不相关的 63

OLS的代数性质 64

定义总平方和（total sum of squares SST）为更多术语定义总平方和（total sum of squares SST）为总平方和是对y在样本中所有变动的度量，即它度量了y在样本中的分散程度将总平方和除以n-1,我们得到y的样本方差。 65

更多术语解释平方和（explained sum of squares SSE）定义为它度量了y的预测值的在样本中的变异回归平方和、模型平方和 66

更多术语残差平方和（residual sum of squares）定义为残差平方和度量了残差的样本变异 67

SST、SSR and SSE y 的总变动可以表示为已解释的变动SSE和未解释的变动SSR之和，即 SST=SSE+SSR 68

证明 SST = SSE + SSR 69

证明 SST = SSE + SSR 该证明中我们使用了一个事实, 即样本中因变量的拟合值和残差不相关. 70

我们如何衡量样本回归线是否很好地拟合了样本数据呢? 可以计算模型解释的总平方和的比例，并把它定义为回归的R-平方拟合优度我们如何衡量样本回归线是否很好地拟合了样本数据呢? 可以计算模型解释的总平方和的比例，并把它定义为回归的R-平方 R2 = SSE/SST = 1 – SSR/SST 71

它因此可被看作是y的样本变动中被可以被x解释的部分 R-平方的值总是在0和1之间拟合优度 R-平方是已解释的变动占所有变动的比例它因此可被看作是y的样本变动中被可以被x解释的部分 R-平方的值总是在0和1之间 72

拟合优度

拟合优度

在社会科学中，特别是在截面数据分析中, 回归方程得到低的R-平方值并不罕见。值得强调的是表面上低的R-平方值不一定说明拟合优度在社会科学中，特别是在截面数据分析中, 回归方程得到低的R-平方值并不罕见。值得强调的是表面上低的R-平方值不一定说明　OLS回归方程是没有价值的 75

拟合优度 Example 2.8 CEO薪水和净资产回报 Example 2.9 竞选结果和选举活动开支 76

我们已经推导出公式计算参数的OLS估计值，所幸的是我们不必亲手去计算它们。用 gretl进行OLS回归我们已经推导出公式计算参数的OLS估计值，所幸的是我们不必亲手去计算它们。在gretl中进行回归非常简单，要让y对x进行回归，只需要输入 77

假定薪水的单位是美元，而不是千美元， salarys. 在Salarys对roe进行回归时OLS截距和斜率的估计值是多少？测量单位假定薪水的单位是美元，而不是千美元， salarys. 在Salarys对roe进行回归时OLS截距和斜率的估计值是多少？ 78

测量单位一般而言，当因变量乘上常数c，而自变量不改变时，OLS 的截距和斜率估计量也要乘上c。 79

测量单位如果定义 roedec = roe/100，那么样本回归线将会从 (estimated salary)=963.191 + 18.501roe to 改变到一般而言，如果自变量除以或乘上某个非零常数，c，那么OLS斜率将乘以或除以c，而截距则不改变。 80

在简单回归中加入非线性线性关系并不适合所有的经济学运用然而，通过对因变量和自变量进行恰当的定义, 我们可以在简单回归分析中非常容易地处理许多y和x 之间的非线性关系. 81

自然对数 82

在工资-教育的例子中，假定每增加一年的教育，工资的百分比增长都是相同的能够给出不变的百分比效果的模型是 If , we have Data: wage1.raw 83

Example 2.10 将对数工资方程和该方程相比 84

自然对数的另一个重要用途是用于获得弹性为常数的模型在CEO的薪水和企业销售额的例子中，常数弹性模型是 85

Intermediate Econometrics Yan Shen 变量的原始形式和其自然对数的不同组合 Intermediate Econometrics Yan Shen 86

简单二元回归 (3) y = b0 + b1x + u 87

本章大纲二元回归模型的定义推导普通最小二乘法的估计量 OLS的操作技巧测量单位和函数形式 OLS估计量的期望值和方差过原点回归 88

最小二乘估计量的性质当模型参数估计出后，需考虑参数估计值的精度，即是否能代表总体参数的真值，或者说需考察参数估计量的统计性质。一个用于考察总体的估计量，可从如下几个方面考察其优劣性：（1）线性性，即它是否是另一随机变量的线性函数；

（2）无偏性，即它的均值或期望值是否等于总体的真实值；（3）有效性，即它是否在所有线性无偏估计量中具有最小方差。这三个准则也称作估计量的小样本性质。拥有这类性质的估计量称为最佳线性无偏估计量（best liner unbiased estimator, BLUE）。

（4）渐近无偏性，即样本容量趋于无穷大时，是否它的均值序列趋于总体真值；当不满足小样本性质时，需进一步考察估计量的大样本或渐近性质：（4）渐近无偏性，即样本容量趋于无穷大时，是否它的均值序列趋于总体真值；（5）一致性，即样本容量趋于无穷大时，它是否依概率收敛于总体的真值；（6）渐近有效性，即样本容量趋于无穷大时，是否它在所有的一致估计量中具有最小的渐近方差。

高斯—马尔可夫定理(Gauss-Markov theorem) 在给定经典线性回归的假定下，最小二乘估计量是具有最小方差的线性无偏估计量。

OLS估计量的期望值和方差从总体中抽取的不同的随机样本可得到不同的OLS估计量，我们将研究这些OLS估计量的分布。 93

其中 b0 和 b1 分别是总体的截距参数和斜率参数假定SLR.1 （关于参数是线性的）在总体模型中，因变量 y 和自变量 x 和残差 u 的关系可写作 y = b0 + b1x + u , 其中 b0 和 b1 分别是总体的截距参数和斜率参数 94

假定SLR.2 (随机抽样): 假定我们从总体模型随机抽取容量为n的样本, {(xi, yi): i=1, 2, …, n}, 那么可以写出样本模型为 yi = b0 + b1xi + ui 95

假定 SLR.3 和 SLR.4 SLR.3, 零条件期望：假定 E(u|x) = 0 . 那么在随机样本中我们有 E(ui|xi) = 0 SLR.4 (自变量中的样本变异): 在样本中，自变量 x 并不等于一个不变常数。 96

使用假定SLR.1到SLR.4，我们可以得到无论b0,和 b1 取什么值，它们的OLS估计量的期望值等于它们各自的真值。证明: 97

无偏性总结 b1 和 b0 的OLS估计量是无偏的无偏性的证明依赖于我们的四个假定--如果任何假定不成立，OLS未必是无偏的记住无偏性是对估计量的描述--对于一个给定的样本我们可能靠近也可能远离真实的参数值 99

Intermediate Econometrics Yan Shen Example 2.12 例2.12 学生的数学表现和学校的午餐项目该例研究了是否参加学校的免费午餐项目是否能够提高学生在数学考试中的成绩。我们用Math10来表示10年级学生的数学成绩，用Lnchprg表示可以参加学校的免费午餐项目的学生的比例。 Data: MEAP93.RAW Intermediate Econometrics Yan Shen 100

学生的数学成绩和学校的免费午餐项目估计所得方程说明参加免费午餐的学生的比例越多，他们的成绩越差。可信吗？ 101

学生的数学成绩和学校的免费午餐项目产生上述结果的一个可能是u 和 x是相关的。比如， u包括了贫困率，它影响学生的学习表现，又和是否有资格参加免费午餐项目高度相关。 102

了解这一点(分布的分散程度)，将对我们如何能够在所有的估计量中，或至少在无偏估计量这一类估计量中选出最优的一个具有一定的指导意义。 OLS估计量的抽样方差现在我们知道估计量的随机抽样分布以真值为中心想知道的是这个分布散开的程度了解这一点(分布的分散程度)，将对我们如何能够在所有的估计量中，或至少在无偏估计量这一类估计量中选出最优的一个具有一定的指导意义。 103

OLS估计量的抽样方差在一个附加假定下计算这个方差会容易的多，因此有假定 SLR.5 (同方差性): Var(u|x) = s2 (Homoskedasticity) 高斯—马尔可夫(Gauss-Markov）假设:SLR1-5 104

同方差的情形 y f(y|x) . E(y|x) = b0 + b1x . x1 x2 105

异方差的情形 f(y|x) y . . E(y|x) = b0 + b1x . x1 x2 x3 x 106

y的条件期望线性于x，但给定x时y 的方差却是常数。 OLS的抽样方差(继续) Var(u|x) = E(u2|x)-[E(u|x)]2 E(u|x) = 0, so s2 = E(u2|x) = E(u2) = Var(u) Var(u)=Ex(E(u2|x)])+Varx[(E(u|x)] 因此 s2 也是无条件方差，被称作误差方差 s, 误差方差的平方根被称作是标准误差 Can say: E(y|x)=b0 + b1x and Var(y|x) = s2 y的条件期望线性于x，但给定x时y 的方差却是常数。 107

工资方程中的异方差性当Var(u|x)值和x 相关是，我们称误差项存在异方差。举例来说，如果我们假设工资一式满足同方差，那么就意味着不管educ值为何水平，工资的分布相对于教育水平而言都是相同的。如果接受高等教育的人面临的机会更多，收入的差异可能更大，在这一情形中，上述假定未必成立。 108

OLS的方差(继续) 109

OLS的方差(继续) 110

定理 2.2 ( OLS 估计量的抽样方差 ) 在假定 SLR.1 到 SLR.5 下，我们有(2.57): and 111

OLS估计量样本方差的总结误差方差 s2 越大，斜率估计量的方差也越大 xi 的变动越大，斜率估计量的方差越小.因此我们应该选择尽可能的分散开的xi 大的样本容量能够减小样本斜率估计量的方差。 112

OLS估计量样本方差的总结在实验数据中这一点(增大xi的变动)有时是可能的，但在社会科学中我们很少可以人为地增加xi的变动。 113

估计误差方差我们不知道误差方差 s2 是多少，因为我们不能观察到误差 ui 我们观测到的是残差 ûi 我们可以用残差构成误差方差的估计 114

估计误差方差首先，我们注意到 s2=E(u2), 所以s2的无偏估计量是 ui 是不可观测的，但我们找到一个ui的无偏估计量估计量是有偏的。 115

误差方差估计量(继续) 116

Intermediate Econometrics Yan Shen 误差方差估计量(继续) Intermediate Econometrics Yan Shen 117

Intermediate Econometrics Yan Shen 总结 OLS的无偏性 OLS的抽样方差标准方差和标准误差的定义估计误差方差 Intermediate Econometrics Yan Shen 118

（2）证明最小方差性其中，ci=ki+di，di为不全为零的常数则容易证明普通最小二乘估计量（ordinary least Squares Estimators）称为最佳线性无偏估计量（best linear unbiased estimator, BLUE）

由于最小二乘估计量拥有一个“好”的估计量所应具备的小样本特性，它自然也拥有大样本特性。

简单一元回归（4）过原点回归

过原点回归 (2.66)

样题，2.8 125

126

127

128

129