Introductory Econometrics for Finance 回归分析的基本概念

Slides:



Advertisements
Similar presentations
一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
Advertisements

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
第八章 第四节 机动 目录 上页 下页 返回 结束 一个方程所确定的隐函数 及其导数 隐函数的微分法.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
第二章 导数与微分. 二、 微分的几何意义 三、微分在近似计算中的应用 一、 微分的定义 2.3 微 分.
§3.4 空间直线的方程.
3.4 空间直线的方程.
非线性时间序列模型 一般非线性时间序列模型介绍 条件异方差模型 上海财经大学 统计与管理学院.
第六章 回归分析.
第十章 相关与回归分析 PowerPoint 统计学.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
一、二阶行列式的引入 用消元法解二元线性方程组. 一、二阶行列式的引入 用消元法解二元线性方程组.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
什么是计量经济学? 计量经济学(Econometrics),又译成经济计量学,是1926年挪威经济学家R. Frish仿照生物计量学(Biometrics)一词首先提出来的,它的提出标志着计量经济学的诞生。 但是,人们一般认为,1930年12月29日世界计量经济学会成立和由它创办的学术刊物Econometrica于1933年正式出版,才标志着计量经济学作为一个独立的学科正式诞生了。
预测与决策分析 Forecasting and Decision Analysis
第七章 固定资产 本章结构 固定资产的性质与分类 固定资产的增加 固定资产的折旧 固定资产的修理 固定资产的减少
第一章 行列式 第五节 Cramer定理 设含有n 个未知量的n个方程构成的线性方程组为 (Ⅰ) 由未知数的系数组成的n阶行列式
第二章 经典单方程计量经济学模型: 一元线性回归模型
量化视角下的豆粕投资机会分析 格林期货研发培训中心 郭坤龙.
第四章 函数的积分学 第六节 微积分的基本公式 一、变上限定积分 二、微积分的基本公式.
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
计量经济学 第三章 多元线性回归模型.
Applied Regression Analysis
Y = b0 + b1x + u ch2 简单二元回归 y = b0 + b1x + u 1.
简单回归模型 过原点回归 简单回归模型的定义 普通最小二乘法的推导 OLS的操作技巧 度量单位和函数形式 OLS估计量的期望值和方差
Chapter 2 簡單迴歸模型.
第12章 回归直线.
§3.3 多元线性回归模型的统计检验 一、拟合优度检验 二、方程的显著性检验(F检验) 三、变量的显著性检验(t检验) 四、参数的置信区间.
引子: 国内生产总值增加会减少财政收入吗?
第二章 回归模型 法、参数的普通最小二乘估计式及相关性质、对模型的经济意 义检验和统计检验,能应用Eviews软件进行最小二乘估计与统
第一章.
一元线性回归模型 § 1 回归分析概述 § 2 一元线性回归模型的参数估计 § 3 一元线性回归模型的统计检验
Stochastic Relationships and Scatter Diagrams
簡單迴歸模型的基本假設 用最小平方法(OLS-ordinary least square)找到一個迴歸式:
第二章 一元线性回归模型.
计量经济学 第二章 简单线性回归模型.
第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
第2章 一元线性回归分析 §2.1 :回归分析及回归模型 §2.2 :一元线性模型的参数估计 §2.3 :参数估计值的性质及统计推断
多元回归分析:估计 y = b0 + b1x1 + b2x bkxk + u 计量经济学导论 刘愿.
第十章 方差分析.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
第七章 参数估计 7.3 参数的区间估计.
Excel在报表分析中应用 潘雷驰 2019/4/4.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
6.4不等式的解法举例(1) 2019年4月17日星期三.
9.1 简单线性相关分析 9.2 一元线性回归分析 9.3 多元线性回归与复相关分析 9.4 变量间非线性关系的回归
模型分类问题 Presented by 刘婷婷 苏琬琳.
§1体积求法 一、旋转体的体积 二、平行截面面积为已知的立体的体积 三、小结.
社会研究方法 第7讲:社会统计2.
第二章 经典线性回归模型: 双变量线性回归模型
3.1 变化率与导数   3.1.1 变化率问题 3.1.2 导数的概念.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第三章 两变量线性回归.
第四章 多元线性回归分析.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
导 言 经济学的基本问题 经济学的基本研究方法 需求和供给.
概率论与数理统计B.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
§2 方阵的特征值与特征向量.
第二节 简单线性回归模型的最小二乘估计 用样本去估计总体回归函数,总要使用特定的方法,而任何估 计参数的方法都需要有一定的前提条件——假定条件 一、简单线性回归的基本假定 为什么要作基本假定? ●只有具备一定的假定条件,所作出的估计才具有良好的统计性质。 ●模型中有随机扰动项,估计的参数是随机变量,显然参数估计值的分布与扰动项的分布有关,只有对随机扰动的分布作出假定,才能比较方便地确定所估计参数的分布性质,也才可能进行假设检验和区间估计等统计推断。
多元线性回归分析.
3.1回归分析的基本思想及其初步应用(四) 高二数学 选修2-3 第三章 统计案例.
数学模型实验课(二) 最小二乘法与直线拟合.
Presentation transcript:

Introductory Econometrics for Finance 回归分析的基本概念 计量经济学 第 2 章 回归分析的基本概念 Copyright 2002, Chris Brooks

§2.1 回归分析概述 一、变量间的关系及回归分析的基本概念 1、变量间的关系 经济变量之间的关系,大体可分为两类: §2.1 回归分析概述 一、变量间的关系及回归分析的基本概念 1、变量间的关系 经济变量之间的关系,大体可分为两类: (1)确定性关系或函数关系:研究的是确定现象非随机变量间的关系。 (2)统计依赖或相关关系:研究的是非确定现象随机变量间的关系。

2、回归分析的基本概念 回归分析(regression analysis)是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。 其用意:在于通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值。 这里:前一个变量被称为被解释变量(Explained Variable)或应变量(Dependent Variable),后一个(些)变量被称为解释变量(Explanatory Variable)或自变量(Independent Variable)。 回归分析构成计量经济学的方法论基础,其主要内容包括: (1)根据样本观察值对经济计量模型参数进行估计,求得回归方程; (2)对回归方程、参数估计值进行显著性检验; (3)利用回归方程进行分析、评价及预测。

二、总体回归函数 由于变量间关系的随机性,回归分析关心的是根据解释变量的已知或给定值,考察被解释变量的总体均值,即当解释变量取某个确定值时,与之统计相关的被解释变量所有可能出现的对应值的平均值。 例2.1:一个假想的社区有100户家庭组成,要研究该社区每月家庭消费支出Y与每月家庭可支配收入X的关系。 即如果知道了家庭的月收入,能否预测该社区家庭的平均月消费支出水平。 为达到此目的,将该100户家庭划分为组内收入差不多的10组,以分析每一收入组的家庭消费支出。

分析: (1)由于不确定因素的影响,对同一收入水平X,不同家庭的消费支出不完全相同; (2)但由于调查的完备性,给定收入水平X的消费支出Y的分布是确定的,即以X的给定值为条件的Y的条件分布(Conditional distribution)是已知的, 如: P(Y=561|X=800)=1/4。 因此,给定收入X的值Xi,可得消费支出Y的条件均值(conditional mean)或条件期望(conditional expectation): E(Y|X=Xi) 该例中:E(Y | X=800)=561

描出散点图发现:随着收入的增加,消费“平均地说”也在增加,且Y的条件均值均落在一根正斜率的直线上。这条直线称为总体回归线。 500 1000 1500 2000 2500 3000 3500 4000 每月可支配收入X(元) 每 月 消 费 支 出 Y (元)

概念: 相应的函数: 称为(双变量)总体回归函数(population regression function, PRF)。 在给定解释变量Xi条件下被解释变量Yi的期望轨迹称为总体回归线(population regression line),或更一般地称为总体回归曲线(population regression curve)。 相应的函数: 称为(双变量)总体回归函数(population regression function, PRF)。

回归函数(PRF)说明被解释变量Y的平均状态(总体条件期望)随解释变量X变化的规律。 含义: 回归函数(PRF)说明被解释变量Y的平均状态(总体条件期望)随解释变量X变化的规律。 函数形式: 可以是线性或非线性的。 例2.1中,将居民消费支出看成是其可支配收入的线性函数时: 为一线性函数。其中,0,1是未知参数,称为回归系数(regression coefficients)。 。

讨论:寻找一条最优拟合直线 对于一条直线,我们可以用以下的方程, y=a+bx 来拟合数据。 这符合实际情况吗? 不符合。所以我们要在这个方程里加入一个挠动项, u。 yt =  + xt + ut 式中 t = 1,2,3,4,5

为什么要加入挠动项? 挠动项能够反映数据的一些特征: - 我们经常会忽略一些影响 yt 的某些确定的因素。

三、随机扰动项 总体回归函数说明在给定的收入水平Xi下,该社区家庭平均的消费支出水平。 但对某一个别的家庭,其消费支出可能与该平均水平有偏差。 记 称i为观察值Yi围绕它的期望值E(Y|Xi)的离差(deviation),是一个不可观测的随机变量,又称为随机干扰项(stochastic disturbance)或随机误差项(stochastic error)。

由于方程中引入了随机项,成为计量经济学模型,因此也称为总体回归模型。 例2.1中,个别家庭的消费支出为: (*) 即,给定收入水平Xi ,个别家庭的支出可表示为两部分之和: (1)该收入水平下所有家庭的平均消费支出E(Y|Xi),称为系统性(systematic)或确定性(deterministic)部分。 (2)其他随机或非确定性(nonsystematic)部分i。 (*)式称为总体回归函数(方程)PRF的随机设定形式。表明被解释变量除了受解释变量的系统性影响外,还受其他因素的随机性影响。 由于方程中引入了随机项,成为计量经济学模型,因此也称为总体回归模型。

随机误差项主要包括下列因素的影响: 1)在解释变量中被忽略的因素的影响; 2)变量观测值的观测误差的影响; 3)模型关系的设定误差的影响; 4)其它随机因素的影响。 产生并设计随机误差项的主要原因: 1)理论的含糊性; 2)数据的欠缺; 3)节省原则。

四、样本回归函数(SRF) 问题:能从一次抽样中获得总体的近似的信息吗?如果可以,如何从抽样中获得总体的近似信息? 总体的信息往往无法掌握,现实的情况只能是在一次观测中得到总体的一个样本。 问题:能从一次抽样中获得总体的近似的信息吗?如果可以,如何从抽样中获得总体的近似信息? 例2.2:在例2.1的总体中有如下一个样本, 问:能否从该样本估计总体回归函数PRF? 回答:能

核样本的散点图(scatter diagram): 样本散点图近似于一条直线,画一条直线以尽好地拟合该散点图,由于样本取自总体,可以该线近似地代表总体回归线。该线称为样本回归线(sample regression lines)。 记样本回归线的函数形式为: 称为样本回归函数(sample regression function,SRF)。

样本回归函数的随机形式/样本回归模型: 同样地,样本回归函数也有如下的随机形式: 由于方程中引入了随机项,成为计量经济模型,因此也称为样本回归模型(sample regression model)。

▼回归分析的主要目的:根据样本回归函数SRF,估计总体回归函数PRF。 即,根据 估计 注意:这里PRF可能永远无法知道。

简单回归: 例1 假设对于一个管理基金的投资组合 (“基金 XXX”)的超额回报和股市指数的超额回报,我们有如下的数据: 我们在直觉上认为该基金的beta应该是一个正数(理论是回归分析的导引) 因此,我们希望利用手上的数据来证实它们之间的确有这种关系。第一步,是画这2个变量的散点图。

散点图

例2 资本性资产定价模型(CAPM) yt =  + xt + ut t = 1,…,T yt : 一个股票的回报 一个投资者希望找到一个具有正的股票进行投资(在金融理论中,如果市场是有效(均衡)的话, =0。 > 0 ,意味着现价低于均衡价格,股票定价过低;  <0,意味着现价低于均衡价格,股票定价过低)。

例2 (续)  度量股票对市场指数回报的反应 : 如果  >1,当市场指数回报上升时,该股票的回报比市场上升得快,当市场指数回报下降时,该股票的回报比市场下降得快,我们称这种股票为进攻性股票。 如果  < 1,当市场指数回报上升时,该股票的回报比市场上升得慢,当市场指数回报下降时,该股票的回报比市场下降得慢,我们称这种股票为防御性股票。 如果  = 1,这种股票的回报的变化,就平均而言,与市场指数是一致的,我们称这种股票为中性股票。

确定回归系数 怎样决定  和 ? 选取  和使得数据点到拟合直线的垂直距离最小 (这样拟合直线就可以尽可能靠近数据点):

普通最小二乘法 用直线来拟合数据最常用的方法是普通最小二乘法 (ordinary least squares, OLS). 令 yt 为第t次观测到的实际数据值 回归线的拟合值 为残差(第t次观测到的实际数据值与回归线的拟合值之差),

实际和拟合值

怎样做OLS? 最小化 , 或者最小化 (残差的平方和)。 什么是 ? 它是第t次观测到的实际数据值与回归线的拟合值之差, yt - 最小化 , 或者最小化 (残差的平方和)。 什么是 ? 它是第t次观测到的实际数据值与回归线的拟合值之差, yt - 所以,最小化 等价于选择 和 ,使得 最小。

OLS估计式的推导 有 , 令 选择 和 ,使得 L 最小。L 对 和 求偏导,令其为0, (1) (2) (1)推出 有 和 。

OLS估计式的推导(续) 所以 或 (3) 由(2), (4) 由 (3), (5) 把(5)带入 (4),

OLS估计式的推导(续) 整理, 所以,有 这就是所谓的最小二乘法

如果一个分析家告诉你,他预期下一年的市场回报将会比无风险回报高20%,那么你预期基金 XXX 的回报将会是多少? 和 的用途 在例1中,把数据代入公式得: = -1.74 和 = 1.64. 拟合直线可以写成: 如果一个分析家告诉你,他预期下一年的市场回报将会比无风险回报高20%,那么你预期基金 XXX 的回报将会是多少? 基金XXX 回报的期望值 y = -1.74 + 1.64 * x的值, 把 x = 20 代入得: