面板数据分析 徐索菲.

Slides:



Advertisements
Similar presentations
一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
Advertisements

2.6 隐函数微分法 第二章 第二章 二、高阶导数 一、隐式定义的函数 三、可微函数的有理幂. 一、隐函数的导数 若由方程 可确定 y 是 x 的函数, 由 表示的函数, 称为显函数. 例如, 可确定显函数 可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此 隐函数求导方法.
国家现代测绘基准体系基础设施建设成果资料汇交与归档培训 (第 1 期)第一部分:总体要求 二〇一二年十二月.
非线性时间序列模型 一般非线性时间序列模型介绍 条件异方差模型 上海财经大学 统计与管理学院.
引 言 我国推行保单贴现的可行性分析 2012中国保险与风险管理国际年会 1、当人们因为昂贵的医疗费用束手无策时,当人们因为年老体弱、生活无以为计时,对于多数手中持有寿险单的人来说就有提前支取保险金的意愿,保单二级市场——保单贴现市场就应运而生了。 2、国外,保单贴现起源于20世纪80年代艾滋病蔓延的美国,三十年来发展迅速;在我国却没有真正意义上的保单贴现市场.
3.2.平稳性检验的单位根方法 单位根检验方法 DF检验 ADF检验 PP检验 KPSS检验 ERS检验 NP检验.
第四章 时间序列模型 一、向量自回归(VAR)模型 二、ARCH模型 三、单位根检验 四、协整分析与ECM模型.
时间序列分析 经济学院学术午餐会系列讲座2 主讲人 滕建州
第三章 经典单方程计量经济学模型:多元线性回归模型
第三章 异方差和自相关.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
中国人身保险需求的影响因素分析 ——基于面板数据分位数回归的实证研究 论文作者: 宋梦晶 蔡超 论文 ID : 1019.
第十章 利用横截面和时间序列的计量模型 在进行经济分析时经常会遇到时间序列和横截面两者相结合的数据。例如,在企业投资需求分析中,我们会遇到多个企业的若干指标的月度或季度时间序列;在城镇居民消费分析中,我们会遇到不同省市地区的反映居民消费和居民收入的年度时间序列。本章将前述的企业或地区等统称为个体,这种具有三维(个体、指标、时间)信息的数据结构称为时间序列/截面数据,有的书中也称为平行数据或面板数据(panel.
计量经济学习题课 詹 鹏 南京财经大学数量经济学2010级.
黑龙江 吉林 新疆 辽宁 甘肃 内蒙古 北京 河北 宁夏 青海 山西 山东 陕西 河南 江苏 西藏 安徽 上海 四川 湖北 浙江 江西 湖南
§4.3 多重共线性 Multi-Collinearity.
第四章 经典单方程计量经济学模型:放宽基本假定的模型
Multicollinearity 一、多重共线性的概念 二、多重共线性的后果 三、多重共线性的检验 四、克服多重共线性的方法 五、例题
案例二 股票价格预测 鲍玉昆 华中科技大学管理学院                           
§9.3 协整与误差修正模型 一、长期均衡关系与协整 二、协整检验 三、误差修正模型.
量化视角下的豆粕投资机会分析 格林期货研发培训中心 郭坤龙.
计量经济学 第六章 自相关.
第一节 引言 第二节 一元线性回归模型 第三节 多元线性回归模型 第四节 虚拟变量回归模型 第五节 非线性回归模型 本章小节 主要内容.
§3.6 受约束回归 在建立回归模型时,有时根据经济理论需对模型中变量的参数施加一定的约束条件。 1阶齐次性 条件的C-D生产函数
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
§3.3 多元线性回归模型的统计检验 一、拟合优度检验 二、方程的显著性检验(F检验) 三、变量的显著性检验(t检验) 四、参数的置信区间.
计量经济学 第四章 多重共线性.
引子: 国内生产总值增加会减少财政收入吗?
第二章 回归模型 法、参数的普通最小二乘估计式及相关性质、对模型的经济意 义检验和统计检验,能应用Eviews软件进行最小二乘估计与统
一元线性回归模型 § 1 回归分析概述 § 2 一元线性回归模型的参数估计 § 3 一元线性回归模型的统计检验
二、Dickey-Fuller检验(DF检验)
第六章 多元时间序列分析.
计量经济学 第九章 时间序列计量经济模型.
7 平稳时间序列预测法 7.1 概述 7.2 时间序列的自相关分析 7.3 单位根检验和协整检验 7.4 ARMA模型的建模 回总目录.
第七章:回归分析的其它问题 第一节 虚拟变量 第二节 设定误差 第三节 滞后变量模型介绍 第四节 随机解释变量 第五节 时间序列模型初步.
第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
第4章 多元线性回归分析.
第2章 一元线性回归分析 §2.1 :回归分析及回归模型 §2.2 :一元线性模型的参数估计 §2.3 :参数估计值的性质及统计推断
Online job scheduling in Distributed Machine Learning Clusters
第十章 方差分析.
数据挖掘工具性能比较.
面板数据回归.
第七章 参数估计 7.3 参数的区间估计.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
第一章 函数与极限.
模型分类问题 Presented by 刘婷婷 苏琬琳.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
§4.2 序列相关性 Serial Correlation.
实体描述呈现方法的研究 实验评估 2019/5/1.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第六章 多重共线性 一、多重共线性的概念 二、实际经济问题中的多重共线性 三、多重共线性的后果 四、多重共线性的检验
第五章 异方差.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
第三章 两变量线性回归.
第四章 多元线性回归分析.
计量经济学 第十章 时间序列计量经济模型.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
导 言 经济学的基本问题 经济学的基本研究方法 需求和供给.
概率论与数理统计B.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
滤波减速器的体积优化 仵凡 Advanced Design Group.
多元线性回归分析.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
安徽财经大学 计量经济学 Econometrics 经济学院 马成文
数学模型实验课(二) 最小二乘法与直线拟合.
Presentation transcript:

面板数据分析 徐索菲

主要内容 基本原理介绍 面板数据建模案例分析 Eviews操作演示 面板数据的定义 面板数据模型分类 面板数据模型设定检验 面板数据的单位根检验 面板数据的协整检验 面板数据建模案例分析 Eviews操作演示

会用Eviews做一般的面板数据分析!

面板数据的定义 “面板数据”一词指的是一部分家庭、国家或企业 等在一段时期内的观测值所构成的集合。这样的数 据可以通过在一段时期内对一些家庭或个体进行跟 踪调查来获得。 面板数据也称作时间序列与截面混合数据。 面板数据用双下标变量表示。例如:Yi t 、Xi t 面板数据可以分为微观面板和宏观面板两大类: 微观面板:个体数N较大,时期数T较小 宏观面板:有适度规模的N,时期数T较大

表1 1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费数据(不变价格) 表1 1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费数据(不变价格) 地区人均消费 1996 1997 1998 1999 2000 2001 2002 CP-AH(安徽) 3282.466 3646.150 3777.410 3989.581 4203.555 4495.174 4784.364 CP-BJ(北京) 5133.978 6203.048 6807.451 7453.757 8206.271 8654.433 10473.12 CP-FJ(福建) 4011.775 4853.441 5197.041 5314.521 5522.762 6094.336 6665.005 CP-HB(河北) 3197.339 3868.319 3896.778 4104.281 4361.555 4457.463 5120.485 CP-HLJ(黑龙江) 2904.687 3077.989 3289.990 3596.839 3890.580 4159.087 4493.535 CP-JL(吉林) 2833.321 3286.432 3477.560 3736.408 4077.961 4281.560 4998.874 CP-JS(江苏) 3712.260 4457.788 4918.944 5076.910 5317.862 5488.829 6091.331 CP-JX(江西) 2714.124 3136.873 3234.465 3531.775 3612.722 3914.080 4544.775 CP-LN(辽宁) 3237.275 3608.060 3918.167 4046.582 4360.420 4654.420 5402.063 CP-NMG(内蒙古) 2572.342 2901.722 3127.633 3475.942 3877.345 4170.596 4850.180 CP-SD(山东) 3440.684 3930.574 4168.974 4546.878 5011.976 5159.538 5635.770 CP-SH(上海) 6193.333 6634.183 6866.410 8125.803 8651.893 9336.100 10411.94 CP-SX(山西) 2813.336 3131.629 3314.097 3507.008 3793.908 4131.273 4787.561 CP-TJ(天津) 4293.220 5047.672 5498.503 5916.613 6145.622 6904.368 7220.843 CP-ZJ(浙江) 5342.234 6002.082 6236.640 6600.749 6950.713 7968.327 8792.210

面板数据的优势 1、便于控制个体的异质性。 的滞后项、价格和收入等可观测的变量; 族习惯(nation)和风俗文化(custom)等变量; 例如,研究2000~2012年我国各省居民对青岛啤酒的需求问题时,设定 需求模型: 则模型中解释变量包括四类: 第一类:随个体(省)和时间的变化而变化的变量,如啤酒消费量 的滞后项、价格和收入等可观测的变量; 第二类:随个体(省)变化而不随时间变化的可观测变量,如民 族习惯(nation)和风俗文化(custom)等变量; 第三类:不随个体(省)变化而随时间变化的可观测变量,如电 视和广播中的广告等变量; 第四类:是一些不可观测变量 2、包含的信息量更大,降低了变量间共线性的可能 性,增加 了自由度和估计的有效性。 3、面板数据更适合于研究动态调整过程

面板数据模型 我们将基于面板数据的回归模型称为面板数据模型 (panel data model)。面板数据模型可以分为 单方程面板数据模型和联立方程面板数据模型;也 可以分为线性面板数据模型和非线性面板数据模型; 还可以分为静态面板数据模型和动态面板数据模型。

其中 用于衡量个体i在t时点, 对 的边际影响。 单方程静态面板数据模型的一般形式为: 其中 用于衡量个体i在t时点, 对 的边际影响。 对模型做进一步限制可以将面板数据模型划分为:混合估计模型、固定效应模型、随机效应模型

1 、混合回归模型 如果我们假设从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,也就是截距项和斜率都不随个体和时点的变化而变化,我们把这类模型称为混合回归模型,可以直接把面板数据混合在一起,用普通最小二乘法(OLS)估计参数。即估计模型: .

2、固定效应模型 如果对于不同的截面或不同的时间序列,只是模型的截距项是不同的,而模型的斜率系数是相同的,并且允许截距项的变化与解释变量相关,则称此种模型为固定效应模型。固定效应模型分为3 种类型,即个体固定效应模型、时点固定效应模型和时点个体固定效应模型。 个体固定效应: 时点固定效应: 个体时点固定效应: 对于固定效应模型可以采用在模型中加虚拟变量的方法估计回归参数,并称这种回归为最小二乘虚拟变量(The Least Square Dummy Variable)回归,简记为LSDV 回归。也可以采用广义最小二乘法的协方差分析(Analysis ofCovariance)法估计固定效应模型参数,简记为ANCOVA 回归。

3、随机效应模型 如果对于不同的截面或不同的时间序列,只是模型的截距项是不同的,而模型的斜率系数是相同的,但是截距项的变化与解释变量不相关,则称此种模型为随机效应模型。随机效应模型分为3 种类型,即个体随机效应模型、时点随机效应模型和时点个体水机效应模型。 个体随机效应: 时点随机效应: 个体时点随机效应: 对于随机效应模型我们通常可以采用可行广义最小二乘法( FGLS)进行估计。

面板数据模型的检验与设定 1、F检验:用于判断是否应该建立固定效应模型 检验原理:H0:约束条件成立 H1:约束条件不成立 构造F统计量: 其中,SSEr表示约束模型的残差平方和,SSEu表示非约束模型的残差平方和,m表示约束条件个数,T表示样本容量,k表示非约束模型中被估参数的个数。 计算得到的F统计量的值小于等于临界值,则接受原假设约束条件成立,大于临界值则拒绝原假设约束条件不成立。 以是否应建立混合模型和个体固定效应模型为例

固定效应显著性检验 相对于混合估计模型来说,是否有必要建立个体固定效应模 型可以通过F检验来完成。 H0:不同个体的截距项相同(真实模型为混合估计模型) H1:不同个体的截距项不同(真实模型为个体固定效应模型) F统计量定义为: 其中SSEr,SSEu分别表示约束模型(混合估计模型)和非约束模型(个体固 定效应模型)的残差平方和。N表示个体个数,(N-1)表示约束条件个数, k为解释变量对应参数的个数。

面板数据模型的检验与设定 2、Hausman检验:用于判断是否应该建立随机效应模型 检验原理:H0:建立随机效应模型 H1:建立固定效应模型 检验思想: 离差变换OLS估计 可行GLS估计 估计量之差 随机效应模型 估计量具有一致性 小 固定效应模型 大 因此只需检验 是否渐进为0 其中: K表示解释变量个数

面板数据的单位根检验 面板数据的单位根检验分为两大类: 介绍LLC和Fisher-ADF检验思想: 一类假设所有的个体都具有相同的单位根 如LLC检验、 Bretung检验 一类假设不同的个体具有不同的单位根 如IPS检验,Fisher-ADF检验,Fisher—PP检验 注:这五个检验方法的原假设都是存在单位根 介绍LLC和Fisher-ADF检验思想: LLC(Levin-Lin-Chu)检验原理仍采用ADF检验式。区别 是使用的是剔除自相关和确定性影响的、标准化的代理变 量。 Fisher-ADF检验又称崔仁检验,他是基于fisher原理,首 先对每个个体做ADF检验,用得到的N个ADF统计量所对 应的的概率值P的和来构造两个统计量。

面板协整检验 面板数据的协整检验按方法分为两大类: 由EG两步法推广而成的面板数据协整检验方法,如 Pedroni协整检验法、Kao协整检验法。(只能检验一个协 整关系) Pedroni检验包括4个统计量,11个检验方法 Kao检验给出1个ADF统计量,该统计量渐进服从标准正态分布 由Johanson迹统计量推广而成的面板数据协整检验方法,如Fisher协整检验方法。(可检验多个协整关系) Fishen协整检验方法是用个体的协整检验值构造一个服从X2分布的累加统计量检验变量间的协整关系。

面板数据分析步骤 一、散点图时序图分析 二、面板数据平稳性检验 三、面板数据协整检验 四、面板数据模型设定 五、最终回归模型建立 六、模型应用

面板数据建模案例分析 案例1:中国城镇居民家庭人均消费和收入之间的关系。 数据选取:1999-2011年中国31个省级地区的城镇居民 人均全年消费(CS)和人均全年可支配收入(YD)的不变价 格数据。数据是13年的,每一年都有31个数据,共403 组观测值。 数据来源:中经网统计数据库

一、散点图分析 本例用对数研究更适合 缓解异方差; 线性关系更明显。 人均消费对人均收入的面板数据散点图 对数的人均消费对收入的面板数据散点图 缓解异方差; 线性关系更明显。 本例用对数研究更适合

二、面板数据平稳性检验 必要性:避免伪回归现象。 检验方法:Levin-Lin-Chu检验法、Im-Pesaran-Shin检验法、 Fisher-ADF检验法和Fisher-PP检验法。 检验结果:对变量LNCS、DLNCS、LNYD和DLNYD进行 平稳性检验,结果显示LNCS和LNYD都是非平稳的, DLNCS和DLNYD都是平稳的,所以LNCS和LNYD都是一 阶单整序列。

LNCS的单位根检验结果 DLNCS的单位根检验结果 Method Statistic Prob.** sections Obs Null: Unit root (assumes common unit root process) Levin, Lin & Chu t* 5.020056 1 31 366 Null: Unit root (assumes individual unit root process) Im, Pesaran and Shin W-stat 11.12288 ADF - Fisher Chi-square 3.585372 PP - Fisher Chi-square 4.508153 372 DLNCS的单位根检验结果 Method Statistic Prob.** sections Obs Null: Unit root (assumes common unit root process) Levin, Lin & Chu t* -17.7985 31 335 Null: Unit root (assumes individual unit root process) Im, Pesaran and Shin W-stat -12.5383 ADF - Fisher Chi-square 248.224 PP - Fisher Chi-square 322.5 341

三、面板数据协整检验 采用Pedroni检验和Kao检验、Fisher个体联合检验对LNCS和 LNYD进行协整检验,结果显示二者存在协整关系。 Pedroni检验结果(原假设不存在协整关系) Alternative hypothesis: common AR coefs. (within-dimension) Statistic Prob. Weighted Panel v-Statistic 4.948048 4.986244 Panel rho-Statistic -4.55527 -5.28354 Panel PP-Statistic -12.2178 -14.5403 Panel ADF-Statistic -7.04998 -8.5529 Alternative hypothesis: individual AR coefs. (between-dimension) Group rho-Statistic -2.35081 0.0094 Group PP-Statistic -17.1102 Group ADF-Statistic -8.33517

四、面板数据模型设定 结合散点图,选择初始模型个体固定效应模型 利用F检验,检验固定效应的显著性 利用Hausman检验,检验随机效应的显著性

个体固定效应模型估计结果

混合模型与个体固定效应模型比较,应该建立个体固定效应模型。

随机效应显著性检验 Hausman检验 原假设与备择假设是: H0: 个体效应与回归变量无关(个体随机效应回归模型) 结论:个体随机效应与个体固定效应比较应该建立个体固定效应

建立个体效应误差修正模型

案例2:美国公路交通事故死亡人数与啤酒税关系研究 美国每年有4万起高速公路交通事故,约1/3涉及酒后驾车。这个 比率在饮酒高峰期会上升。凌晨1~3点25%的司机饮酒。饮酒司机出交 通事故是不饮酒司机的13倍。现有1982~1988年48个州共336组美国 公路交通事故死亡人数(number)与啤酒税(beertax)的数据,散点 图如下:

按个体固定效应模型估计:

模型设定检验 1、用F检验判断应该建立混合模型还是固定效应模型 用F检验判断是否建立个体时点固定效应模型 应该建立个体固定效应模型

2、用H检验判断应该建立个体随机效应还是个体固定效应模型 应该建立个体固定效应模型

案例3:柯布-道格拉斯生产函数研究

建立个体时点双固定效应模型

模型设定检验 1、用F检验判断应该建立混合模型还是固定效应模型 应该建立个体时点固定效应模型

2、用H检验判断是否应该建立个体时点随机效应模型 应该建立个体随机时点固定效应模型

个体随机、时点固定效应模型回归结果:

规模报酬不变检验 做WALD检验: 原假设: 接受原假设,规模报酬保持不变

Eviews7.2操作演示