计量经济学 第三章 多元线性回归模型.

Slides:



Advertisements
Similar presentations
当前形势和 国际静安建设 静安党校 王小林. 国际 —— 问题很大、霸权犹在。 1 、国际产业分工的后果 经济全球化的双刃剑: 新兴产业尚未形成 -- 高失业率 老龄化 -- 高福利 -- 高负债 权威缺失 -- 民主治理的危机 再平衡战略 -- 保护主义抬头。
Advertisements

一、北京水务情况简介 二、北京水资源现状 三、北京水资源管理措施 主要内容 北京市行政区 域面积 1.6 4万平 方公里,西北部 为山区,约占总 面积的三分之二, 东南部为平原区, 约占总面积的三 分之一。 一、北京水务情况简介.
中国银行河北省分行 河北省金融票据协会 2014 年二季度河北省金融票据市场 运行情况分析会. 目录 全国货币信贷及金融票据市场情况 河北省货币信贷及票据市场运行情况 2014 年二季度宏观经济运行概况 中国银行河北省分行票据业务发展概况 票据市场走势分析及票据业务发展建议.
做好就业和自主创业的准备. 我国目前就业形势 根据全国人口普查数据, 2007 年有 1100 万新增劳 动力有就业要求。据不久前教育部公布的数据显 示, 2008 年全国普通高校毕业生人数预计将达到 420 万人,比 2007 年增加 58 万人,增幅 20.71% 。 2007 年年底 830.
道德讲堂 第一讲 放眼改革开放 上海市泾南中学 杨丽萍 第一章:放眼 -- 《邓小平时代》
學習目標 指指出中國地理區的劃分方式 了了解中國七大地理區的區域特色 了了解中國三大經濟地帶的發展特徵 分分析中國區域政策對三大經濟地帶 的影響.
长沙经济发展情况介绍与分析 长沙市委党校经济学部 长沙经济发展研究中心 李 跃 教授. 一、长沙市的基本情况 二、 2000 年来长沙经济发展的主要特点 三、长沙发展的长板和短板.
人的性别遗传 合肥市第四十九中学 丁 艳. 男女成对染色体排序图 1 、男性和女性各 23 对染色体有何异同 ? 哪 一对被称为性染色体 ? 2 、这两幅图中,哪幅 图显示的是男性的染色 体?哪幅图显示的是女 性染色体? 3 、图中哪条染色体是 Y 染色体?它与 X 染色体 在形态上的主要区别是.
解读 十八届五中全会 精神 解读 十八届五中全会 精神. 党的会议 全国代表大会 1 全国代表大会每 5 年召开一次 中国共产党第十八次全国代表大会,简称 “ 党的十八大 ” 中央委员会全体会议 2 简称中央全会 中国共产党第十八届中央委员会第五次全体会议 简称 “ 党的十八届五中全会 ”
公共管理 0701 班.  3 月 1 日,在酝酿了一年之后,《神木县全民免费医 疗实施办法 ( 试行 ) 》如期推行。这项被媒体称为 “ 开 国内先河 ” 的医疗保障制度推行两个多月以来,让全 体神木人民真正体会到了 “ 看得起病 ” 的前所未有的 实惠,同时,公众道德风险却又把政府推到了一个.
《关注经济发展》 知识复习 1、我国的根本政治制度是 ? 2、党领导人民治理国家的基本方略是 ?它的基本要求是 ?
坚持党的群众路线 2013年10月.
“积极老龄化”理论视角下的 老龄旅游产业发展战略 中国旅游研究院 黄璜
人口再生产.
学科:思想品德 九年级 教科版 第十六课 可持续发展 :控制人口,提高素质 单位:覃塘区东龙初中 周志宾.
第三节 学前教育与社会经济、政治、 文化等方面的关系.
城投及园区类企业评级方法.
《浙江舟山群岛新区发展规划》 重点内容介绍.
1、一般地说,在生物的体细胞中, 和 都是成对存在的。
辨性别 A B. 辨性别 A B 第三节人类染色体与性别决定 昌邑市龙池初中 杨伟红 学习目标 1.理解人的染色体组成和传递规律。 2.解释人类性别决定的原理。 3.通过探究活动,解读数据了解生男生女的比例。
聚焦文化竞争力.
申论时政.
2014年高考政治 二轮系统复习.
对加快转变我国经济发展方式的几点认识 乌苏市委党校 沈海龙.
严格水资源管理 推进节水型社会建设 王亚红 二○一二年十一月.
示范流程培训课件.
最新消息插播! 意見反應: 我是貴校學生的家長,請問貴校該給工讀生的薪水何時才肯發呢?現在已經是十一月中了,九月十月的薪水還沒入帳我們不知道是卡在哪個環節,但貴校是否知道有多少同學需要這筆錢去過生活、繳納房租? …………………………………………………….? 請各位報帳同仁、專兼任助理們務必養成平時定期清帳的習慣,不要等到年終或結案前才開始緊張。
概其要、析其理 ——议论文事实论据修改 昌平二中 王丽娟
第七课 收入与分配.
“悦”读,飞越 “考场” 心神飞越 温州中学 郑可菜.
教学目的、重点及难点 教学目的:主要分析构建社会主义和谐社会的重要性和紧迫性,介绍我们党提出构建社会主义和谐社会的理论渊源和现实依据,论述构建社会主义和谐社会的指导思想、基本原则和目标任务,帮助学生深刻认识构建社会主义和谐社会的科学涵义和重要意义,了解关于构建社会主义和谐社会的主要方针政策。 重点:
走向共同富裕的道路.
我国文化产业保险发展对策 辽宁大学经济学院保险系 李薇 赵家仪.
弘扬宣南文化 促进创意产业 —对发展宣南文化创意产业的思考 宣武少年宫 马尧.
2015年镇模试卷评讲 盛英明
认真学习贯彻习近平总书记系列重要 讲话精神,努力实施创新驱动发展战略
改革开放以来我国经济发展的成就   第一,创造经济增长速度的世界之最。八十年代以来,中国成为世界上经济增长速度最快的国家。中国经济在过去长达20多年的时间里,保持了年均9.4%的高速度,创造了世界经济增长史上的新奇迹,刷新了世界纪录。 2007年中国GDP总量上升到世界第四,根据美联社2008年4月10日报道,中国2007年GDP(国内生产总值)现价总量为3.61万亿美元,经济增长率达到11.9%。
复习: 意识 意识是物质世界长期发展的产物 意识是人脑的机能 意识是客观存在的主观映象 客观存在在人脑中的反映
第三章 发展是党执政兴国的第一要务.
以五中全会精神为指引 加快推进伊春转型发展
学习宣传党的十八届 三中全会精神 此处添加单位名称.
星级擂台.
第九章 遗传与进化.
组织与点评 模拟招聘会.
1.1.2 四 种 命 题.
第 5 课 坚持科学发展观 全面建设小康社会.
第六章 社会主义初级阶段理论 讲授内容 第一节 社会主义初级阶段是我国最大的实际 第二节 社会主义初级阶段的基本路线 和基本纲领
第六章 社会主义建设的发展战略.
色 弱 與 色 盲.
和谐社会与文化建设 中共上海市委党校研究生 郭红保
第七次全國科學技術會議第二次副首長會議 第一議題籌備情形報告
第八章 建设中国特色社会主义经济.
第八章 建设中国特色社会主义经济.
高考哲学十种主观题常见题型及分析.
宠物之家 我的宠物性别? 雌(♀) or 雄(♂) 第一阶段:我的宠物我做主 第二阶段:宠物“相亲记” 第三阶段:家族诞生
屏東縣105年度 友善校園事務與輔導工作- 國中適性輔導工作專業知能研習(初階課程) 桌遊在班級經營與學生輔導 之應用與連結
社会主义核心价值体系的 若干重要问题 双击添加署名/公司名/日期.
92-90數學課程綱要比較 -- 不含數與計算 台北市立師範學院 數學資訊教育系副教授 李源順.
叶德磊 编著 高等教育出版社 (此课件仅供教学之用,其中内容不得用于其它出版物)
形势与政策教学专题 新时期我国科技发展      战略与对策.
学习党史 牢记宗旨 创造辉煌 梁道刚 广东省委党校党史党建部.
一元线性回归(二).
计量经济学 第二章 简单线性回归模型.
首届“互联网+” 大学生创新创业大赛.
第二部分 免疫系统与免疫活性分子 第二章 免疫系统 第三章 免疫球蛋白 第二 部分 第五章 细胞因子 第四章 补体系统.
最大值或最小值的應用 自我評量.
2015长沙事业单位 政策解读 中公教育:邓颖莉 主讲:XX.
拟合优度(或称判定系数、决定系数) 目的:企图构造一个不含单位,可以相互进行比较,而且能直观判断拟合优劣的指标。 拟合优度的定义:
高中 E 形象 數位果子科技有限公司 程建嘉.
第二章 经典线性回归模型: 双变量线性回归模型
Presentation transcript:

计量经济学 第三章 多元线性回归模型

引子:中国已成为世界汽车产销第一大国 2009年,为应对国际金融危机、确保经济平稳较快增长, 国家出台了一系列促进汽车消费的政策,有效刺激了汽车消费市 场,汽车产销呈高增长态势,首次成为世界汽车产销第一大国。 2009年,汽车产销分别为1379.1万辆和1364.5万辆,同比增长 48.3%和46.15%。 是什么因素导致中国汽车数量的增长? 影响中国汽车行业发展的因素并不是单一的,经济增长、 消费趋势、市场行情、业界心态、能源价格、道路发展、内 外环境,都会使中国汽车行业面临机遇和挑战。

怎样分析多种因素的影响? 分析中国汽车行业未来的趋势,应具体分析这样一些问题: 中国汽车市场发展的状况如何?(用销售量观测) 影响中国汽车销量的主要因素是什么? (如收入、价格、费用、道路状况、能源、政策环境等) 各种因素对汽车销量影响的性质怎样?(正、负) 各种因素影响汽车销量的具体数量关系是什么? 所得到的数量结论是否可靠? 中国汽车行业今后的发展前景怎样?应当如何制定汽车的 产业政策? 很明显,只用一个解释变量已很难分析汽车产业的发展, 还需要寻求有更多个解释变量情况的回归分析方法。

本章主要讨论: ●多元线性回归模型及古典假定 ●多元线性回归模型的估计 ●多元线性回归模型的检验 ●多元线性回归模型的预测

第一节 多元线性回归模型及古典假定 一、多元线性回归模型的意义 一般形式:对于有K-1个解释变量的线性回归模型 注意:模型中的 (j=1,2,---k)是偏回归系数 样本容量为n 偏回归系数: 控制其它解释量不变的条件下,第j个解释变量的单位变动对被解释变量平均值的影响,即对Y平均值“直接”或“净”的影响。 5

多元线性回归中的“线性” 指对各个回归系数而言是“线性”的,对变量则可以是线性的,也可以是非线性的 例如:生产函数 取对数 这也是多元线性回归模型,只是这时变量为lnY、lnL、lnK

多元总体回归函数 条件期望表现形式: 将Y的总体条件期望表示为多个解释变量的函数,如: 注意:这时Y总体条件期望的轨迹是K维空间的一条线 个别值表现形式: 引入随机扰动项 或表示为

多元样本回归函数 Y 的样本条件均值可表示为多个解释变量的函数 或回归剩余(残差): 其中

多个解释变量的多元线性回归模型的n组样本观测值,可 表示为 二、多元线性回归模型的矩阵表示 多个解释变量的多元线性回归模型的n组样本观测值,可 表示为 用矩阵表示 9

矩阵表示方式 总体回归函数 或 样本回归函数 或 是有k 个 元素的列向量 ( k = 解释变量个数 + 1 ) 总体回归函数 或 样本回归函数 或 其中: 都是有n个元素的列向量 是有k 个 元素的列向量 ( k = 解释变量个数 + 1 ) 是第一列为1的n×k阶解释变量数据矩阵 , (截距项可视为解释变量总是取值为1)

(i=j) (i≠j) 假定1:零均值假定 ( i=1,2,---n) 或 E(u)=0 假定2和假定3:同方差和无自相关假定: 三、多元线性回归中的基本假定 假定1:零均值假定 ( i=1,2,---n) 或 E(u)=0 假定2和假定3:同方差和无自相关假定: 或用方差-协方差矩阵表示为: (i=j) (i≠j)

假定各解释变量之间不存在线性关系,或各个解释变量观测值之间线性无关。或解释变量观测值 假定4:随机扰动项与解释变量不相关 假定5: 无多重共线性假定 (多元中增加的) 假定各解释变量之间不存在线性关系,或各个解释变量观测值之间线性无关。或解释变量观测值 矩阵X的秩为K(注意X为n行K列)。 Ran(X)= k Rak(X'X)=k 即 (X'X) 可逆 假定6:正态性假定 12

第二节 多元线性回归模型的估计 一、普通最小二乘法(OLS) 原则:寻求剩余平方和最小的参数估计式 即 求偏导,并令其为0 其中 13

用矩阵表示的正规方程 偏导数 因为样本回归函数为 两边左乘 根据最小二乘原则 则正规方程为

OLS估计式 由正规方程 多元回归的OLS估计量为 当只有两个解释变量时为: 注意: 为X、Y的离差 对比 简单线性回归中

OLS回归线的数学性质 (与简单线性回归相同) ●回归线通过样本均值 ●估计值 的均值等于实际观测值 的均值 ●剩余项 的均值为零 ●被解释变量估计值 与剩余项 不相关 ●解释变量 与剩余项 不相关 (j=1,2,---k) 16

1、 线性特征 是Y的线性函数,因 是非随机或取固定值的矩阵 2、 无偏特性 (证明见教材P101附录3.1) 3、 最小方差特性  二、 OLS估计式的统计性质 1、  线性特征 是Y的线性函数,因 是非随机或取固定值的矩阵 2、  无偏特性 (证明见教材P101附录3.1) 3、  最小方差特性 在 所有的线性无偏估计中,OLS估计 具有最小方差 (证明见教材P101或附录3.2) 结论:在古典假定下,多元线性回归的 OLS估 计式是最佳线性无偏估计式(BLUE)

三、 OLS估计的分布性质 基本思想: ● 是随机变量,必须确定其分布性质才可能进行区间估计和假设检验 ● 是服从正态分布的随机变量, ● 是随机变量,必须确定其分布性质才可能进行区间估计和假设检验 ● 是服从正态分布的随机变量, 决定了Y也是服从正态分布的随机变量 ● 是Y的线性函数,决定了 也是服从正态分布的随机变量

的期望与方差 ● 的期望 (由无偏性) ● 的方差和标准误差: 可以证明 的方差—协方差矩阵为(见下页) 这里的 ● 的期望 (由无偏性) ● 的方差和标准误差: 可以证明 的方差—协方差矩阵为(见下页) 这里的 (其中 是矩阵 中第 j 行第 j 列的元素) 所以 (j=1,2,---k)

的方差-协方差 注意 是向量 (由无偏性) (由OLS估计式) (由同方差性) 其中: 20

一般未知,可证明多元回归中 的无偏 估计为:(证明见P103附录3.3) 或表示为 将 作标准化变换: 四、 随机扰动项方差 的估计 四、 随机扰动项方差 的估计 一般未知,可证明多元回归中 的无偏 估计为:(证明见P103附录3.3) 或表示为 将 作标准化变换: 对比: 一元回归中 21

未知时 的标准化变换 因 是未知的, 可用 代替 去估计参数的标准误差: 未知时 的标准化变换 因 是未知的, 可用 代替 去估计参数的标准误差: ● 当为大样本时,用估计的参数标准误差对 作标准化变换,所得 Z 统计量仍可视为服从正态分布 ●当为小样本时,用估计的参数标准误差对 作标准化变换,所得的 t 统计量服从 t 分布: 22

五、 回归系数的区间估计 由于 给定 ,查t分布表的自由度为 n-k 的临界值 或 或表示为 23

第三节 多元线性回归模型的检验 一、多元回归的拟合优度检验 多重可决系数:在多元回归模型中,由各个解释 第三节 多元线性回归模型的检验 一、多元回归的拟合优度检验 多重可决系数:在多元回归模型中,由各个解释 变量联合起来解释了的Y的变差,在Y的总变差中占 的比重,用 表示 与简单线性回归中可决系数 的区别只是 不同 多元回归中 多重可决系数可表示为 (注意:红色字体是与一元回归不同的部分) 24

多重可决系数的矩阵表示 特点:多重可决系数是模型中解释变量个数的不减函 数,这给对比不同模型的多重可决系数带来缺陷, 所以需要修正。 可用代数式表达为 特点:多重可决系数是模型中解释变量个数的不减函 数,这给对比不同模型的多重可决系数带来缺陷, 所以需要修正。

修正的可决系数 思想:可决系数只涉及变差,没有考虑自由度。 回顾: 自由度:统计量的自由度指可自由变化的样本观 如果用自由度去校正所计算的变差,可纠 正解释变量个数不同引起的对比困难。 回顾: 自由度:统计量的自由度指可自由变化的样本观 测值个数,它等于所用样本观测值的个 数减去对观测值的约束个数。

可决系数的修正方法 总变差 TSS 自由度为 n-1 解释了的变差 ESS 自由度为 k-1 剩余平方和 RSS 自由度为 n-k 修正的可决系数为

修正的可决系数 与可决系数 的关系 可决系数 必定非负,但所计算的修正可决系数 有可能为负值 已经导出: 注意: 修正的可决系数 与可决系数 的关系 已经导出: 注意: 可决系数 必定非负,但所计算的修正可决系数 有可能为负值 解决办法:若计算的 ,规定 取值为0

二、回归方程的显著性检验(F检验) 基本思想: 在多元回归中包含多个解释变量,它们与被解释 变量是否有显著关系呢? 当然可以分别检验各个解释变量对被解释变量影 响的显著性。 但是我们首先关注的是所有解释变量联合起来对被 解释变量影响的显著性, 或整个方程总的联合显著性, 需要对方程的总显著性在方差分析的基础上进行F检验。 29

1.方差分析 在讨论可决系数时已经分析了被解释变量总变差 TSS的分解及自由度: TSS=ESS+RSS 注意: Y的样本方差= 总变差/自由度 即 显然,Y的样本方差也可分解为两部分,可用方差分析 表分解 30 30

总变差 TSS= 自由度 n-1 模型解释了的变差 ESS= 自由度 k-1 剩余变差 RSS= 自由度 n-k 方差分析表 总变差 TSS= 自由度 n-1 模型解释了的变差 ESS= 自由度 k-1 剩余变差 RSS= 自由度 n-k 变差来源 平 方 和 自由度 方 差 归于回归模型 ESS= k-1 归于剩余 RSS= n-k 总变差 TSS= n-1 基本思想: 如果多个解释变量联合起来对被解释变量的影响不显著, “归于回 归的方差“ 比“归于剩余的方差”显著地小应是大概率事件。

2. F检验 原假设: 备择假设: 不全为0 建立统计量(可以证明): 给定显著性水平 ,查F分布表中自由度为 k-1 (所有解释变量联合起来对被解释变量的影响不显著) 备择假设: 不全为0 建立统计量(可以证明): 给定显著性水平 ,查F分布表中自由度为 k-1 和 n-k 的临界值 ,并通过样本观测 值计算F值 32

F检验方式 ▼如果计算的F值大于临界值 , 则拒绝 ,说明回归模型有显著意义, 即所有解释变量联合起来对Y确有显著影响。 ,说明回归模型没有显著 意义,即所有解释变量联合起来对Y没有显著影响。

三、各回归系数的假设检验 注意: 在一元回归中F检验与t检验等价, 且 但在多元回归中,F检验显著,不一定每个解释变量都对 (见教材P87证明) 但在多元回归中,F检验显著,不一定每个解释变量都对 Y有显著影响。还需要分别检验当其他解释变量保持不变 时,各个解释变量X对被解释变量Y是否有显著影响。 方法: 原假设 (j=1,2,……k) 备择假设 统计量t为:

对各回归系数假设检验的作法 给定显著性水平α,查t分布表的临界值为 如果 就不拒绝 ,而拒绝 就不拒绝 ,而拒绝 即认为 所对应的解释变量 对被解释变量Y的影响不显 著。 就拒绝 而不拒绝 即认为 所对应的解释变量 对被解释变量Y的影响是 显著的。 讨论:在多元回归中,可以作F检验,也可以分别对每个回 归系数逐个地进行 t 检验。 F 检验与t检验的关系是什么?

第四节 多元线性回归模型的预测 1. Y平均值的点预测 一、被解释变量平均值预测 方法:将解释变量预测值代入估计的方程: 多元回归时: 或 第四节  多元线性回归模型的预测 一、被解释变量平均值预测 1. Y平均值的点预测 方法:将解释变量预测值代入估计的方程: 多元回归时: 或 注意: 预测期的 是第一个元素为1的行向量,不是矩 阵,也不是列向量

2. Y平均值的区间预测 ●由于存在抽样波动,预测的平均值 不一定 等于真实平均值 ,还需要对 作区间估计。 基本思想: (与简单线性回归时相同) ●由于存在抽样波动,预测的平均值 不一定 等于真实平均值 ,还需要对 作区间估计。 ●为了对Y作区间预测,必须确定平均值预测值 的抽样分布。 ● 必须找出与 和 都有关的统计量, 并要明确其概率分布性质。 37

区间预测的具体作法 (回顾简单线性回归) 简单线性回归中 当 未知 时,只得用 代替,这时 38

区间预测的具体作法(多元时) 多元回归时,与预测的平均值 和真实平均值 都有关的是二者的偏差 : 服从正态分布,可证明 多元回归时,与预测的平均值 和真实平均值 都有关的是二者的偏差 : 服从正态分布,可证明 用 代替 ,可构造 t 统计量

或者 服从正态分布,可证明 即 标准化 当用 代替 时 ,可构造 t 统计量 40

区间预测的具体作法 给定显著性水平α,查t分布表,得自由度为 n-k的 临界值 ,则 或

二、被解释变量个别值预测 基本思想: (与简单线性回归时相同) ●由于存在随机扰动 的影响,Y的平均值并不等于Y的个别值。 基本思想: (与简单线性回归时相同)   ●由于存在随机扰动 的影响,Y的平均值并不等于Y的个别值。 ●为了对Y的个别值 作区间预测,需要寻找与预测值 和个别值 有关的统计量,并要明确其概率分布性质。

个别值区间预测具体作法 已知剩余项 是与预测值 和个别值 都有关的变量 并且已知 服从正态分布,且多元回归时可证明 已知剩余项 是与预测值 和个别值 都有关的变量 并且已知 服从正态分布,且多元回归时可证明 当用 代替 时,对 标准化的 变量 t 为:

给定显著性水平 ,查t分布表得自由度为 n-k 的临 界值 则  因此,多元回归时Y的个别值的置信度1-α的预测区间的上下限为

第五节 案例分析 研究范围:1978年-2007年全国税收收入 理论分析:为了全面反映中国税收增长的全貌,选择包括 研究的目的要求 第五节 案例分析 研究的目的要求 为了研究影响中国税收收入增长的主要原因,分析中央和地方 税收收入增长的数量规律,预测中国税收未来的增长趋势, 需要建立计量经济模型。 研究范围:1978年-2007年全国税收收入 理论分析:为了全面反映中国税收增长的全貌,选择包括 中央和地方税收的“国家财政收入”中的“各项税收”(简称 “税收收入”)作为被解释变量;选择国内生产总值(GDP) 作为经济整体增长水平的代表;选择中央和地方“财政支出” 作为公共财政需求的代表;选择“商品零售价格指数”作为物 价水平的代表。

年份 税收收入(亿元) (Y) 国内生产总值(亿元) (X2) 财政支出(亿元) (X3) 商品零售价格指数(%) (X4) 1978 519.28 3624.1 1122.09 100.7 1979 537.82 4038.2 1281.79 102.0 1980 571.70 4517.8 1228.83 106.0 1981 629.89 4862.4 1138.41 102.4 1982 700.02 5294.7 1229.98 101.9 1983 775.59 5934.5 1409.52 101.5 1984 947.35 7171.0 1701.02 102.8 1985 2040.79 8964.4 2004.25 108.8 1986 2090.73 10202.2 2204.91 1987 2140.36 11962.5 2262.18 107.3 1988 2390.47 14928.3 2491.21 118.5 1989 2727.40 16909.2 2823.78 117.8 1990 2821.86 18547.9 3083.59 102.1 1991 2990.17 21617.8 3386.62 102.9 1992 3296.91 26638.1 3742.20 105.4

1993 4255.30 34634.4 4642.30 113.2 1994 5126.88 46759.4 5792.62 121.7 1995 6038.04 58478.1 6823.72 114.8 1996 6909.82 67884.6 7937.55 106.1 1997 8234.04 74462.6 9233.56 100.8 1998 9262.80 78345.2 10798.18 97.4 1999 10682.58 82067.5 13187.67 97.0 2000 12581.51 89468.1 15886.50 98.5 2001 15301.38 97314.8 18902.58 99.2 2002 2003 2004 2005 2006 2007 17636.45 20017.31 24165.68 28778.54 34804.35 45621.97 104790.6 135822.8 159878.3 183217.4 211923.5 249529.9 22053.15 24649.95 28486.89 33930.28 40422.73 49781.35 98.7 99.9 102.8 101 103.8

序列Y、X2、X3、X4的线性图 可以看出Y、X2、X3都是逐年增长的,但增长速率有所变动,而且X4在多数年份呈现出水平波动。说明变量间不一定是线性关系,可探索将模型设定为以下对数模型: 注意这里的“商品零售价格指数” (X4)未取对数。

三、估计参数 模型估计的结果为: (0.6397) (0.1355) (0.1557) (0.0055) t= (-4.4538) (3.0420) (4.2788) (2.0856) F=673.7521 df=30

模型检验: 1、经济意义检验: 模型估计结果说明,在假定其它变量不变的情况下,当年GDP每增长1%,税收收入会增长0.4123%;当年财政支出每增长1%,平均说来税收收入会增长0.6664%;当年商品零售价格指数上涨一个百分点,平均说来税收收入会增长0.0115%。这与理论分析和经验判断相一致。 2、统计检验: 拟合优度: , 表明样本回归方程较好地拟合了样本观测值。 F检验:对 已得到 F =673.7521,给定 查表得自由度k-1=3和n-k=26的临界值: ,因为 F=673.7521> ,说明模型总体上显著,即“国内生产总值”、“财政支出”、“商品零售价格指数”等变量联合起来确实对“税收收入”有显著影响。 50

t 检验 分别针对 ,给定显著性水平 , 查t分布表得自由度为n-k=21的临界值 。 由回归结果已知与 、 、 、 对应的t值分别为: 分别针对 ,给定显著性水平 , 查t分布表得自由度为n-k=21的临界值 。 由回归结果已知与 、 、 、 对应的t值分别为: -4.4538、3.0420、4.2788、2.0856,其绝对值均大于 ,这说明在显著性水平 下,分 别都应当拒绝 说明当在其它解释变量不变的情况下,解释变量“国内生 产总值” 、“财政支出” 、“商品零售价格指数” 分 别对被解释变量“税收收入”Y都有显著的影响。

本章小结 1. 多元线性回归模型及其矩阵形式。 2. 多元线性回归模型中对随机扰动项u的假定,除了其他基本假定以外,还要求满足无多重共线性假定。 3. 多元线性回归模型参数的最小二乘估计量;在基本假定满足的条件下,多元线性回归模型最小二乘估计式是最佳线性无偏估计量。 4. 多元线性回归模型中参数区间估计的方法。

5. 多重可决系数的意义和计算方法,修正可决系数的作用和方法。 6. 对多元线性回归模型中所有解释变量联合显著性的F检验。 7. 多元回归分析中,对各个解释变量是否对被解释变量有显著影响的t检验。 8. 利用多元线性回归模型作被解释变量平均值预测与个别值预测的方法。

第三章结束了! THANKS 54