第7章 回归分析.

Slides:



Advertisements
Similar presentations
四川财经职业学院会计一系会计综合实训 目录 情境 1.1 企业认知 情境 1.3 日常经济业务核算 情境 1.4 产品成本核算 情境 1.5 编制报表前准备工作 情境 1.6 期末会计报表的编制 情境 1.2 建账.
Advertisements

主编:邓萌 【点按任意键进入】 【第六单元】 教育口语. 幼儿教师教育口 语概论 模块一 幼儿教师教育口语 分类训练 模块二 适应不同对象的教 育口语 模块三 《幼儿教师口语》编写组.
第一組 加減法 思澄、博軒、暐翔、寒菱. 大綱 1. 加減法本質 2. 迷思概念 3. 一 ~ 七冊分析 4. 教材特色.
海南医学院附 院妇产科教室 华少平 妊娠合并心脏病  概述  妊娠、分娩对心脏病的影响  心脏病对妊娠、分娩的影响  妊娠合病心脏病的种类  妊娠合并心脏病对胎儿的影响  诊断  防治.
植树节的由来 植树节的意义 各国的植树节 纪念中山先生 植树节的由来 历史发展到今天, “ 植树造林,绿化祖国 ” 的热潮漫卷 了中华大地。从沿海到内地,从城市到乡村,涌现了多少 造林模范,留下了多少感人的故事。婴儿出世,父母栽一 棵小白怕,盼望孩子和小树一样浴光吮露,茁壮成长;男 女成婚,新人双双植一株嫩柳,象征家庭美满,幸福久长;
客户协议书 填写样本和说明 河南省郑州市金水路 299 号浦发国际金融中 心 13 层 吉林钰鸿国创贵金属经营有 限公司.
浙江省县级公立医院改革与剖析 马 进 上海交通大学公共卫生学院
第二章 环境.
教师招聘考试 政策解读 讲师:卢建鹏
了解语文课程的基本理念,把握语文素养的构成要素。 把握语文教育的特点,特别是开放而有活力的语文课程的特点。
北台小学 构建和谐师生关系 做幸福教师 2012—2013上职工大会.
福榮街官立小學 我家孩子上小一.
第2期技職教育再造方案(草案) 教育部 101年12月12日 1 1.
企业员工心态管理培训 企业员工心态管理培训讲师:谭小琥.
历史人物的研究 ----曾国藩 组员: 乔立蓉 杜曜芳 杨慧 组长:马学思 杜志丹 史敦慧 王晶.
教育部高职高专英语类专业教学指导委员会 刘黛琳 山东 • 二○一一年八月
淡雅诗韵 七(12)班 第二组 蔡聿桐.
第七届全国英语专业院长/系主任高级论坛 汇报材料
小數怕長計, 高糖飲品要節制 瑪麗醫院營養師 張桂嫦.
制冷和空调设备运用与维修专业 全日制2+1中等职业技术专业.
会计信息分析与运用 —浙江古越龙山酒股份有限公司财务分析 组员:2006级工商企业管理专业 金国芳 叶乐慧 魏观红 徐挺挺 虞琴琴.
第六章 人体生命活动的调节 人体对外界环境的感知.
芹菜 英语051班 9号 黄秋迎 概论:芹菜是常用蔬菜之一,既可热炒,又能凉拌,深受人们喜爱。近年来诸多研究表明,这是一种具有很好药用价值的植物。 别名:旱芹、样芹菜、药芹、香芹、蒲芹 。 芹菜属于花,芽及茎类。
2012年 学生党支部书记工作交流 大连理工大学 建工学部 孟秀英
1、什么是预算会计? 2、预算会计的组成体系? 3、预算会计的要素和会计等式? 4、预算会计的特点?
北京市职业技能鉴定管理中心试题管理科.
2014吉林市卫生局事业单位招聘153名工作人员公告解读
各類所得扣繳法令 與申報實務 財政部北區國稅局桃園分局 103年9月25日
初級游泳教學.
爱国卫生工作的持续发展 区爱卫办 俞贞龙.
第八章 数学活动 方程组图象解法和实际应用
本课内容提要 一、汇率的含义 二、汇率变化与币值的关系 三、汇率变化的影响. 本课内容提要 一、汇率的含义 二、汇率变化与币值的关系 三、汇率变化的影响.
散文鉴赏方法谈.
比亚迪集成创新模式探究 深圳大学2010届本科毕业论文答辩 姓名:卓华毅 专业:工商管理 学号: 指导老师:刘莉
如何撰写青年基金申请书 报 告 人: 吴 金 随.
点击输 入标题 点击输入说明性文字.
國際志工海外僑校服務 越南 國立臺中教育大學 2010年國際志工團隊.
痰 饮.
學分抵免原則及 學分抵免線上操作說明會.
教 学 查 房 黄宗海 南方医科大学第二临床医学院 外科学教研室.
评 建 工 作 安 排.
“十二五”国家科技计划经费管理改革培训 概预算申报与审批 国家科学技术部 2012年5月.
“十二五”国家科技计划经费管理改革培训 概预算申报与审批 国家科学技术部 2012年5月.
首都体育学院 武术与表演学院 张长念 太极拳技击运用之擒拿 首都体育学院 武术与表演学院 张长念
现行英语中考考试内容与形式的利与弊 黑龙江省教育学院 于 钢 2016, 07,黄山.
第5讲:比较安全学的创建 吴 超 教授 (O)
彰化縣西勢國小備課工作坊 新生入學的班級經營 主講:黃盈禎
重庆市西永组团K标准分区基本情况介绍.
西貢區歷史文化 清水灣 鍾礎營,楊柳鈞,林顥霖, 譚咏欣,陳昭龍.
所得稅扣繳法令與實務 財政部北區國稅局桃園分局 102年12月19日 1 1.
角 色 造 型 第四章 欧式卡通造型 主讲:李娜.
走进校园流行 高二15班政治组 指导老师:曾森治老师.
医院文化建设 广东省中医院 2011年3月26日.番禺.
案例:海底捞模式 ——把服务做到极致.
儿科护理 说课 李国琴.
职称:***(博导、教授、副教授、讲师) 团队:***教授的知识创新(服务、传授)团队
致亲爱的同学们 天空的幸福是穿一身蓝 森林的幸福是披一身绿 阳光的幸福是如钻石般耀眼 老师的幸福是因为认识了你们 愿你们努力进取,永不言败.
增值评价 2014级 初中起点报告 解读培训 辽宁省基础教育质量监测与评价中心.
学习风格差异.
第二章 市场营销调查与预测.
第五章 营销调研和预测.
课标教材下教研工作的 实践与思考 山东临沂市教育科学研究中心 郭允远.
第十二章 线性回归.
第 四 章 迴歸分析應注意之事項.
第五章 比率估计与回归估计 (ratio estimator and regression estimator)
两个变量的线性相关 琼海市嘉积中学 梅小青.
线性回归.
講題 :課程發展委員會的組織與運作機制 主講人:臺北市立明倫高中 教務主任王文珠.
第八章 服務部門成本分攤.
第 1 章 單一預測變數線性迴歸.
Presentation transcript:

第7章 回归分析

第一节、回归分析意义 第二节、回归分析的种类 第三节、相关分析与回归分析的关系 第四节、一元线性回归分析 第五节、估计标准误差

“回归”名称产生的背景 回归分析的基本思想和方法以及“回归”名称的由来归功于英国统计学家F.Galton 、K.Pearson(皮尔森)等学者的工作。 他们在研究父母身高与其子女身高的关系时发现(样本量1078对夫妇),以每对夫妇的身高为x,子女的身高为y,将结果绘制成散点图,发现趋于一条直线, y=33.73+0.516x 表明父母平均身高每增加一个单位与其子女身高也平均增加0.516个单位.

结果表明虽然高个子父母生高个子儿子的趋势,但母辈增高1 个单位,儿子身高仅增加半个单位.平均来说一群高个子的父母的儿子低于他们父辈的平均高度.他们儿子身高没有比他们更高,高个子的父母的平均身高一部分被他们的子代拉了回来 ,即子代的平均高度向中心回归了. 低个了父母的儿子虽然为低个子,平均身高高于他们父辈, 低个子的父母的平均身高一部分被他们的子代拉了回来一些 ,子代的身高没有比他们父辈更低. 结果没有出现两极分化的现象,在一段相当长的时间内保持了生物学中物种的稳定,为了描述有趣的现象, F.Galton引用了”回归”的词   

第一节、回归的意义 回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。 商品的消费量(y)与居民收入(x)之间的关系 商品的消费量(y)与物价(x)之间的关系 商品销售额(y)与广告费支出(x)之间的关系 粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系 收入水平(y)与受教育程度(x)之间的关系 父亲身高(y)与子女身高(x)之间的关系

第二节、回归分析的种类 按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。 回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析; 如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。 如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。

回归分析的类型 回归分析 多元回归 一元回归 线性回归 非线性回归 一个自变量 两个及两个以上自变量 This teleology is based on the number of explanatory variables & nature of relationship between X & Y. 24

回归的类型?  x y

(函数关系) (1)是一一对应的确定关系 (2)设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 (3)各观测点落在一条线上  x y

变量间的关系  函数关系的例子 某种商品的销售额(y)与销售量(x)之间的关系可表示为 y = p x (p 为单价) 圆的面积(S)与半径之间的关系可表示为S =  r2 企业的原材料消耗额(y)与产量(x1) 、单位产量消耗(x2) 、原材料价格(x3)之间的关系可表示为y = x1 x2 x3

相关分析与回归分析内容比较 就是用一个指标来表明现象间相互依存关系的密切程度。广义的相关分析包括相关关系的分析(狭义的相关分析)和回归分析。 1.相关分析 是指对具有相关关系的现象,根据其相关关系的具体形态,选择一个合适的数学模型(称为回归方程式),用来近似地表达变量间的平均变化关系的一种统计分析方法。 2.回归分析

第三节、相关分析与回归分析的关系 (一)区别 1、相关分析的任务是确定两个变量之间相关的方向和密切程度。回归分析的任务是寻找因变量对自变量依赖关系的数学表达式。 2、相关分析不必确定两变量中哪个是自变量,哪个是因变量,而回归分析中必须区分因变量与自变量。 3、相关分析中两变量是对等的改变两者的地位,并不影响相关系数的数值,只有一个相关系数。而在回归分析中,互为因果关系的两个变量可以编制两个独立的回归方程。 4、相关分析中两变量可以都是随机的,而回归分析中因变量是随机的,自变量不是随机的。

(二)联系 1、相关分析是回归分析的基础和前提。只有在相关分析确定了变量之间存在一定相关关系的基础上建立的回归方程才有意义。 2、回归分析是相关分析的继续和深化。只有建立了回归方程才能表明变量之间的依赖关系,并进一步进行预测。

(一)相关表:将自变量x的数值按照从小到大的顺序,并配合因变量y的数值一一对应而平行排列的表。

( 二)相关图:又称散点图。将x置于横轴上,y置于纵轴上,将(x,y)绘于坐标图上。用来反映两变量之间相关关系的图形。

第三节 一元线性回归分析 一、一元线性回归方程的建立 二、一元线性回归方程的分析 回答“变量之间是什么样的关系?” 第三节 一元线性回归分析 一、一元线性回归方程的建立 二、一元线性回归方程的分析 回答“变量之间是什么样的关系?” 方程中运用-主要用于预测和估计

一元线性回归分析 从一组样本数据出发,确定变量之间的数学关系式 对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著 利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度

一元线性回归模型 (概念要点) 当只涉及一个自变量时称为一元回归,若因变量 y 与自变量 x 之间为线性关系时称为一元线性回归。 一元线性回归模型 (概念要点) 当只涉及一个自变量时称为一元回归,若因变量 y 与自变量 x 之间为线性关系时称为一元线性回归。 对于具有线性关系的两个变量,可以用一条线性方程来表示它们之间的关系。 描述因变量 y 如何依赖于自变量 x 和误差项的方程称为回归模型。

标准的一元线性回归模型 (一)总体回归函数 Y=a+bX+ut (二)样本回归函数:   y= a+bx+et   et称为残差,在概念上,et与总体误差项ut相互对应;n是样本的容量。

et是因变量的实际值和估计值的离差:当给定X一数值时,y的实际值可以看作由两部分组成: 一部分是X对y均值的线性影响而形成的系统部分,由回归量Y=a+bX来决定; 另一部分是内et所代表的各种偶然因素、观察误差以及被忽略的其他影响因素所带来的随机误差。

(三)总体回归线与随机误差项 Y 。 y ut 。 。 。 。 X 误差项ut是一个期望值为0的随机变量,即E(ut)=0。对于一个给定的 x 值,y 的期望值为 Y y 。 ut 。 。 。 。 X

(四)回归方程 (概念要点) 方程的图示是一条直线,因此也称为直线回归方程 a是回归直线在 y 轴上的截距,是当 x=0 时 y 的期望值 简单线性回归方程的形式如下 方程的图示是一条直线,因此也称为直线回归方程 a是回归直线在 y 轴上的截距,是当 x=0 时 y 的期望值 b是直线的斜率,称为回归系数,表示当 x 每变动一个单位时,y 的平均变动值

居民收入与商品零售额的统计数据如下:(亿元) 年份 居民收入X 商品零售额Y X2 xy 1 12 10 144 120 2 13 169 156 3 14 196 168 4 15 225 195 5 182 6 16 256 224 7 18 324 270 8 20 17 400 340 合计 122 106 1910 1655

建立直线回归方程:(结果保留一位小数) (2)试预测当居民收入增加1亿元时,商品零售额平均增加多少? 建立直线回归方程:(结果保留一位小数)    (2)试预测当居民收入增加1亿元时,商品零售额平均增加多少? (3)试预测当居民收入增加到30亿元时,商品零售额是多少?

公式1

当居民收入增加量每增加1亿元时,社会商品的零售额平均增加0.7778亿元。  Y=1.3385+0.7778x     当居民收入增加量每增加1亿元时,社会商品的零售额平均增加0.7778亿元。

求a和b公式二 a=∑y/n-b∑x/n

例:建立回归方程,并说明其意义?

Y= 22.59+0.5301x 上式表示人口增加量每增加(或减少)1千人,该种食品的年需求量平均来说增加(或减少)0.5301十吨即5.301吨。

练习: 下面的数据是产品广告费与销售额的关系 1、建立回归方程。 2、试预测当广告费增加1万元时,年销售额平均增加多少? 3、试预测当广告费增加到50万元时,年销售 额是多少?

某大型电器公司广告费与销售额数据

一元回归:自变量-广告费

第五节、估计平均误差 回归方程的一个重要作用在于根据自变量的已知值估计因变量的可能值。这个估计值和真正的实际值可能一致,也可能不一致。 例如,当居民收入增加量每增加1亿元时,社会商品的零售额平均增加0.7778亿元。人口增加量每增加(或减少)1千人,该种食品的年需求量平均来说增加(或减少)0.5301十吨即5.301吨。 回归方程的可靠性问题如何?也就是说,根据回归方程计算的估计值,其代表性如何?

为了度量估计公式即回归方程的可靠性,通常计算估计平均误差。估计平均误差度量观察值回绕着回归直线的变化程度或分散程度。通常用Sy代表估计平均误差,其计算公式为: 由总体资料计算或在大样本情况下 由样本资料计算

估计标准误差Sy意义 实际观察值与回归估计值离差平方和的均方根。 反映实际观察值在回归直线周围的分散状况。 从另一个角度说明了回归直线的拟合程度 估计标准误差是说明回归方程代表性大小的统计分析指标。其值小,表明方程代表性大;反之亦然。

计算例子

定义公式 计算公式

上式的推导证明

例:现以前例的资料配合计算 Syx X2 y2 xy 1 12 10 144 100 120 2 13 169 156 3 14 196 年份 居民收入X 商品零售额Y X2 y2 xy 1 12 10 144 100 120 2 13 169 156 3 14 196 168 4 15 225 195 5 182 6 16 256 224 7 18 324 270 8 20 17 400 289 340 合计 122 106 1910 1436 1655

x y (xn , yn) (x1 , y1)  (x2 , y2) (xi , yi) } ei = yi-yi ^

可见,当r越大时, 越小,这时相关密切程度较高,回归直线的代表性就大;反之亦然。

消费行为调查分析报告 消费行为调查分析报告: http://www.dina.com.cn/Report.asp 2008年家用电脑消费行为调查分析报告 http://www.dina.com.cn/ShowReportContent1.asp?ID=450 2008年汽车消费幸福指数测评报告: http://www.dina.com.cn/ShowReportContent4.asp?ID=479 2008年手机消费行为调查分析报告 http://www.dina.com.cn/ShowReportContent1.asp?ID=447

Thank You !