Linear Regression 一元线性回归分析.

Slides:



Advertisements
Similar presentations
实用农业科技写作 王鹏文. 第一章 导论 第一节 农业科技写作概述 一 、 农业科技写作概念和分类: 科技文献类、科技应用类、 科技普及类、科技新闻类 二、 农业科技写作的意义和重要性: 科技工作的重要组成部分、科学研究的手段、 科技成果的反映和标志、科技交流的工具 三、 农业科技写作的特点 : 功利性与及时性、科学性与先进性、读者的专门性与狭隘性、
Advertisements

新课程引领 实践中前行 —— 蓟县初中信息技术三年课改总结. 自从 2005 年秋季我市进入基础教育新一 轮课程改革实验以来,在市教研室的正 确领导下,我县初中信息技术课改工作 稳步推进。三年来,取得了一些成果, 也有不少体会。现将三年来的信息技术 课改工作总结如下。
河南省基础教育资源网 邓伟鹏 二〇一二年七月 内容大纲 1. 培训平台的目的 2. 培训平台介绍 3. 培训平台功能 4. 培训工作建立流程 5. 培训门户 6. 在线学习 6.1 课程学习 6.2 在线考试 7. 培训考试管理 7.1. 课程管理 7.2 必修学习班建立 7.3 在线考试管理 7.4.
佛山 佛山简称 “ 禅 ” ,是一座历史悠久的文化 名城,是中华人民共和国广东省下辖的一 个地级市, 1951 年 6 月 26 日成立。这里是黄 飞鸿、李小龙的故乡,是珠三角的经济重 地,一个荣耀千年的商贸名城,用生生不 息的陶都圣火锻造出 “ 敢为人先,崇文务实 ” 的城市。 卷首语目录尾页.
桐乡市地方税务局 2013 年度社会保险费汇算清缴有 关政策及事项说明. 一、政策规定 根据《中华人民共和国社会保险法》、《桐乡市社会保险费征缴管 理办法》(市政府令第 42 号)、《 关于完善社会保险费征缴管理有关问 题的通知》(桐政办发 [2012]152 号)及《关于完善社会保险费征缴管理.
商管群科科主任 盧錦春 年 3 月份初階建置、 4 月份進階建置、 5 月份試賣與對外營業。
第七章 求职方法和技巧 (二) 主讲人:谭琳. 第一节 自荐 一、目前常见的自荐种类 1 .口头自荐 1 .口头自荐 2 .书面自荐 2 .书面自荐 3 .广告自荐 3 .广告自荐 4 .学校推荐 4 .学校推荐 5 .他人推荐 5 .他人推荐.
第二章 中药药性理论的现代研究 掌握中药四性的现代研究 掌握中药五味的现代研究 掌握中药毒性的现代研究 了解中药归经的现代研究.
第二節 戲劇、通俗文學 與大眾生活.
第四單元 通電的玩具 張老師的網頁.
制作:张大远 逯遥 指导教师:司书红 学校:兰州交通大学
NO.005 職涯 報 實習 徵才 攻讀 國立嘉義大學 學生事務處學生職涯發展中心.
國中教育會考 十二年國教—免試入學 及 意見整理.
两汉文学及汉代诗歌.
近现代文学概说.
參與除權(息)是否能獲利— 以台灣125家上市公司為例
解析几何 空间直角坐标系 阜宁县东沟中学高一数学组.
國有公用財產產籍管理法規及實務 財政部國有財產局 劉芸真.
古今生活大對照 迦密愛禮信小學 六信  尹嘉豪.
健康的社會人口學:性別、年齡與種族 姓名: 黃培瑜 4HE 陳麗媖 4HE 蔡依潔 4HE
迴歸分析與軟體應用 林 國 欽 博士 商學與管理研究所 台南科技大學.
严格标准 规范程序 认真做好党员发展工作.
薪資申報系統操作說明.
商学院 旅游管理专业介绍.
 历史以人类的活动为特定的对象,它思接万载,视通万里,千恣百态,令人销魂,因此它比其他学科更能激发人们的想像力。    
欢迎各位老师莅临指导! 高中一年级生物 授课人:刘敏 授课班级:C332.
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
双变量关联性分析.
应用回归分析 信计学院统计系 沈菊红.
國有土地管理與運用問題之探討 主講人: 廖 蘇 隆 中華民國100年10月17 日.
™ 全球,唯一支持第三方自动部署的交易系统 中国产权交易所有限公司 二〇一四年十月 超级交易系统V1.0
『臺北市營建剩餘資源管理系統』 教育訓練說明 臺北市政府 報告人 王宏正
新阳企业管理系统(标准版)简介 福州鼎瀚软件有限公司 2017/3/15.
第五章 各类园林绿地的规划设计.
周 瑜 與 諸 葛 亮 的 才 智 對 口 編輯:Francis Lin 請點滑鼠換頁.
“深入推进依法行政加快建设法治政府” -《法治政府建设实施纲要》解读
上海文会会计师事务所有限公司 中国注册会计师 童幸义
§9.3 线性回归分析 一. 什么是回归分析 相关分析研究变量之间相关的方向和相关的程度,但是相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。 回归分析则是研究变量之间的数量变化规律的一种方法。
统计学导论.
第六节 可降阶的二阶微分方程 一、 型的微分方程 二、 型的微分方程 三、 型的微分方程.
孔子教育思想的现实思考 陈丰辉.
我的過動人生 圖.文: 吳沁婕.
妈妈我爱你 你总说我还不懂事 维护我像一张白纸 你眼中我永远是长不大的孩子 虽然我有好多心事 却已不愿说与你知 我曾任性地排斥你爱我的方式
申請土地徵收注意事項 內政部地政司 邱于蓉.
契約 課程:文書實務與應用 教師:黃湃翔老師.
Chapter 2 簡單迴歸模型.
Stochastic Relationships and Scatter Diagrams
第十一章. 簡單直線迴歸與簡單相關 Simple Linear Regression and Simple Correlation
十一、簡單相關與簡單直線回歸分析(Simple Correlations and Simple Linear Regression )
簡單迴歸模型的基本假設 用最小平方法(OLS-ordinary least square)找到一個迴歸式:
Chapter 14 Simple Linear Regression
第六章 相关与回归分析 学习目的和要求 学习重点 学习难点 教学方法 授课时数 基本内容.
奢侈稅成效分析與房市未來發展 吳中書 中華經濟研究院 第十九屆亞太財務經濟會計及管理會議 ~07.09.
第四章 相关分析与回归分析 4.1 简单相关分析 4.2 回归分析 4.3 非线性回归.
Liner regression analysis
第七章 相关与回归分析 第一节 相关与回归分析的基本概念 第二节 简单线性相关与回归分析 第三节 多元线性相关与回归分析
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 6 主讲人 陶育纯 医学统计学方法 6 主讲人 陶育纯 流行病与卫生统计学教研室
办学条件核查 评估秘书组 电力职业技术学院 山西机电职业技术学院 2014年7月9日.
证书发放工作要点及流程 学院办公室.
低碳 減碳 組員 侯稀云 劉曉彤 王兆昇.
第十四章 迴歸.
Correlation using EXCEL
怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 (项目经费适用)
成本会计学.
簡單線性迴歸 在研讀完本章之後,您應當能夠了解與熟悉: CHAPTER 11 目標 1.繪製散佈圖(Scatter Diagram)。
保變住開發要點 資料來源:台北市政府都發局.
第十一章 基因、遗传与优生伦理 第一节 基因伦理 第二节 遗传与优生.
選舉軟體簡介 民眾服務與行程管理系統 深耕與經營.
簡單迴歸分析與相關分析 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2019/8/3.
6 分析資料-以統計測量數呈現.
Presentation transcript:

Linear Regression 一元线性回归分析

函数关系 (几个例子)  函数关系的例子 某种商品的销售额y与销售量x之间的关系可表示为 y = px (p 为单价) 圆的面积S与半径之间的关系可表示为S=R2 企业的原材料消耗额y与产量x1 、单位产量消耗x2 、原材料价格x3之间的关系可表示为 y = x1 x2 x3

相关关系(correlation) 变量间关系不能用函数关系精确表达 一个变量的取值不能由另一个变量唯一确定 当变量 x 取某个值时,变量 y 的取值可能有几个 各观测点分布在直线周围  x y

相关关系(几个例子)  相关关系的例子 父亲身高y与子女身高x之间的关系 收入水平y与受教育程度x之间的关系 粮食亩产量y与施肥量x1 、降雨量x2 、温度x3之间的关系 商品的消费量y与居民收入x之间的关系 商品销售额y与广告费支出x之间的关系

散点图(scatter diagram) 完全正线性相关   完全负线性相关  非线性相关  正线性相关  不相关  负线性相关

正相关 负相关

当所有的点都分布在一条直线上时,两变量之间的关系为完全相关。 完全负相关 完全正相关

两个变量之间是否相关,要有充分的理论依据,并排除共变因素的影响。 散点的分布没有明显集中在某一方向的趋势,形成圆形区域时,两变量之间的关系为零相关。 两个变量之间是否相关,要有充分的理论依据,并排除共变因素的影响。 图7-5 零相关

Origin of the Term “Regression” A paper of Francis Galton, “Regression towards mediocrity in hereditary stature.” Journal of the Anthropological Institute, 1886, 15: 246 – 263 Sir Francis Galton (1822-1911)

Origin of the Term “Regression” Data on Heights of Children and Parents

Origin of the Term “Regression”

Origin of the Term “Regression” Conclusion: The heights of the children tended to be more moderate than the heights of their parents. If parents were very tall the children tended to be tall but shorter than their parents. If parents were very short the children tended to be short but taller than their parents were. This discovery he called “regression to the mean”.

一元线性回归 变量y和变量x之间存在线性相关关系 研究其中一个变量(x)对另一个变量(y)的影响 目的:通过 x 对 y 进行估计或预测 因变量 (随机变量) X Y y 自变量 (数学变量) x

线性函数关系 线性方程 截距 斜率 x 每改变一个单位,y 改变 b 个单位 对于x 的每一特定取值,y都有一个确定的值与之对应! y Y

线性回归模型(简单回归模型) x 每改变一个单位,可期望 y 改变个单位 截距 回归系数  回归参数

线性回归模型(简单回归模型) 对于x 的每一特定取值,y 都有一个服从正态分布的取值范围与之对应 !

回归方程的建立 对于给定的样本数据,寻找一条与所有散点都最为接近的直线

回归方程 ei x y 预测值 预测误差 观测值 寻找直线 ,使得总的预测误差最小

最小二乘法(least square method) 求a和b,使得预测误差平方和达到最小 预测误差平方和: 利用求函数极值的方法求a和b

回归系数 正规方程组

回归系数 解正规方程组,得: (与样本相关系数相比较!) 回归方程:

Excel 应用 斜率:Slope 截距:Intercepte 相关系数: Correl

回归的显著性检验 相关系数检验法 (R.A.Fisher) 对回归方程的检验 - 检验 y 对 x 的回归关系是否成立 要检验的假设: H0: =0 HA: ≠0 相关系数检验法 (R.A.Fisher)

相关系数 correlation coefficient 对变量之间关系密切程度的度量 对两个变量之间线性相关程度的度量称为简单相关系数 若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 若是根据样本数据计算的,则称为样本相关系数,记为 r

相关系数 (计算公式)  样本相关系数的计算公式 或化简为

相关系数 (取值及其意义) r 的取值范围是 [-1,1] |r|=1,为完全相关 r = 0,不存在线性相关关系

r 相关系数 (取值及其意义) -1.0 +1.0 -0.5 +0.5 完全正相关 完全负相关 无线性相关 负相关程度增加 正相关程度增加 -0.5 +0.5 r 负相关程度增加 正相关程度增加 139

相关系数的显著性检验

相关系数的显著性检验 ( r 的抽样分布) 1. r 的抽样分布随总体相关系数和样本容量的大小而变化 当样本数据来自正态总体时,随着n的增大,r 的抽样分布趋于正态分布,尤其是在总体相关系数很小或接近0时,趋于正态分布的趋势非常明显。而当远离0时,除非n非常大,否则r的抽样分布呈现一定的偏态。 当为较大的正值时,r 呈现左偏分布;当为较小的负值时,r 呈现右偏分布。只有当接近于0,而样本容量n很大时,才能认为r是接近于正态分布的随机变量

相关系数的显著性检验 (检验的步骤) 1. 检验两个变量之间是否存在线性相关关系 等价于对回归系数 b1的检验 1. 检验两个变量之间是否存在线性相关关系 等价于对回归系数 b1的检验 采用R.A.Fisher提出的 t 检验 检验的步骤为 提出假设:H0:   ;H1:   0 计算检验的统计量: 确定显著性水平,并作出决策 若t>t,拒绝H0 若t<t,不能拒绝H0

相关系数的显著性检验 (例题分析)  对不良贷款与贷款余额之间的相关系数进行显著性检(0.05) 提出假设:H0:   ;H1:   0 计算检验的统计量 3. 根据显著性水平=0.05,查t分布表得t(n-2)=2.0687 由于t=7.5344>t(25-2)=2.0687,拒绝H0,不良贷款与贷款余额之间存在着显著的正线性相关关系

相关系数的显著性检验 (例题分析) 各相关系数检验的统计量

The End

简单回归 总体回归系数 (与总体相关系数相比较!) 直线 的性质:

简单回归 回归的显著性检验 对回归方程的检验 - F检验 检验Y对X的回归关系是否成立 要检验的假设: H0: =0 HA: ≠0

简单回归 (X,Y) X Y 变异的剖分

总平方和SST=误差平方和SSE +回归平方和SSR 简单回归 平方和的剖分: 总平方和SST=误差平方和SSE +回归平方和SSR 自由度的剖分: 回归自由度 误差自由度

简单回归 回归平方和的计算:

简单回归 F 检验(cont.) 检验统计量 (与对相关系数的F检验相比较!)

简单回归 对回归系数检验 - t 检验 检验总体回归系数是否为0 H0: =0 HA: ≠0 检验统计量: E(b) = ? Sb = ?

简单回归 b 是  的无偏估计量 注:a 也是 的无偏估计量

简单回归

简单回归 t检验 注:对  也可用同样的方法检验

简单回归 回归方程的拟合度-决定系数 用于比较不同回归方程的拟和好坏

简单回归 X对Y的回归 问题:可以用回归方程 来估计X吗?

相关与回归的区别与联系 区别 两个变量的地位 用途 相关系数与回归系数的取值范围 相关系数与回归系数的单位

相关与回归的区别与联系 联系 相关系数与回归系数的计算公式 或 显著性检验 相关平方和等于回归平方和 相关和回归的检验是等价的!

进行相关和回归分析应注意的问题 要有生物学意义 必须经过显著性检验 显著性与强弱性是不同的概念 注意非线性关系存在的可能性 不能随意地将由样本得出的结果外延

The End 作业:Page 154 17