第一章.

Slides:



Advertisements
Similar presentations
第6章第6章 内生性和工具变量估计方法. 6.1 内生性 OLS 估计的不一致性 内生性产生的原因 6.2 工具变量估计方法 工具变量估计法 两阶段最小二乘法: TSLS 6.3 内生性检验 重要概念.
Advertisements

第一章 餐饮服务程序 学习目的: 掌握餐饮服务四个基本环节的内容 正确表述和运用各种餐饮形式的服务程序 熟悉并利用所学知识灵活机动地为不同需求的 客人提供服务.
制作:张大远 逯遥 指导教师:司书红 学校:兰州交通大学
窦娥冤 关汉卿 感天动地 元·关汉卿.
第五章 主张超尘绝俗的 佛家.
计量经济学 第五章 异 方 差 性.
Svm基本知识与原理 张立新.
張偉豪 三星統計服務有限公司 執行長 Amos 亞洲一哥
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
數據挖掘 課程 王海 深圳國泰安教育技術股份有限公司.
Chapter 15 複迴歸.
双变量关联性分析.
知其不可而为之.
中国画家协会理事、安徽省美术家协会会员、 工艺美术师、黄山市邮协常务理事余承平主讲
第二课 扬起自信的风帆 我能“行”.
Chapter 3 預測.
第二章 语音 第六节 音变 轻 声1.
保良局方王錦全小學 學校健康促進經驗分享    盧淑宜校長.
石家庄迅步网络科技有限公司 联系人:张会耀 电话:
汉字的构造.
诵读欣赏 古代诗词三首.
什么是计量经济学? 计量经济学(Econometrics),又译成经济计量学,是1926年挪威经济学家R. Frish仿照生物计量学(Biometrics)一词首先提出来的,它的提出标志着计量经济学的诞生。 但是,人们一般认为,1930年12月29日世界计量经济学会成立和由它创办的学术刊物Econometrica于1933年正式出版,才标志着计量经济学作为一个独立的学科正式诞生了。
11. Pearson’s Correlation & Simple Linear Regression
§9.3 线性回归分析 一. 什么是回归分析 相关分析研究变量之间相关的方向和相关的程度,但是相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。 回归分析则是研究变量之间的数量变化规律的一种方法。
多元迴歸 Multiple Regression
基隆市立八斗高中 102 學年度第二學期 402 班『親師座談』
Structural Equation Modeling
贴近教学 服务师生 方便老师.
六年级 语文 下册 第四单元 指尖的世界.
第四章 测试效度及其 验证方法(一) 湖南师范大学外国语学院 邓 杰 教授.
(浙教版)四年级品德与社会下册 共同生活的世界 第四单元 世界之窗 第二课时.
Analysis of Variance 變異數分析
Chapter 2 簡單迴歸模型.
丁 承 國立交通大學經營管理研究所教授 成大統計68級 民國103年6月14日
优化试验设计与数据分析 第五章 回归分析方法 本章主要内容 · 一元线性回归方程度建立、显著性检验、预报和控制。非线性回归方程的线性化。
課程九 迴歸與相關1.
一元线性回归(二).
计量经济学 第三章 多元线性回归模型.
多元线性回归分析.
Stochastic Relationships and Scatter Diagrams
第十一章. 簡單直線迴歸與簡單相關 Simple Linear Regression and Simple Correlation
十一、簡單相關與簡單直線回歸分析(Simple Correlations and Simple Linear Regression )
簡單迴歸模型的基本假設 用最小平方法(OLS-ordinary least square)找到一個迴歸式:
第14章 迴歸分析與複迴歸分析  本章的學習主題 
计量软件实验:EViews软件应用 基本回归模型.
Chapter 14 Simple Linear Regression
计量经济学 第二章 简单线性回归模型.
Learning Polynomials 台大生機系 方煒.
楊志強 博士 多變量分析在測驗暨量表編製之應用 楊志強 博士
線性一階微分方程與尤拉法 線性一階微分方程式求解 (Linear First-Order Differential Equations)
主講人 陳陸輝 特聘研究員兼主任 政治大學 選舉研究中心
多元迴歸分析.
第四章 测试效度及其 验证方法(一) 湖南师范大学外国语学院 邓 杰 教授.
拟合优度(或称判定系数、决定系数) 目的:企图构造一个不含单位,可以相互进行比较,而且能直观判断拟合优劣的指标。 拟合优度的定义:
庄文忠 副教授 世新大学行政管理学系 相关分析与简单回归分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2019/4/7.
Liner regression analysis
迴歸分析 行銷、財務、人資研究.
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 6 主讲人 陶育纯 医学统计学方法 6 主讲人 陶育纯 流行病与卫生统计学教研室
課程十 迴歸3.
Simple Regression (簡單迴歸分析)
高中 E 形象 數位果子科技有限公司 程建嘉.
第7章 回归分析.
社会研究方法 第7讲:社会统计2.
第二章 经典线性回归模型: 双变量线性回归模型
第 四 章 迴歸分析應注意之事項.
第五章 比率估计与回归估计 (ratio estimator and regression estimator)
Xián 伯 牙 绝 弦 安徽淮南市八公山区第二小学 陈燕朵.
Multiple Regression: Estimation and Hypothesis Testing
数据挖掘 DATA MINING 刘 鹏 张 燕 总主编 王朝霞 主编 施建强 杨慧娟 陈建彪 副主编
簡單迴歸分析與相關分析 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2019/8/3.
Presentation transcript:

第一章

第 10 章 簡單線性迴歸: 最小平方法

本章綜覽 變異數分析不適合用來說明當某變數變動一單位時,另一變數變動的情形。本章將介紹另一種方法:迴歸分析 (regression analysis)。 迴歸分析: 以數學和統計方法來確認一組變數中的系統性部分,並依此解釋過去的現象和預測未來。 介紹單一變數的簡單線性迴歸模型 (simple linear regression model)、最小平方法及其代數性質、衡量迴歸模型好壞的配適度指標等。

簡單線性迴歸模型 簡單線性迴歸模型:利用一個線性模型來捕捉 {(Xi,Yi),i=1,..,n} 這組雙變量隨機變數中 Yi 的系統性部分g(Xi)。 利用條件均數:E(Y|X ) = g(X)=α+βX, 其中α,β為未知參數,需要我們去估計。 可以將 Y 表示為 Y = α+βX + U, 其中 U 代表不能由 α+βX 所描述的 Y 行為,亦即 Y 與線性模型之間的誤差。

簡單線性迴歸模型 迴歸模型中的變數 Y 稱作應變數 (dependent variable 或 regressand) 變數 X 稱作解釋變數 (explanatory variable 或 regressor)。 參數 α 和 β 稱作迴歸係數 (regression coefficient)。 α: 截距項, β: 斜率。 線性迴歸中的「線性」二字是指模型為參數 (而非變數) 的線性函數。 α+βX2 , α+βlogX 是線性迴歸模型。 α+ X β不是線性迴歸模型。

最小平方法 估計迴歸係數最常用的方法之一就是普通最小平方(ordinary least squares) ,又簡稱為最小平方法。 最小平方法的「認定條件」是: Xi , i=1,2,…,n 之值不為常數。 除了上述認定條件之外,本章亦不對 (Xi, Yi) 的隨機機制作任何限制。

最小平方法 找α 和 β 使模型誤差 Ui 的平方和極小。採用誤差平方和是為了避免正負誤差之間互相抵銷。 目標函數如下: 最小平方法所找的就是使誤差平方和 (或其平均) 最小的那條直線。 如果目標函數改變 (如 Ui 的絕對值之和),就會產生不同的迴歸線。

簡單線性迴歸模型 Y X 可能的迴歸線 誤差

最小平方法 為使目標函數之值最小,必須解出以下的一階條件 (first order condition)。 這兩個一階條件又稱作標準方程式 (normal equations)。

最小平方法 可從標準方程式中求出 α 和 β 的解,稱作最小平方估計式 (ordinary least squares estimator,簡稱 OLS estimator),一般以 若 Xi 為常數, ,則 根本無法計算,這是為什麼需要「認定條件」的原因。

最小平方法 將最小平方估計式 代入設定的線性模型就可得到一條截距為 ,斜率為 的直線, 稱作估計的迴歸線 (estimated regression line)。 斜率係數估計式 衡量 X 的邊際效果:當 X 變動一單位時,估計的迴歸線會預測應變數 Y 將變動 個單位。 截距係數 則表示當 X 為 0 時,估計的迴歸線所預測的應變數 Y 。 將樣本中的變數 Xi 代入估計的迴歸線,即可求得估計的應變數。

最小平方法 應變數 Yi 與估計所得到的應變數 之間的差距稱為最小平方法的第 i 個殘差 (residual)。 估計的應變數之實現值稱為配適值 (fitted value),殘差的實現值稱為殘差值 (residual value)。

最小平方法的代數性質 在 Yi=α+βXi+Ui 的典型模型設定下,最小平方法的殘差具有以下三種性質: 以上的三條式子為一階條件的結果。 在典型模型設定下,給定一組樣本觀察值之後,估計的迴歸線必然通過 這一點。

簡單線性迴歸模型之比較

配適度的衡量 不同的解釋變數可能都適合描述應變數 Y 的系統性部分。如果可以衡量迴歸線的配適度(goodness of fit),就可以選擇配適度較高的迴歸線來描述應變數的系統性部分。所以配適度的衡量指標就可以作為比較不同迴歸模型的基準。 例如:用坪數來解釋房價的配適度比用房間數來解釋房價的配適度高時,則前者是比較好的模型。

配適度的衡量-- 平方和的分解 以下為不受資料衡量單位影響的配適度指標的推導過程: 上式中第一項稱為總平方和 (TSS),第二項為迴歸平方和 (RSS),第三項為殘差平方和 (ESS)。

配適度的衡量-- 平方和 總平方和: 應變數 Yi 在樣本平均數周圍之總變動量。 殘差平方和: 最小平方法殘差的總變動量,即是迴歸模型無法捕捉的變動量。

配適度的衡量-- 自由度 由於總平方和的計算中用到了樣本平均數,等於在資料中加了一個限制條件, 故總平方和的自由度為 n-1。 總平方和自由度與殘差平方和自由度之差即為迴歸平方和之自由度,此處為 1。

配適度的衡量-- 判定係數 判定係數(coefficient of determination):線性迴歸中最常用的配適度指標。它衡量迴歸模型所能捕捉的變動量佔 Yi 總變動量中的比例,通常以 R2 來代表。 判定係數又分成置中的與非置中的判定係數兩種。

配適度的衡量-- 判定係數的性質 R2 愈高代表迴歸模型所能捕捉到應變數的變動量佔總變動量的比例愈高,故配適度較佳。 當 R2=1,迴歸平方和等於總平方和,此時迴歸模型沒有任何殘差,稱作完全配適 (perfect fit)。 當 R2=0 ,殘差平方和等於總平方和,此時迴歸模型對應變數並無任何解釋能力。 若欲利用判定係數來比較不同模型的配適能力,這些模型必須有相同的應變數。

配適度的衡量-- 判定係數的性質 Yi 的位置和比例變動均不會影響置中的判定係數。 Xi 單獨的變動對置中的或非置中的判定係數均無影響。 計算簡單線性迴歸模型的配適度也就是衡量應變數與解釋變數之間的線性關聯度。

實例分析 欲分析廣告費用 (X) 如何影響公司的營業額 (Y)。取得一組 10 家公司的年營業額和年度廣告費用的樣本資料如右表。

實例分析 設立模型為有截距項的迴歸模型,則

實例分析 下圖為估計的迴歸線圖,可驗證估計的迴歸線確實通過平均值的 (11.17,62.5)。

實例分析 根據估計的迴歸線也可以計算出配適值與殘差值。

實例分析 當公司年營業額與年度廣告費用增加或衡量單位改變時, 利用最小平方法所得到的估計值與置中的判定係數綜合於下表。 不論資料發生位置變動或比例改變,置中的判定係數都不受影響。