Stochastic Relationships and Scatter Diagrams

Slides:



Advertisements
Similar presentations
制作:张大远 逯遥 指导教师:司书红 学校:兰州交通大学
Advertisements

MINITAB Minitab 培训 Minitab Training.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
计量经济学 第五章 异 方 差 性.
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
數據挖掘 課程 王海 深圳國泰安教育技術股份有限公司.
Chapter 15 複迴歸.
双变量关联性分析.
第七章 多變數微積分 課程目標 多變數函數 偏微分 多變數函數的極值 受制型極值與拉氏乘子法 最小平方法 全微分 二重積分.
國立中正大學勞工研究所 黃良志 副教授 中 華 民 國 九 十 四 年 九 月
生物統計與SAS軟體課程教學(三) 雙變項統計分析(一)
什么是计量经济学? 计量经济学(Econometrics),又译成经济计量学,是1926年挪威经济学家R. Frish仿照生物计量学(Biometrics)一词首先提出来的,它的提出标志着计量经济学的诞生。 但是,人们一般认为,1930年12月29日世界计量经济学会成立和由它创办的学术刊物Econometrica于1933年正式出版,才标志着计量经济学作为一个独立的学科正式诞生了。
多變量分析 Multivariant Analysis
11. Pearson’s Correlation & Simple Linear Regression
§9.3 线性回归分析 一. 什么是回归分析 相关分析研究变量之间相关的方向和相关的程度,但是相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。 回归分析则是研究变量之间的数量变化规律的一种方法。
多元迴歸 Multiple Regression
Structural Equation Modeling
第四章 测试效度及其 验证方法(一) 湖南师范大学外国语学院 邓 杰 教授.
Euler’s method of construction of the Exponential function
Analysis of Variance 變異數分析
Chapter 2 簡單迴歸模型.
丁 承 國立交通大學經營管理研究所教授 成大統計68級 民國103年6月14日
Differential Equations (DE)
优化试验设计与数据分析 第五章 回归分析方法 本章主要内容 · 一元线性回归方程度建立、显著性检验、预报和控制。非线性回归方程的线性化。
Differentiation 微分 之二 以公式法求函數的微分.
課程九 迴歸與相關1.
一元线性回归(二).
第一章.
多元线性回归分析.
效率與生產力分析研習營 參數計量方法.
衛生署公佈台灣地區約有5000人是屬單腳肢體殘障。已知台灣地區約有2,300萬人口。求台灣地區人民的平均腳數?
第十一章. 簡單直線迴歸與簡單相關 Simple Linear Regression and Simple Correlation
十一、簡單相關與簡單直線回歸分析(Simple Correlations and Simple Linear Regression )
簡單迴歸模型的基本假設 用最小平方法(OLS-ordinary least square)找到一個迴歸式:
非均一性的誤差變異數 and SERIAL CORRELATION
Chapter 14 Simple Linear Regression
楊志強 博士 多變量分析在測驗暨量表編製之應用 楊志強 博士
二元隨機變數(Bivariate Random Variables)
第四章 相关分析与回归分析 4.1 简单相关分析 4.2 回归分析 4.3 非线性回归.
統計方法的概念與應用 一、認識統計(statistics)、測驗(test)、 測量(measurement)與評價(evaluation)
4 統計分析程序的選擇.
主講人 陳陸輝 特聘研究員兼主任 政治大學 選舉研究中心
多元迴歸分析.
第四章 测试效度及其 验证方法(一) 湖南师范大学外国语学院 邓 杰 教授.
检验 Chi-Squared Test Goodness-of-fit Test 拟合优度检验 & Test of Row and Column Independenc 独立性检验 欧阳顺湘 北京师范大学珠海分校.
拟合优度(或称判定系数、决定系数) 目的:企图构造一个不含单位,可以相互进行比较,而且能直观判断拟合优劣的指标。 拟合优度的定义:
Linear Regression 一元线性回归分析.
庄文忠 副教授 世新大学行政管理学系 相关分析与简单回归分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2019/4/7.
MyLibrary ——数字图书馆的个性化服务
导数的应用 ——函数的单调性与极值.
Liner regression analysis
迴歸分析 行銷、財務、人資研究.
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 6 主讲人 陶育纯 医学统计学方法 6 主讲人 陶育纯 流行病与卫生统计学教研室
第捌章 敘述研究法 一、調查研究法(survey method) 二、相關研究法(co relational studies)
課程十 迴歸3.
Simple Regression (簡單迴歸分析)
第 1 章 直線和線性函數.
Correlation using EXCEL
社会研究方法 第7讲:社会统计2.
第二章 经典线性回归模型: 双变量线性回归模型
Q & A.
第 四 章 迴歸分析應注意之事項.
第四章 多组资料均数的比较 七年制医疗口腔《医学统计学》
生物统计学 Biostatistics 第一章 统计数据的收集与整理
Multiple Regression: Estimation and Hypothesis Testing
第 1 章 單一預測變數線性迴歸.
3-3 随机误差的正态分布 一、 频率分布 在相同条件下对某样品中镍的质量分数(%)进行重复测定,得到90个测定值如下:
Part 3 初等統計與理論.
簡單迴歸分析與相關分析 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2019/8/3.
Presentation transcript:

Stochastic Relationships and Scatter Diagrams 如果x與y的關聯分佈圖呈現一近似直線的關係,則我們假設兩者具有以下的線性關係: Slop斜率 X變動ㄧ單位所造成Y相對應的變動 Intercept截距 當X=0時,Y所相對應的值 ©蘇國賢2007

Stochastic Relationships and Scatter Diagrams 截距0 ©蘇國賢2007

Deterministic Relationship and Stochastic Relationships 我們的任務在於估計能夠正確描述X與Y關係的截距0與斜率1。 迴歸分析的目的有四: 將x與y的關係以一種量化的方式來表達Quantify a theory。 檢驗有關於X與Y之間關係的理論Test a theory。 測量X與Y之間的關係強度Measuring the strength of relationships。 在已知X值得條件下對Y作預測Forecasting。 ©蘇國賢2007

Deterministic Relationship and Stochastic Relationships 在Y=f(X)的函數關係中,若每一個x值僅對應於單一的y值,則X, Y之間的關係為完全決定的函數關係,稱為確定模型(deterministic) Deterministic Relationships 電腦每台$960元,X為電腦台數,Y為總收益 ©蘇國賢2007

Deterministic Relationship and Stochastic Relationships 所有的資料點都剛好落在線上 ©蘇國賢2007

Deterministic Relationship and Stochastic Relationships Stochastic Relationships: 若X=xi時,Y值不確定,而是依循某一機率分配,則X, Y之的函數關係稱為 機率模型(stochastic)。 令X為每家庭的年收入,Y為每個家庭每年在育樂上的支出。對於某個特定的值X = xi而言,我們無法準確地預測出對應於Y的單一值,因為除了收入外,還有很多其他因素會影響育樂支出。但是知道一個家庭的年收入有助於我們預測育樂支出,第i個家庭的育樂支出可以用下列機率模型表達: ©蘇國賢2007

Deterministic Relationship and Stochastic Relationships 其中ei為一個隨機變數,使育樂支出高於或低於(13.92+0.76xi)。 也就是說,對於某個特定的xi值而言,其相對應的可能Y值具有某種機率分配。 ei代表除了家庭收入外,所有其他因素對育樂支出造成的影響。 ©蘇國賢2007

Deterministic Relationship and Stochastic Relationships ei的來源: 行為的隨機性(human indeterminacy) 測量的誤差(measurement error) 其他無法觀察到影響Y的因素(omission of the influence of innumerable chance events) ©蘇國賢2007

每一個特定的x值所相對應的y值不會剛好落於斜線上

我們假設在任何一X值下,Y有相同的分配,且其期望值E(Y|X)剛好落在一直線上。 ei為隨機變數且具有一定的機率或抽樣分配 迴歸的預測值 (相同收入水準家庭其育樂支出的平均值) 觀察到的樣本值

Population regression line 我們假設在母體中,對於每一個xi值而言,其相對應的yi值遵循某種機率分配,且期望值為 F(Y|X) Y 我們假設這些分配有相同的變異數σ2 與x相對應的一組y,其平均值剛好落在一條直線上 X

F(Y|X) Y E(y1) E(y2) E(y3) x1 x2 x3

隨機誤差項εi為隨機變數Yi與X= xi時Yi的期望值之間的差距。 Random Error Term 隨機誤差項εi為隨機變數Yi與X= xi時Yi的期望值之間的差距。 F(Y) Y X

εi反映除了家庭收入外,影響育樂支出的其他因素如小孩人數、家庭成員年齡等。 每一個家庭的育樂支出可以拆解成兩部分: (1) 系統部份~在某一收入水準下平均的育樂支出(β0 +β1xi) (2) εi~與系統部份偏離的程度

εi 假設E(εi) = 0

Population regression line 由於母體參數β0,β1為未知數,因此母體迴歸線必須透過觀察到的樣本(xi, yi)來推估 F(Y) 從樣本中可以推估出β0,β1的估計值,也可以建構出樣本迴歸線 Y 由於觀察到樣本點(xi, yi)不會剛好落在母體迴歸線上,因此yi與E(Yi|X=xi)會有所差距。 X

Sample Regression Line 給定n個觀察到的樣本(xi, yi), i=1, 2, 3,…n 我們可以估計出樣本迴歸線 殘差值愈小表示樣本迴歸線與每一觀察點愈接近迴歸線

簡單迴歸模型的基本假設

Method of Least Squares 如何找出一條最具有代表性的回歸線? 每一個人用肉眼判斷,得到的結果都不會一樣,因此需要一個較精準的方法。 ©蘇國賢2007

有無限多種可能 ©蘇國賢2007

Method of Least Squares 尋求迴歸係數的估計式有許多種方法,最常用的為 普通最小平方法(ordinary least squares method)及最大概似法(Maximum likelihood method) ©蘇國賢2007

Method of Least Squares 由於母體參數β0,β1為未知數,因此母體迴歸線必須透過觀察到的樣本(xi, yi)來推估 尋求迴歸係數的估計式有許多種方法,最常用的為 普通最小平方法(ordinary least squares method)及最大概似法(Maximum likelihood method) ©蘇國賢2007

Method of Least Squares 找出最適合樣本資料的一條直線,使預測值與觀察值的差異最小。 ©蘇國賢2007

Method of Least Squares ©蘇國賢2007

Residual Sum of Squares 由於殘差值有正有負,無法正確測量出兩者的距離,因此將殘差值加以平方。 我們的目標是要找出一條線,使每一個觀察值與預測值的距離的平方和最小: ©蘇國賢2007

Residual Sum of Squares 當b0=? b1 =? 時SSE會是最小值? ©蘇國賢2007

Stochastic Relationships and Scatter Diagrams 觀念 直線上任兩點P1P2,從P1移至P2,x軸座標移動 △x = x2 - x1 y軸座標移動 △y = y2 - y1 依 變項y 自變項x ©蘇國賢2007

Stochastic Relationships and Scatter Diagrams 觀念 直線上任兩點P1P2,此線的斜率定義為: 依 變項y 自變項x ©蘇國賢2007

Stochastic Relationships and Scatter Diagrams 觀念 在直線上任意點(P1 或P2)的斜率皆相同,變遷速率為常數 依 變項y 自變項x ©蘇國賢2007

微分(derivative)簡介 曲線上的斜率為何? 曲線圖形上的各點是否有相同的斜率? (-1, 1) (1, 1) ©蘇國賢2007

微分(derivative)簡介 在(-1, 1)點上,x值增加,y值下降 在(1, 1)點,x值增加,Y直也增加 簡單的說,微分就是找出變遷的速率( a rate of change) 在(-1, 1)點上,x值增加,y值下降 在(1, 1)點,x值增加,Y直也增加 (-1, 1) (1, 1) ©蘇國賢2007

微分(derivative)簡介 曲線在任一點的斜率為與該點相切的切線之斜率 Tangent line切線 (1, 1) (-1, 1) ©蘇國賢2007

微分(derivative)簡介 任一點上的斜率為何? 利用:給定任意兩點,可以求直線的斜率。 Tangent line切線 (1, 1) (-1, 1) ©蘇國賢2007

微分(derivative)簡介 Secant line 割線 ©蘇國賢2007

微分(derivative)簡介 Secant line 割線 ©蘇國賢2007

微分(derivative)簡介 Secant line 割線 ©蘇國賢2007

微分(derivative)簡介 Tangent line 切線 ©蘇國賢2007

Slope of the Tangent Line ©蘇國賢2007

Slope of the Tangent Line ©蘇國賢2007

Slope of the Tangent Line ©蘇國賢2007

Slope of the Tangent Line ©蘇國賢2007

Slope of the Tangent Line m = -4 m = 2 ©蘇國賢2007

Derivative The derivative of function f with respect to x is the function f ' defined by ©蘇國賢2007

Notation for the derivative f ' (x) 讀做 "f prime of x" y ' 讀做 "y prime" "the derivative of y with respect to x" "dee y dee x" "the derivative of f(x) with respect to x" "dee f(x) dee x" ©蘇國賢2007

Let f(x) = x3, Find the derivative ©蘇國賢2007

Let f(x) = x2-5x+1, Find the derivative ©蘇國賢2007

Basic Rules for Differentiation Rule 1: the derivative of a constant is zero ©蘇國賢2007

Basic Rules for Differentiation Rule 2: the derivative of a linear function ©蘇國賢2007

Basic Rules for Differentiation Rule3: the derivative of a power function ©蘇國賢2007

以微分(derivative)找極大及極小值 Tangent line 切線 f(x)的極小值出現在切線斜率等於零的時候 ©蘇國賢2007

Residual Sum of Squares 當b0=? b1 =? 時SSE會是最小值? ©蘇國賢2007

Residual Sum of Squares SSE會有最小值 ©蘇國賢2007

Residual Sum of Squares ©蘇國賢2007

Residual Sum of Squares Normal Equation 將(1)式兩邊除以n ©蘇國賢2007

Residual Sum of Squares 將(1)式乘以Σxi 將(2)式乘以n ©蘇國賢2007

Residual Sum of Squares 將(5)-(4) ©蘇國賢2007

Residual Sum of Squares 上下同除n ©蘇國賢2007

Residual Sum of Squares ©蘇國賢2007

Residual Sum of Squares ©蘇國賢2007

Sample Correlation Coefficient, r 樣本相關係數 樣本相關係數: ©蘇國賢2007

相關係數與斜率 簡單迴歸的斜率: 分子分母除以n-1: r與b1的正負號相同 r=0 if and only if b1=0 ©蘇國賢2007

STATA ©蘇國賢2007

例題 求x與y的correlation? ©蘇國賢2007

例題 求x與y的簡單迴歸線斜率b1?

例題 由於股票的價格與其獲利能力有很大的關聯,因此股價通常為股利的線性函數,任取十種股票來估計簡單迴歸線並預測股利為x=13元時股價 ©蘇國賢2007

迴歸方程式的解釋力 當我們計算出迴歸線後,我們想進一步知道迴歸曲線與資料間的適合度(goodness of fit)。 母體迴歸線告訴我們x與y有下列線性關係 上式告訴我們有兩個因素會影響Y值的變異: Y值會隨著xi值的改變而變:這一部份的變異為被迴歸線解釋的變異。 Y值會隨著ei值而變:這一部份為迴歸線無法解釋的變異。 ©蘇國賢2007

簡單迴歸模型 未被解釋的變異 總變異量 被解釋的變異 ©蘇國賢2007

變異數的分解 未被解釋的變異稱為殘差值residual,第i個觀察值的殘差值定義為: ©蘇國賢2007

變異數的分解 ©蘇國賢2007

變異數的分解 總變異量 Sum of Square Total 解釋變異量 Regression Sum of Square 未解釋變異量 Sum of Square Error ©蘇國賢2007

變異數的分解 兩邊除SST 判定係數為可解釋變異量佔總變異量的比例,表示X對Y的變異之解釋能力。 R2愈大,表示X對Y的解釋能力愈強 ©蘇國賢2007

變異數的分解 以樣本變異數來計算 ©蘇國賢2007

變異數的分解 ©蘇國賢2007

變異數的分解 ©蘇國賢2007

求R2?

©蘇國賢2007

r=0.994 r2=0.989 ©蘇國賢2007

r=0.921 r2=0.849 ©蘇國賢2007

Page 136 ©蘇國賢2007

r2 Variance of value y = 5.30091 Variance of predicted y= 5.24135 ©蘇國賢2007

©蘇國賢2007