課程九 迴歸與相關1.

Slides:



Advertisements
Similar presentations
失溫的預防與處置策略 國立臺東大學體育學系 溫卓謀整理 資料來源:. 失溫的預防策略 從衣著到裝備都細心講究 ​ 要防止體溫的散失,必須針對四大途徑加 以阻斷。如穿著排汗內衣,可將汗水引到 衣物表面,減少熱傳導;傳統的羊毛和羽 絨,以及合成聚酯纖維的衣服,可有效阻 斷空氣對流;防水透氣的外套(如 GORE-
Advertisements

性传播性疾病. 简介 STD 是指以通过性行为为主要传播途 径的一组传染病 目前 WTO 列入 STD 的病种已达 20 多种 我国重点监测的性传播疾病有梅毒、 淋病、艾滋病列为乙类传染病及尖锐 湿疣、软下疮、性病性淋巴肉芽肿、 生殖器孢疹和非淋菌性尿道炎8种.
第九章 恋爱能力 大学生发展的必要学习. 恋爱是一所学校, 教我们重新做人! —— 莫里哀 一、恋爱对大学生成长发展的意义 二、爱情的心理学理论 三、大学生常见的恋爱心理问题 四、大学生恋爱能力的培养.
第一章 餐饮服务程序 学习目的: 掌握餐饮服务四个基本环节的内容 正确表述和运用各种餐饮形式的服务程序 熟悉并利用所学知识灵活机动地为不同需求的 客人提供服务.
第8章 非线性回归 8.1 可化为线性回归的曲线回归 8.2 多项式回归 8.3 非线性模型 8.4 本章小结与评注.
第五章 主张超尘绝俗的 佛家.
计量经济学 第五章 异 方 差 性.
第九课 第二框 建设社会主义精神文明.
让我们撑起一把青春伞.
让 我 们 撑 起 一 把 青 春伞.
數據挖掘 課程 王海 深圳國泰安教育技術股份有限公司.
Chapter 15 複迴歸.
一、平面点集 定义: x、y ---自变量,u ---因变量. 点集 E ---定义域, --- 值域.
第二课 扬起自信的风帆 我能“行”.
兒童及少年保護宣導 和興國小校長 吳柚 中華民國 100 年 8 月 31日 2008張淑慧.
第1章第3节 量化研究与质化研究 案例1:关于中学思想政治教师专业发展现状和需求的调查研究
石家庄迅步网络科技有限公司 联系人:张会耀 电话:
消 息 制作教师:程焕新 湖北省黄冈高级技工学校.
管理学基本知识.
2016中重卡网络规划 中重卡营销部 2016年6月.
滁州学院首届微课程教学设计竞赛 课程名称:高等数学 主讲人:胡贝贝 数学与金融学院.
资源的跨区域调配—— 西气东输 山东省东营市第一中学 周琳.
了解如何评估一个LR模型的好坏 Mikezgzhao.
走向自立人生 自己的事情自己干 一、自立人生少年始. 走向自立人生 自己的事情自己干 一、自立人生少年始.
拾貳、 教育行政 一、教育行政的意義 教育行政,可視為國家對教育事務的管理 ,以增進教育效果。 教育行政,乃是一利用有限資源在教育參
認識同志伴侶 劉安真 弘光科技大學通識教育中心助理教授.
課程銜接 九年一貫暫行綱要( )  九年一貫課程綱要( ) 國立台南大學數學教育系 謝 堅.
2.4 二元一次方程组的应用(1).
祖 父 母 節.
單因子實驗 設計 (Single­factor experiments)
Chapter 2 簡單迴歸模型.
优化试验设计与数据分析 第五章 回归分析方法 本章主要内容 · 一元线性回归方程度建立、显著性检验、预报和控制。非线性回归方程的线性化。
第六章 正态条件下回归的推论.
一元线性回归(二).
第一章.
Stochastic Relationships and Scatter Diagrams
第十一章. 簡單直線迴歸與簡單相關 Simple Linear Regression and Simple Correlation
十一、簡單相關與簡單直線回歸分析(Simple Correlations and Simple Linear Regression )
簡單迴歸模型的基本假設 用最小平方法(OLS-ordinary least square)找到一個迴歸式:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
課程九 迴歸與相關2.
非均一性的誤差變異數 and SERIAL CORRELATION
Logistic Regression Appiled Linear Statistical Models,由Neter等著
Chapter 14 Simple Linear Regression
主講人 陳陸輝 特聘研究員兼主任 政治大學 選舉研究中心
以每年參觀Lake Keepit的人數為例
拟合优度(或称判定系数、决定系数) 目的:企图构造一个不含单位,可以相互进行比较,而且能直观判断拟合优劣的指标。 拟合优度的定义:
庄文忠 副教授 世新大学行政管理学系 相关分析与简单回归分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2019/4/7.
MyLibrary ——数字图书馆的个性化服务
Liner regression analysis
第3章 預測 2019/4/11 第3章 預測.
第 9 章 估計與信賴區間.
日光燈製造業 勞工汞蒸氣暴露評估技術探討 勞工安全衛生研究所 謝俊明 林雲卿 4/18/2019.
課程十 迴歸3.
用牛顿环测量透镜的曲率半径 华中农业大学应用物理系 物理实验教学中心
(multiple linear regression)
Simple Regression (簡單迴歸分析)
高中 E 形象 數位果子科技有限公司 程建嘉.
社会研究方法 第7讲:社会统计2.
第二章 经典线性回归模型: 双变量线性回归模型
红利、年金、满期金自动转入聚宝盆,收益有保底,升值空间更大
第20章 多元尺度分析與聯合分析 本章的學習主題  1.多元尺度的意義 2. 多元尺度的處理資料型態 3. 多元尺度的模型適合度評估
第 四 章 迴歸分析應注意之事項.
Chapter 10 集群分析. Chapter 10 集群分析 概念及應用 集群分析(cluster analysis)是一種用來將屬量的觀測點分群或分類的分析方法 經過集群分析分群之後,在同一群內的觀測點針對某些特性而言,會具有一致性;而分屬不同群的觀測點,針對同樣的特性則會有顯著的不同.
线性分类 方匡南 教授 博士生导师 耶鲁大学博士后 厦门大学数据挖掘研究中心 副主任 厦门大学经济学院统计系 中华数据挖掘协会(台湾) 顾问
数据挖掘 DATA MINING 刘 鹏 张 燕 总主编 王朝霞 主编 施建强 杨慧娟 陈建彪 副主编
03/03/2019 豐盛生命的呼召 楊知予長老.
簡單迴歸分析與相關分析 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2019/8/3.
用加減消去法解一元二次聯立方程式 台北縣立中山國中 第二團隊.
Presentation transcript:

課程九 迴歸與相關1

簡介 假設變數之間呈線性關係。 如果依變數是連續變數就可進行迴歸;自變數可以是類別或是連續變數。 可根據迴歸係數預測依變數。 迴歸只表示某一變數依照另一變數的變化程度;因果關係是理論得來的不是根據迴歸分析結果。

Y的平均值 根據最小平方法得出的迴歸線會通過X所對應Y的平均值。 而每一個E(Y|X)有變異數,迴歸成立的條件之一是該變異數相等,或是說當變異數不等,最小平方法不適用。 E(Y|X)的分佈應該成常態分佈(不過這個條件不影響迴歸模型是否成立)

符號 如果用X表示自變數,Y表示依變數。 如果X, Y皆是母體資料,Y=α+βX

α,β 如果β>0,迴歸線上升,代表X對於Y有正向作用,X越大則Y越大。反之則是代表有負向作用, X越大則Y越小。

線性迴歸 線性指的是β係數是一次方,但是自變數X可以不必是一次方。 例如:Y= α+βX2是線性,但是Y= α+√βX不是。 α、β是我們關心的「母體」,我們根據樣本資料可估計a, b來推論α、β,並且加以檢定。

迴歸係數的求法

最小平方法 根據X, Y的觀察值,以最小平方法計算b, a,也就是說y_hat=a+bx。y_hat是代入x之後的預測值。 y_hat的平均值等於y的平均值 yi=a+bxi+ui (完整的迴歸模型) E(yi|xi)= a+bxi(預測模型) ui =yi - E(yi|xi)= yi - a+bxi (殘差)

迴歸線必通過x,y的平均值

線性迴歸估計 每一個樣本裡有許多觀察值,如果變數x, y之間有線性關係,我們計算得出a, b, y_hat等等。

殘差 SSE=sum of squared errors,也就是觀察值y跟預測值y-hat(=a+bx)之間的差、也就是殘差的平方和。

總平方和及殘差平方和 總平方和(Total sum of squares):變數的變異數Σ(y - y_bar)2 殘差平方和(Sum of squared errors, residual sum of squares):觀察值與預測值之間的差,也就是迴歸方程式無法解釋的部份。 Σ(y - y_hat)2 總平方和減掉殘差平方和等於迴歸平方和(RSS, Regression sum of squares)

估計y的條件標準差, standard error of the estimate(SEE)

SEE 可做為迴歸係數的變異數之估計值。 所以自變數x的變異數越大(或是樣本數越大),在相同的SEE之下,b的標準誤越小,也就是越集中。

交通工具與手機費用 Coefficients: Estimate S. E. t Pr(>|t|) (Intercept) 978.42 46.47 21.06 <.01 trans.n -240.55 20.50 -11.73 <.01 Residual standard error: 194.5 on 269 degrees of freedom

交通工具與手機費用 sse<-sqrt(sum(m1$residuals^2)/269) diff.x<-trans.n-mean(trans.n) se.b<-sse/sqrt(sum(diff.x^2)) se.b 20.5026

Why are there so many Buchanan Voters in Palm Beach County? 2000年的美國總統選舉中,佛羅里達州的Palm Beach郡投票結果顯示保守派候選人布坎南(Buchanan)獲得3407票,但是他所屬政黨認為當地最多只有400個支持者。 因此,有人認為布坎南的票其實部份來自於本來要投給Gore卻誤投給布坎南. 如果布坎南的票都不是誤投,理論上布希的票越多,布坎南票應該越多。

特殊的觀察值

原始模型及去掉特殊值模型 Coef. Estimate Std. Error t value Pr(>|t|) (Intercept) 45.2899 54.4794 0.831 0.409 BUSHvote 4.9168 0.7644 6.432 1.73e-08 *** Coef. Estimate Std. Error t value Pr(>|t|) (Intercept) 65.5735 17.3304 3.784 0.000343 *** BUSHvote 3.4819 0.2501 13.923 < 2e-16 ***

預測值 觀察值 預測值 差 Bush 152846 796(原始迴歸線) =3407-796=2610 Buchanan 3407 597(去掉Palm Beach) =3407-597= 2809

小結 根據兩個迴歸模型,Bush在Palm Beach可能少了2610或是2809票。Buchanan應該只得796或597票。 預測值有助於我們瞭解觀察值與迴歸方程式之間的差別。

結論 瞭解迴歸方程式的意義 瞭解迴歸係數的求法 瞭解預測值的求法 瞭解殘差的意義 瞭解依變數的條件標準差的求法