課程十 迴歸3.

Slides:



Advertisements
Similar presentations
夯实教师教育 办好非师范教育 ---- 以外语专业为例 河北师范大学 李正栓. 1. 坚定不移地实施教师教育 A. 关键词:师范院校 师范院校是以培育师资为目的的教育机构,多属于高等教育 层级。 含 “ 师范大学 ” 或 “ 师范学院 ” 。另外,由师专升为本科的院校 多数更名为 “XX 学院 ”
Advertisements

中医内科 陈良金. 目的要求: 熟悉虚劳的证候特征。 了解虚劳的发病与气血阴阳及五脏的关系。 掌握虚劳和肺痨及一般虚证的区别与联系。 掌握虚劳的治疗要点。 熟悉虚劳各个证型的辨证论治。 了解虚劳的预后及调摄护理。
第一章 餐饮服务程序 学习目的: 掌握餐饮服务四个基本环节的内容 正确表述和运用各种餐饮形式的服务程序 熟悉并利用所学知识灵活机动地为不同需求的 客人提供服务.
教育研究课题的实施 北京教育科学研究院 陶文中 第一节 如何制定课题研究计划 (开题论证报告) 一般结构(框架) 1 、课题名称 2 、研究目的和意义 3 、研究的基本内容 ( 1 )理论研究(细分为若干子项目) ( 2 )实践研究( 细分为若干子项目)
1 語音下單代表號 請輸入分公司代碼 2 位結束請按#字鍵 統一證券您好 ﹗ 請輸入分公司代碼結束請按#字鍵,如不知分公司代碼請按*號。 請輸入您的帳號後 7 位 結束請按#字鍵 請在聽到干擾音時輸入您的密碼結束請按#字鍵 主選單一覽表 委託下單請按 1 ; 取消下單請按 2 成交回報請按.
統計學 : 應用與進階 第 11 章 : 點估計.  點估計  類比原則  最大概似法  不偏性  有效性  一致性.
第8章 非线性回归 8.1 可化为线性回归的曲线回归 8.2 多项式回归 8.3 非线性模型 8.4 本章小结与评注.
制作:张大远 逯遥 指导教师:司书红 学校:兰州交通大学
窦娥冤 关汉卿 感天动地 元·关汉卿.
第五章 主张超尘绝俗的 佛家.
计量经济学 第五章 异 方 差 性.
如何适应钢材期货推出后的现货市场? 上海东证期货有限公司 党剑 博士 联系电话: 地址:上海市中山南路318号
上海体育职业学院 祁社生 一、重视体育科研在提高竞技运动训练水平中的意义和作用
歷史建築清水國小宿舍群修復工程 施工說明會
數據挖掘 課程 王海 深圳國泰安教育技術股份有限公司.
Chapter 15 複迴歸.
应用回归分析 信计学院统计系 沈菊红.
知其不可而为之.
2017/3/9 实验误差及其控制 魏敏杰 陈 杰 阮 强 王振宁 单凤平 孟繁浩 富伟能 陈 磊 中国医科大学.
中国画家协会理事、安徽省美术家协会会员、 工艺美术师、黄山市邮协常务理事余承平主讲
第二课 扬起自信的风帆 我能“行”.
请说出牛顿第一定律的内容。.
Chapter 3 預測.
第二章 语音 第六节 音变 轻 声1.
石家庄迅步网络科技有限公司 联系人:张会耀 电话:
汉字的构造.
诵读欣赏 古代诗词三首.
2016中重卡网络规划 中重卡营销部 2016年6月.
定风波.
贴近教学 服务师生 方便老师.
六年级 语文 下册 第四单元 指尖的世界.
第8章 回归分析 本章教学目标: 了解回归分析在经济与管理中的广泛应用; 掌握回归分析的基本概念、基本原理及其分析应用的基本步骤;
(浙教版)四年级品德与社会下册 共同生活的世界 第四单元 世界之窗 第二课时.
Chapter 2 簡單迴歸模型.
传媒学院2013年度团委工作 总结分析报告
优化试验设计与数据分析 第五章 回归分析方法 本章主要内容 · 一元线性回归方程度建立、显著性检验、预报和控制。非线性回归方程的线性化。
課程九 迴歸與相關1.
第六章 正态条件下回归的推论.
一元线性回归(二).
第一章.
Stochastic Relationships and Scatter Diagrams
第十一章. 簡單直線迴歸與簡單相關 Simple Linear Regression and Simple Correlation
十一、簡單相關與簡單直線回歸分析(Simple Correlations and Simple Linear Regression )
簡單迴歸模型的基本假設 用最小平方法(OLS-ordinary least square)找到一個迴歸式:
非均一性的誤差變異數 and SERIAL CORRELATION
Logistic Regression Appiled Linear Statistical Models,由Neter等著
Chapter 14 Simple Linear Regression
第四章 SPSS的基本统计分析.
主講人 陳陸輝 特聘研究員兼主任 政治大學 選舉研究中心
以每年參觀Lake Keepit的人數為例
拟合优度(或称判定系数、决定系数) 目的:企图构造一个不含单位,可以相互进行比较,而且能直观判断拟合优劣的指标。 拟合优度的定义:
庄文忠 副教授 世新大学行政管理学系 相关分析与简单回归分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2019/4/7.
MyLibrary ——数字图书馆的个性化服务
导数的应用 ——函数的单调性与极值.
Liner regression analysis
第3章 預測 2019/4/11 第3章 預測.
迴歸分析 行銷、財務、人資研究.
一、迴歸分析的基本概念 二、SPSS的線性迴歸分析 三、迴歸模型的檢驗與意義
第 9 章 估計與信賴區間.
抽樣分配 Sampling Distributions
日光燈製造業 勞工汞蒸氣暴露評估技術探討 勞工安全衛生研究所 謝俊明 林雲卿 4/18/2019.
(multiple linear regression)
Simple Regression (簡單迴歸分析)
导入新课 在《数学3》中,我们对两个具有线性相关关系的变量利用回归分析的方法进行了研究,其步骤为: 画散点图 求回归直线方程
第 四 章 迴歸分析應注意之事項.
Chapter 10 集群分析. Chapter 10 集群分析 概念及應用 集群分析(cluster analysis)是一種用來將屬量的觀測點分群或分類的分析方法 經過集群分析分群之後,在同一群內的觀測點針對某些特性而言,會具有一致性;而分屬不同群的觀測點,針對同樣的特性則會有顯著的不同.
Xián 伯 牙 绝 弦 安徽淮南市八公山区第二小学 陈燕朵.
线性分类 方匡南 教授 博士生导师 耶鲁大学博士后 厦门大学数据挖掘研究中心 副主任 厦门大学经济学院统计系 中华数据挖掘协会(台湾) 顾问
第 1 章 單一預測變數線性迴歸.
簡單迴歸分析與相關分析 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2019/8/3.
Presentation transcript:

課程十 迴歸3

複迴歸 超過一個自變數與依變數構成。 E(y| x1,x2)=α+β1x1+ β2x2 兩個自變數分別與依變項相關,但是兩個自變數彼此之間可能有相關。 因此我們必須強調自變數的係數是在「控制」其他自變數的(平均值)情況下,對於依變數的影響。稱之為partial regression coefficients.

兩個變數的迴歸方程式 完整的兩個自變數的迴歸方程式可寫成yi= β0 +β1x1i+ β2x2i +ui

β0 , β1 ,β2

迴歸係數的標準誤

複迴歸的特性1 通過y, x1, x2等變數的平均值,也就是代入x1, x2的平均值會得到y的平均值。 y的預測值的平均值等於y的平均值。 殘差ui_hat的平均值=0 ui_hat與x1, x2等自變數互相獨立。 x1, x2等自變數的相關程度越高, β1-hat及β2_hat的標準誤越大,也就是越容易不顯著。如果等於1,那麼將無法計算β1-hat及β2_hat的標準誤。

複迴歸的特性2 x1, x2等自變數的變異數越大, β1-hat及β2_hat的標準誤越小,也就是估計的越準確。

複迴歸係數的意義1 如果我們以y為依變數,自變數為x1, x2進行迴歸,那麼, β1-hat應該是控制或是去掉x2作用之後, x1對y的作用。 我們先以x2對y做迴歸,再以x2對x1做迴歸,其殘差的意義分別為y及x1去掉x2之作用的值。

複迴歸係數的意義2 承上,如果以y的殘差為依變數, x1的殘差做自變數,得到的係數應該就是原來的β1-hat。 以Boston的房價中位數(medv)當依變數, x1為犯罪率(crim), x2為樓板面積(rm),估計結果如下: Estimate Std. Error t value (Intercept) -29.2447 2.5881 -11.30 crim -0.2649 0.0331 -8.01 rm 8.3911 0.4049 20.73

複迴歸係數的意義3 以rm對medv 迴歸 Estimate Std. Error t value (Intercept) -34.671 2.650 -13.1 rm 9.102 0.419 21.7 以rm對crim迴歸 (Intercept) 20.482 3.364 6.09 rm -2.684 0.532 -5.04

複迴歸係數的意義4 最後以y的殘差為依變數, x1的殘差為自變數進行迴歸,係數即為原來的β1-hat。 Estimate Std. Error t value (Intercept) 5.792e-17 2.770e-01 b2$residuals -2.649e-01 3.304e-02 -8.019

R2 變數的全部變異量減去無法解釋的部份,再除以全部變異量,便是可用X解釋的比例。 R2= TSS-SSE/ TSS

母親的教育程度、智商與子女表現

估計結果 yi= β0 +β1x1i+ β2x2i +ui x1i=0, 1 Multiple R-squared: 0.2141 Coeff. S. E. t Pr(>|t|) (Intercept) 25.73154 5.87521 4.380 1.49e-05 mom_hs 5.95012 2.21181 2.690 0.00742 mom_iq 0.56391 0.06057 9.309 < 2e-16 Multiple R-squared: 0.2141

解釋類別變數的影響1 prediction equation: E(y)=25.73+5.95*mom_hs+0.56*mom_iq 當mom_s=0, E(y)=25.73+ β2x2i 當mom_s=1, E(y)=25.73+ β1 + β2x2i 所以, β1可解釋成母親有高中學歷的學生比起沒有高中學歷的學生會有多少平均高或低的表現(高了5.95分)

解釋類別變數的影響2 當類別變數=0,預測的迴歸方程式剩下一個自變數,E(y)=25.73+0.56*mom_iq。 因此,只有截距會因為虛擬變數的值而改變,另一自變數的影響程度不變。

虛擬變數 如果自變數是質性變數(類別)時,可以設定為虛擬變數。 例如沒受過高中教育從1變成0,受過高中教育從2變成1 估計結果並不會改變 如果超過兩個類別,需要k-1個虛擬變數。

R2 y<-kid_score m.y<-mean(y) v.y<-sum((y-m.y)^2) E1<-v.y E2<-sum((fit.3$residuals^2)) (E1-E2)/E1

調整後R2

SPSS報表

超過兩個類別的自變數 Cyril Burt(1966)曾收集雙胞胎的智商資料,共有三個變數:生長在生父母家庭的雙胞胎的智商、生長在收養家庭的雙胞胎的智商、生父母的社會地位。資料在twins。 y:收養家庭的雙胞胎的智商; x1 :生長在生父母家庭的雙胞胎的智商x2 :生父母的社會地位=中;x3 :生父母的社會地位=低 E(y)=β0+ β1 x1 + β2 x2 + β3 x3

估計結果 Coef. S.E. t (Intercept) -0.6076 11.8551 -0.051 Biological 0.9658 0.1069 9.031 (Social)low 6.2264 3.9171 1.590 (Social)middle 2.0353 4.5908 0.443 Residual standard error: 7.571 on 23 degrees of freedom Multiple R-squared: 0.8039, Adjusted R-squared: 0.7784

截距+迴歸係數多於3的標準誤 必須估計當自變數為依變數時的迴歸。

SPSS—Y=Foster

RSE

SPSS—Y=Biological

R2(1.23)

計算Biological的標準誤 se(Biological)=RSE/√Var(Biological)*(1-R2(1.23)) = 7.57/√6437*(1-0.222)=0.10 同樣的方法適用於自變數數目=k的迴歸模型

虛擬變數的作用 當x2=0, x3 =0,代表高社會地位家庭的方程式:E(y)= β0+ β1 x1 —(1) 若以(2)-(1)得到β2 ,代表中社會地位家庭與高社會地位家庭之差別

F值1 可檢驗是否全部的自變數之係數=0 F=平均迴歸平方和(Regression mean square)/平均殘差平方和(Residual mean square) F分佈的自由度為迴歸平方和的自由度及殘差平方和的自由度 虛無假設:全部迴歸係數=0 對立假設:至少一個迴歸係數≠0

F值2 F值亦可以用以下公式計算: F=[n-k-1)]*[R2/k]/(1-R2) R2=0.804 k=3 n=27

結論 瞭解複迴歸的係數求法 瞭解R2的求法 瞭解預測值 瞭解迴歸係數的信賴區間以及t檢定。 瞭解自變數為類別變數的解釋。