Logistic Regression Appiled Linear Statistical Models,由Neter等著

Slides:



Advertisements
Similar presentations
许瑞云医师 你已经很努力地注意饮食、作息、运动, 为什么身体还不能恢复健康 ? 细节 答案就在「 细节 」裡, 唯有掌握关键的一步, 养生才能达到真 正的功效 ! 现在就让我们跟着曾是全球知名的哈 佛医院主治医师的许瑞云, 学习最正确 的养生方法, 轻松打下健康满分的基础 !
Advertisements

洞庭月,衡岳云,巫山雨, 波撼气蒸,揽天下风光,堪 称独步; 崔灏诗,范相记,王勃序, 两楼一阁,数江南文物,各 有千秋。
建筑施工与管理 专业入学教育 专业责任教师:刘赞玉. 一、本专业的层次、学制、毕业及颁证本专业的层次、学制、毕业及颁证 二、本专业开设的背景本专业开设的背景 三、本专业的人才培养目标本专业的人才培养目标 四、本专业的专业设置特色本专业的专业设置特色 五、本专业主要专业课程介绍本专业主要专业课程介绍.
REGRESSION AND CLASSIFICATION TREES 迴歸與分類樹. 簡介 傳統的複迴歸分析,假設誤差項服從常態分配,所 以複迴歸分析是一種有母數 (parametric) 方法。 本章將介紹一種常用的無母數 (non-parametric) 的 迴歸方法,此法稱為決策樹 (decision.
《公路纵断面设计》 —— 纵断面设计的要求 道桥系 二○○七年五月. 纵断面设计的一般要求 1 .纵坡设计必须满足《公路工程技术标准》中的各项规定。 2 .为保证汽车能以一定的车速安全舒顺地行驶,纵坡应具有 — 定 的平顺性,起伏不宜过大及过于频繁。尽量避免采用极限纵坡 值.缓和坡段应自然地配合地形设置,在连续采用极限长度的.
天津1班面试专项练习1 综合分析现象类 主讲:凌宇 时间:5月21日 19:00—22:00.
45天备考指南 2013年下半年国考资格证笔试系列讲座(2) 华图教师事业部 石杨平.
建筑工程系建筑装饰工程技术专业 建筑设计专业 热烈欢迎新同学入校! 河南工业职业技术学院 建筑工程系.
建筑工程技术 专业介绍 建筑工程系.
迴歸分析與軟體應用 林 國 欽 博士 商學與管理研究所 台南科技大學.
政府採購法規概要 報告人:杜國正 行政院公共工程委員會企劃處.
小学语文常用说明方法 广州市越秀区云山小学 高年级 李晓泓.
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
數據挖掘 課程 王海 深圳國泰安教育技術股份有限公司.
Chapter 15 複迴歸.
第十五單元:交叉列表和卡方檢定 授課老師:國立臺灣大學農藝學系 劉仁沛 教授
之 魔 析 妖 鬼 解 怪 大 沈家仪小组出品.
2014政法干警备考平台 2014政法干警考试群⑨ 中公教育政法干警考试 ——微博 中公教育政法干警考试
第四讲 组织结构与人员配置 复旦大学管理学院 芮明杰教授
拉萨属高原温带半干旱季风气候,平均海拔3658米,年日照3000多小时,素有“日光城”、“太阳城”的美誉。年最高气温29℃,最低气温零下16
嘉兴学院.
建筑专业介绍 建筑专业介绍 选择建筑专业的七大理由 选择建筑专业的七大理由 建筑专业毕业后的发展前景 建筑专业毕业后的发展前景
形神兼备,写活人物 ——外貌描写写作指导 丰县华山初级中学 王艳丽.
滨职学习汇报 ( )    粮油轻工系      石全见.
医学统计学 8 主讲人 陶育纯 医学统计学 8 主讲人 陶育纯
资料分析 如何攻破最后瓶颈 主讲老师:姚 剑 4月6日20:00 YY频道:
2016中重卡网络规划 中重卡营销部 2016年6月.
招生宣传 微电子科学与工程.
第九章 长期资产及摊销 2017/3/21.
了解如何评估一个LR模型的好坏 Mikezgzhao.
张健“微课程”工作室作品 当“孔融让梨”遭遇美国孩子 上步小学 陈明静.
强化实验室队伍 助推“十二五”建设 南京理工大学国有资产与实验室管理处
新疆自治区“十二五”科技发展 规划编制工作
09学前教育班 魏文珍 自我介绍.
單因子實驗 設計 (Single­factor experiments)
Analysis of Variance 變異數分析
Chapter 2 簡單迴歸模型.
第十四章 数值变量的统计描述.
次数依变量模型 (Models for Count Outcomes)
類別資料分析(Categorical Data Analysis)
課程九 迴歸與相關1.
第 5 章 樣本資料的數值分布.
第十一章. 簡單直線迴歸與簡單相關 Simple Linear Regression and Simple Correlation
十一、簡單相關與簡單直線回歸分析(Simple Correlations and Simple Linear Regression )
R教學 單元5 敘述統計 羅琪老師.
非均一性的誤差變異數 and SERIAL CORRELATION
Chapter 14 Simple Linear Regression
線性一階微分方程與尤拉法 線性一階微分方程式求解 (Linear First-Order Differential Equations)
以每年參觀Lake Keepit的人數為例
網路遊戲版 幸福農場168號.
MyLibrary ——数字图书馆的个性化服务
第八章 線性迴歸 8.1 線性迴歸概論 8.2 相關分析 8.3 簡單迴歸分析 8.4 迴歸模型係數的推導
第3章 LP的对偶问题与灵敏度分析 §1 原问题与对偶问题 §2 对偶问题基本性质 §3 对偶单纯形法 §4 灵敏度分析.
第 9 章 估計與信賴區間.
相關統計觀念復習 Review II.
Design and Analysis of Experiments Final Report of Project
日光燈製造業 勞工汞蒸氣暴露評估技術探討 勞工安全衛生研究所 謝俊明 林雲卿 4/18/2019.
浙江大学医学院公共技术平台 实验仪器预约管理系统系列培训 医学院公共技术平台 丁巧灵
課程十 迴歸3.
Homework 1(1/2) 本頁表格為派密(Peavy)在07年球季各場次ERA的表現,(1)請依此數據完成下頁表格之統計值並說明之;(2)並與其他三名投手之統計值比較之。(請詳述計算過程) 場次 各場次ERA
Dr. C. Hsieh College of Informatics Kao yuan University
17 無母數統計檢定  學習目的.
山清水秀的林芝 yy 曾元一
第7章 基本统计分析 2019/5/14.
Logistic回归 Logistic regression 研究生《医学统计学》.
第八章 方差分析(analysis of variance)
Multiple Regression: Estimation and Hypothesis Testing
线性分类 方匡南 教授 博士生导师 耶鲁大学博士后 厦门大学数据挖掘研究中心 副主任 厦门大学经济学院统计系 中华数据挖掘协会(台湾) 顾问
簡單迴歸分析與相關分析 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2019/8/3.
分類樹(Classification Tree)探討Baseball Data
Presentation transcript:

Logistic Regression Appiled Linear Statistical Models,由Neter等著 Categorical Data Analysis,由Agresti著

Logistic 回归 当响应变量是定性变量时的非线性模型 两种可能的结果,成功或失败,患病的或没 有患病的,出席的或缺席的 实例:CAD(心血管疾病)是年龄,体重,性别,吸烟历史,血压的函数 吸烟者或不吸烟者是家庭历史,同年龄组行 为,收入,年龄的函数 今年购买一辆汽车是收入,当前汽车的使用 年限,年龄的函数

二元结果的响应函数

当响应是二元时的特殊问题 对响应函数的约束: 非标准化的误差项: 当 非恒量的误差方差:

Logistic 响应函数

Logistic 响应函数的例子 图中横坐标为:年龄;纵坐标为:CAD的概率

Logistic 响应函数的性质

似然函数

多元Logistic回归的似然性

似然方程的解 不封闭的形式解,使用Newton-Raphson算法,迭代地重加权最小二乘法(IRLS)

Logistic 回归系数的解释

kyphosis {rpart}(驼背)81 rows and 4 columns Kyphosis: a factor with levels absent present indicating if a kyphosis (a type of deformation) was present after the operation. Age: in months Number: the number of vertebrae involved Start: the number of the first (topmost) vertebra operated on.

some(kyphosis) Kyphosis Age Number Start 12 absent 148 3 16 18 absent 175 5 13 32 absent 125 2 11 40 present 91 5 12 50 absent 177 2 14 51 absent 68 5 10 52 absent 9 2 17 70 absent 15 5 16 79 absent 120 2 13 81 absent 36 4 13

summary(kyphosis) Kyphosis Age Number Start absent :64 Min. : 1.00 Min. : 2.000 Min. : 1.00 present:17 1st Qu.: 26.00 1st Qu.: 3.000 1st Qu.: 9.00 Median : 87.00 Median : 4.000 Median :13.00 Mean : 83.65 Mean : 4.049 Mean :11.49 3rd Qu.:130.00 3rd Qu.: 5.000 3rd Qu.:16.00 Max. :206.00 Max. :10.000 Max. :18.00

plot(kyphosis)

预测因子vs.驼背的箱图 图中横坐标为:是否驼背;纵坐标分别为:年龄,数值,起始boxplot(Age~Kyphosis,data=kyphosis)

广义拉格朗日乘子拟合 summary(glm(Kyphosis~Age+Number+Start,family=binomial,data=kyphosis)) Deviance Residuals: Min 1Q Median 3Q Max -2.3124 -0.5484 -0.3632 -0.1659 2.1613 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -2.036934 1.449575 -1.405 0.15996 Age 0.010930 0.006446 1.696 0.08996 . Number 0.410601 0.224861 1.826 0.06785 . Start -0.206510 0.067699 -3.050 0.00229 ** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 83.234 on 80 degrees of freedom Residual deviance: 61.380 on 77 degrees of freedom AIC: 69.38 Number of Fisher Scoring iterations: 5

残差

模型偏差 拟合模型的偏差是拟合模型的对数似然与饱和模型的对数似然的比值。 饱和模型的对数似然=0

协方差矩阵 x<-model.matrix(kyph.glm) fi=fitted(kyph.glm) xvx<-t(x)%*%diag(fi*(1-fi))%*%x xvx (Intercept) Age Number Start (Intercept) 9.62034 907.8886 43.67401 86.49843 Age 907.88858 114049.8138 3904.31285 9013.14288 Number 43.67401 3904.3128 219.95349 378.82840 Start 86.49843 9013.1429 378.82840 1024.07295

xvxi<-solve(xvx) xvxi (Intercept) Age Number Start (Intercept) 2.101403767 -4.332171e-03 -0.2764671477 -0.0370950478 Age -0.004332171 4.155738e-05 0.0003368973 -0.0001244667 Number -0.276467148 3.368973e-04 0.0505664451 0.0016809971 Start -0.037095048 -1.244667e-04 0.0016809971 0.0045833546

sqrt(diag(xvxi)) (Intercept) Age Number Start 1. 449621939 0

因向模型中增加项而产生的偏 差变化 anova(kyph.glm) Analysis of Deviance Table Model: binomial, link: logit Response: Kyphosis Terms added sequentially (first to last) Df Deviance Resid. Df Resid. Dev NULL 80 83.234 Age 1 1.302 79 81.932 Number 1 10.306 78 71.627 Start 1 10.247 77 61.380

带有附加的年龄^2的驼背模型 kyph.glm2<-glm(Kyphosis~poly(Age,2)+Number+Start,family=binomial,data=kyphosis) summary(kyph.glm2)

偏差分析 anova(kyph.glm2) Analysis of Deviance Table Model: binomial, link: logit Response: Kyphosis Terms added sequentially (first to last) Df Deviance Resid. Df Resid. Dev NULL 80 83.234 poly(Age, 2) 2 10.4959 78 72.739 Number 1 8.8760 77 63.863 Start 1 9.4348 76 54.428

驼背数据,16个对象,带有拟合 和残差 kyphosis$fi<-fi y<-as.numeric(kyphosis$Kyphosis) y<-as.numeric(kyphosis$Kyphosis)-1 kyphosis$rr<-y-fi kyphosis$rp<-(y-fi)/sqrt(fi*(1-fi)) kyphosis$rd<-sqrt(-2*log(abs(1-y-fi)))

响应残差vs.拟合的图 图中横坐标为:y拟合值;纵坐标分别为:拟合值 plot(rr~fi,kyphosis)

偏差残差vs.序号的图 yy<-sign(y-fi)*(-2*(y*log(fi)+(1-y)*log(1-fi)))^(1/2) 图中横坐标为:序号;纵坐标分别为:残差plot(resid(kyph.glm)) yy<-sign(y-fi)*(-2*(y*log(fi)+(1-y)*log(1-fi)))^(1/2)

偏差残差vs.拟合值的图