Logistic回归 Logistic regression 研究生《医学统计学》.

Slides:



Advertisements
Similar presentations
第十八章 判别分析 Discriminant Analysis. Content Fisher discriminant analysis Maximum likelihood method Bayes formula discriminant analysis Bayes discriminant.
Advertisements

庄文忠 副教授 世新大学行政管理学系 2012/7/6 SPSS 之应用 ( 庄文忠副教授 ) 1 SPSS 的环境与基本操作.
中国部分农村地区肺结核发病因素 的病例对照研究 陈 伟 中国疾控中心结核病预防控制中心 北京.
第十三章 医学统计学方法的基本概念和基本步骤
SCI 论文网 SCI论文写作 ——诊断试验类.
SPSS 軟體與統計應用 Ya-Yun Cheng, How-Ran Guo
第二章 语言测试的功能与分类 湖南师范大学外国语学院 邓 杰 教授.
專題研究 第一講 教育研究模式 第二講 專題計畫書之擬定及研究主題選擇 第三講 實驗法 第四講 測驗法 第五講 問卷調查法
資料概說 1.1 基本名詞介紹 1.2 資料型態 1.3 基本操作 商管研究資料分析SPSS的應用 Chapter 1 資料概說.
Dr. Baokun Li 经济实验教学中心 商务数据挖掘中心
第 3 章 資料分類與蒐集 1.進行研究過程中最重要的步驟 2.資料收集與實驗設計具有關連性.
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
數據挖掘 課程 王海 深圳國泰安教育技術股份有限公司.
Chapter 15 複迴歸.
How to Use SPSS in Biomedical Data analysis
第1章 统计学的基本概念 什么是统计学 基本概念.
生物統計與SAS軟體課程教學(三) 雙變項統計分析(一)
医学统计学 8 主讲人 陶育纯 医学统计学 8 主讲人 陶育纯
血压偏高护士人群的饮食行为研究 学 生:吴修龙 指导老师:胡传来 教授 专 业:预防医学 学 号:
§9.3 线性回归分析 一. 什么是回归分析 相关分析研究变量之间相关的方向和相关的程度,但是相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。 回归分析则是研究变量之间的数量变化规律的一种方法。
医学统计学 Medical Statistics.
了解如何评估一个LR模型的好坏 Mikezgzhao.
多元迴歸 Multiple Regression
第一章 统计学及其基本概念 南京财经大学统计学系.
回归分析 线性回归 Logistic回归 对数线性模型
经济长周期视角下的保险资金运用研究 北京大学经济学院 朱南军 中国人民大学汉青研究院 翟建辉 清华大学工程物理系 冯玉林
STATISTICA統計軟體的應用 第二講:廻歸與ANOVA
Chapter 8 Liner Regression and Correlation 第八章 直线回归和相关
第四章 测试效度及其 验证方法(一) 湖南师范大学外国语学院 邓 杰 教授.
SAS  統計程序實作 CONTENTS By DR. Yang , Yi-Chiang /11/11.
初級統計學 陳信如.
次数依变量模型 (Models for Count Outcomes)
類別資料分析(Categorical Data Analysis)
Dr. Baokun Li 经济实验教学中心 商务数据挖掘中心
第七章 SPSS的非参数检验.
類別資料分析(Categorical Data Analysis)
簡單迴歸模型的基本假設 用最小平方法(OLS-ordinary least square)找到一個迴歸式:
欢迎访问 下载课件和数据 2018/11/30 中国人民大学六西格玛质量管理研究中心.
Logistic Regression Appiled Linear Statistical Models,由Neter等著
统计软件应用 7 主讲人 陶育纯 SPSS统计分析 统计软件应用 7 主讲人 陶育纯 教案.
Chapter 14 Simple Linear Regression
Tel: 第11章 SPSS在时间序列预测中的应用 周早弘 旅游与城市管理学院
第四章 相关分析与回归分析 4.1 简单相关分析 4.2 回归分析 4.3 非线性回归.
Interval Estimation區間估計
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
主講人 陳陸輝 特聘研究員兼主任 政治大學 選舉研究中心
線性相關與直線迴歸 基本概念 線性相關:兩個連續變項的共變關係,且有線性關係。所謂 的線性關係乃指兩個變項的關係可以被一條最具
交叉表格分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2011/7/13.
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
第四章 测试效度及其 验证方法(一) 湖南师范大学外国语学院 邓 杰 教授.
第9章 方差分析 介绍 1、方差分析的概念 2、方差分析的过程.
MyLibrary ——数字图书馆的个性化服务
生物統計 1 課程簡介 (Introduction)
一、迴歸分析的基本概念 二、SPSS的線性迴歸分析 三、迴歸模型的檢驗與意義
第 9 章 估計與信賴區間.
相關統計觀念復習 Review II.
Design and Analysis of Experiments Final Report of Project
社会研究方法 第7讲:社会统计2.
統計學簡介 許明宗.
SAS软件应用基础 SAS过程步.
研究所生物統計課程整合說明 課程規劃及修課建議 楊奕馨 高雄醫學大學 藥學系 研究所生統課程授課教師
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心
医学统计学 (Medical Statistics)
第八章 均值比较与检验 2019/5/10.
第7章 基本统计分析 2019/5/14.
分类变量资料的统计推断.
统计工具的使用方法 主讲人 陶育纯 统计工具的使用方法 主讲人 陶育纯
Multiple Regression: Estimation and Hypothesis Testing
线性分类 方匡南 教授 博士生导师 耶鲁大学博士后 厦门大学数据挖掘研究中心 副主任 厦门大学经济学院统计系 中华数据挖掘协会(台湾) 顾问
地理資料 包含兩部分 地理位置 表明這個地理資料的位置在何處。地理資料為空間資料的一種,因此必須對空間中的位置加以標定 屬性
Presentation transcript:

Logistic回归 Logistic regression 研究生《医学统计学》

第一节.非条件logistic回归 第二节.条件logistic回归 第三节. 应用及其注意事项 流行病与卫生统计学系

什么情况下采用Logistic回归 医学研究中常碰到应变量的可能取值仅有两个(即二分类变量),如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴露等,显然这类资料不满足多元(重)回归的条件 流行病与卫生统计学系

实例 Brown(1980)在术前检查了53例前列腺癌患者,拟用年龄(AGE)、酸性磷酸酯酶(ACID)两个连续型的变量,X射线(X_RAY)、术前探针活检病理分级(GRADE)、直肠指检肿瘤的大小与位置(STAGE)三个分类变量与手术探查结果变量NODES(1、0分别表示癌症淋巴结转移与未转移 )建立淋巴结转移的预报模型。 流行病与卫生统计学系

(一)53例接受手术的前列腺癌患者情况 流行病与卫生统计学系

(二)26例冠心病病人和28例对照进行病例对照研究 流行病与卫生统计学系

26例冠心病病人和28例对照者进行病例对照研究 流行病与卫生统计学系

一、logistic回归模型 流行病与卫生统计学系

概率预报模型 流行病与卫生统计学系

二、模型的参数估计 Logistic回归参数的估计通常采用最大似然法(maximum likelihood,ML)。最大似然法的基本思想是先建立似然函数与对数似然函数,再通过使对数似然函数最大求解相应的参数值,所得到的估计值称为参数的最大似然估计值。 流行病与卫生统计学系

参数估计的公式 流行病与卫生统计学系

三、回归参数的假设检验 流行病与卫生统计学系

优势比及其可信区间 流行病与卫生统计学系

标准化回归参数 用于评价各自变量对模型的贡献大小 流行病与卫生统计学系

SAS程序 流行病与卫生统计学系

The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates 流行病与卫生统计学系

预报模型 流行病与卫生统计学系

The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates 流行病与卫生统计学系

预报模型 流行病与卫生统计学系

四、回归参数的意义 当只有一个自变量时,以相应的预报概率 为纵轴,自变量 为横轴,可绘制出一条S形曲线。回归参数的正负符号与绝对值大小,分别决定了S形曲线的方向与形状 流行病与卫生统计学系

流行病与卫生统计学系

优势比改变exp(bj)个单位 流行病与卫生统计学系

流行病与卫生统计学系

流行病与卫生统计学系

五、整个回归模型的假设检验 流行病与卫生统计学系

似然比检验(likelihood ratio test) 流行病与卫生统计学系

ROC曲线模型评价 流行病与卫生统计学系

图16-2 Logistic回归预报能力的ROC曲线 流行病与卫生统计学系

六、logistic逐步回归(变量筛选) MODEL语句加入选项“ SELECTION=STEPWISE SLE=0.10 SLS=0.10;” 常采用似然比检验: 决定自变量是否引入或剔除。 流行病与卫生统计学系

模型中有X5、X6、X8, 看是否引入X1 模型含X5、X6、X8的模型的负二倍 对数似然为: =50.402 对数似然为: =50.402 模型含X1、X5、X6、X8的模型的负二倍 对数似然为: =46.224 流行病与卫生统计学系

第二节.条件logistic回归 流行病与卫生统计学系

条件似然函数 流行病与卫生统计学系

1:3配对的例子 流行病与卫生统计学系

1:2配对的例子 流行病与卫生统计学系

表16-7条件logistic回归的SAS程序 流行病与卫生统计学系

结果 流行病与卫生统计学系

第三节 应用及其注意事项 应变量为(二项)分类的资料 (预测、判别、危险因素分析等等) 流行病与卫生统计学系

注意事项 分类自变量的哑变量编码 为了便于解释,对二项分类变量一般按0、1编码,一般以0表示阴性或较轻情况,而1表示阳性或较严重情况。如果对二项分类变量按+1与-1编码,那么所得的 ,容易造成错误的解释。 流行病与卫生统计学系

西、中西、中三种疗法哑变量化 原资料 哑变量化 流行病与卫生统计学系 姓名 性别 年龄 疗法 张山 1 50 中西 李四 20 西 王五 18 中 刘六 70 赵七 35 孙八 29 姓名 性别 年龄 X1 X2 张山 1 50 李四 20 王五 18 刘六 70 赵七 35 孙八 29 流行病与卫生统计学系

注意事项 2.自变量的筛选 不同的筛选方法有时会产生不同的模型。实际工作中可同时采用这些方法,然后根据专业的可解释性、模型的节约性和资料采集的方便性等,决定采用何种方法的计算结果。 流行病与卫生统计学系

注意事项 3.交互作用 交互作用的分析十分复杂,应根据临床意义与实际情况酌情使用。 流行病与卫生统计学系

注意事项 应变量 4. 多分类logistic回归 心理疾病分为精神分裂症、抑郁症、神经官能症等(名义变量nominal variables);疗效评价分为无效、好转、显效、痊愈(有序变量ordinal variables)。 参见第17章 流行病与卫生统计学系

SPSS软件计算 Analyze Regression Binary Logistic… Dependent: y Covariates: x1~ x8 Method: Forward Ward Save…—— Predicted Values  Probabilities  Group membership Option——  CI for exp 95% Probability for Stepwise Entry: 0.1 Removal 0.15

DATA samp16_1; INPUT x_ray grade stage age acid nodes; CARDS; ...... ; PROC LOGISTIC DESCENDING; MODEL nodes=x_ray grade stage age acid/RISKLIMITS; OUTPUT OUT=pred PROB=pred; PROC PRINT DATA=pred; RUN;

The SAS System 22:07 Monday, November 29, 2005 1 The LOGISTIC Procedure Model Information Data Set WORK.SAMP16_1 Response Variable nodes Number of Response Levels 2 Number of Observations 53 Model binary logit Optimization Technique Fisher's scoring Response Profile Ordered Total Value nodes Frequency 1 1 20 2 0 33 Probability modeled is nodes=1.

Model Convergence Status Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics Intercept Intercept and Criterion Only Covariates AIC 72.252 60.126 SC 74.222 71.948 -2 Log L 70.252 48.126 Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr > ChiSq Likelihood Ratio 22.1264 5 0.0005 Score 19.4514 5 0.0016 Wald 13.1406 5 0.0221

The SAS System 22:07 Monday, November 29, 2005 2 The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept 1 0.0618 3.4599 0.0003 0.9857 x_ray 1 2.0453 0.8072 6.4208 0.0113 grade 1 0.7614 0.7708 0.9759 0.3232 stage 1 1.5641 0.7740 4.0835 0.0433 age 1 -0.0693 0.0579 1.4320 0.2314 acid 1 0.0243 0.0132 3.4230 0.0643

The SAS System 22:07 Monday, November 29, 2005 2 The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept 1 0.0618 3.4599 0.0003 0.9857 x_ray 1 2.0453 0.8072 6.4208 0.0113 grade 1 0.7614 0.7708 0.9759 0.3232 stage 1 1.5641 0.7740 4.0835 0.0433 age 1 -0.0693 0.0579 1.4320 0.2314 acid 1 0.0243 0.0132 3.4230 0.0643 Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits x_ray 7.732 1.589 37.614 grade 2.141 0.473 9.700 stage 4.778 1.048 21.783 age 0.933 0.833 1.045 acid 1.025 0.999 1.051

Association of Predicted Probabilities and Observed Responses Percent Concordant 84.5 Somers' D 0.694 Percent Discordant 15.2 Gamma 0.696 Percent Tied 0.3 Tau-a 0.332 Pairs 660 c 0.847 Wald Confidence Interval for Adjusted Odds Ratios Effect Unit Estimate 95% Confidence Limits x_ray 1.0000 7.732 1.589 37.614 grade 1.0000 2.141 0.473 9.700 stage 1.0000 4.778 1.048 21.783 age 1.0000 0.933 0.833 1.045 acid 1.0000 1.025 0.999 1.051

Obs no x_ray grade stage age acid nodes _LEVEL_ pred 1 1 0 1 1 64 40 0 1 0.25511 2 2 0 0 1 63 40 0 1 0.14633 3 3 1 0 0 65 46 0 1 0.21842 4 4 0 1 0 67 47 0 1 0.06459 。。。。。 。。。。。。 。。。。。 。 50 50 1 0 1 64 89 1 1 0.80302 51 51 0 1 0 59 99 1 1 0.29880 52 52 1 1 1 68 126 1 1 0.94215 53 53 1 0 0 61 136 1 1 0.76730