Download presentation
Presentation is loading. Please wait.
1
Logistic回归 Logistic regression 研究生《医学统计学》
2
第一节.非条件logistic回归 第二节.条件logistic回归 第三节. 应用及其注意事项 流行病与卫生统计学系
3
什么情况下采用Logistic回归 医学研究中常碰到应变量的可能取值仅有两个(即二分类变量),如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴露等,显然这类资料不满足多元(重)回归的条件 流行病与卫生统计学系
4
实例 Brown(1980)在术前检查了53例前列腺癌患者,拟用年龄(AGE)、酸性磷酸酯酶(ACID)两个连续型的变量,X射线(X_RAY)、术前探针活检病理分级(GRADE)、直肠指检肿瘤的大小与位置(STAGE)三个分类变量与手术探查结果变量NODES(1、0分别表示癌症淋巴结转移与未转移 )建立淋巴结转移的预报模型。 流行病与卫生统计学系
5
(一)53例接受手术的前列腺癌患者情况 流行病与卫生统计学系
6
(二)26例冠心病病人和28例对照进行病例对照研究
流行病与卫生统计学系
7
26例冠心病病人和28例对照者进行病例对照研究
流行病与卫生统计学系
8
一、logistic回归模型 流行病与卫生统计学系
9
概率预报模型 流行病与卫生统计学系
10
二、模型的参数估计 Logistic回归参数的估计通常采用最大似然法(maximum likelihood,ML)。最大似然法的基本思想是先建立似然函数与对数似然函数,再通过使对数似然函数最大求解相应的参数值,所得到的估计值称为参数的最大似然估计值。 流行病与卫生统计学系
11
参数估计的公式 流行病与卫生统计学系
12
三、回归参数的假设检验 流行病与卫生统计学系
13
优势比及其可信区间 流行病与卫生统计学系
14
标准化回归参数 用于评价各自变量对模型的贡献大小 流行病与卫生统计学系
15
SAS程序 流行病与卫生统计学系
16
The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates
流行病与卫生统计学系
17
预报模型 流行病与卫生统计学系
18
The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates
流行病与卫生统计学系
19
预报模型 流行病与卫生统计学系
20
四、回归参数的意义 当只有一个自变量时,以相应的预报概率 为纵轴,自变量 为横轴,可绘制出一条S形曲线。回归参数的正负符号与绝对值大小,分别决定了S形曲线的方向与形状 流行病与卫生统计学系
21
流行病与卫生统计学系
22
优势比改变exp(bj)个单位 流行病与卫生统计学系
23
流行病与卫生统计学系
24
流行病与卫生统计学系
25
五、整个回归模型的假设检验 流行病与卫生统计学系
26
似然比检验(likelihood ratio test)
流行病与卫生统计学系
27
ROC曲线模型评价 流行病与卫生统计学系
28
图16-2 Logistic回归预报能力的ROC曲线
流行病与卫生统计学系
29
六、logistic逐步回归(变量筛选)
MODEL语句加入选项“ SELECTION=STEPWISE SLE=0.10 SLS=0.10;” 常采用似然比检验: 决定自变量是否引入或剔除。 流行病与卫生统计学系
30
模型中有X5、X6、X8, 看是否引入X1 模型含X5、X6、X8的模型的负二倍 对数似然为: =50.402
对数似然为: =50.402 模型含X1、X5、X6、X8的模型的负二倍 对数似然为: =46.224 流行病与卫生统计学系
31
第二节.条件logistic回归 流行病与卫生统计学系
32
条件似然函数 流行病与卫生统计学系
33
1:3配对的例子 流行病与卫生统计学系
34
1:2配对的例子 流行病与卫生统计学系
35
表16-7条件logistic回归的SAS程序
流行病与卫生统计学系
36
结果 流行病与卫生统计学系
37
第三节 应用及其注意事项 应变量为(二项)分类的资料 (预测、判别、危险因素分析等等) 流行病与卫生统计学系
38
注意事项 分类自变量的哑变量编码 为了便于解释,对二项分类变量一般按0、1编码,一般以0表示阴性或较轻情况,而1表示阳性或较严重情况。如果对二项分类变量按+1与-1编码,那么所得的 ,容易造成错误的解释。 流行病与卫生统计学系
39
西、中西、中三种疗法哑变量化 原资料 哑变量化 流行病与卫生统计学系 姓名 性别 年龄 疗法 张山 1 50 中西 李四 20 西 王五
18 中 刘六 70 赵七 35 孙八 29 姓名 性别 年龄 X1 X2 张山 1 50 李四 20 王五 18 刘六 70 赵七 35 孙八 29 流行病与卫生统计学系
40
注意事项 2.自变量的筛选 不同的筛选方法有时会产生不同的模型。实际工作中可同时采用这些方法,然后根据专业的可解释性、模型的节约性和资料采集的方便性等,决定采用何种方法的计算结果。 流行病与卫生统计学系
41
注意事项 3.交互作用 交互作用的分析十分复杂,应根据临床意义与实际情况酌情使用。 流行病与卫生统计学系
42
注意事项 应变量 4. 多分类logistic回归
心理疾病分为精神分裂症、抑郁症、神经官能症等(名义变量nominal variables);疗效评价分为无效、好转、显效、痊愈(有序变量ordinal variables)。 参见第17章 流行病与卫生统计学系
43
SPSS软件计算 Analyze Regression Binary Logistic… Dependent: y
Covariates: x1~ x8 Method: Forward Ward Save…—— Predicted Values Probabilities Group membership Option—— CI for exp 95% Probability for Stepwise Entry: Removal
44
DATA samp16_1; INPUT x_ray grade stage age acid nodes; CARDS; ...... ; PROC LOGISTIC DESCENDING; MODEL nodes=x_ray grade stage age acid/RISKLIMITS; OUTPUT OUT=pred PROB=pred; PROC PRINT DATA=pred; RUN;
45
The SAS System 22:07 Monday, November 29, 2005 1
The LOGISTIC Procedure Model Information Data Set WORK.SAMP16_1 Response Variable nodes Number of Response Levels 2 Number of Observations Model binary logit Optimization Technique Fisher's scoring Response Profile Ordered Total Value nodes Frequency Probability modeled is nodes=1.
46
Model Convergence Status
Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics Intercept Intercept and Criterion Only Covariates AIC SC -2 Log L Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr > ChiSq Likelihood Ratio Score Wald
47
The SAS System 22:07 Monday, November 29, 2005 2
The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept x_ray grade stage age acid
48
The SAS System 22:07 Monday, November 29, 2005 2
The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept x_ray grade stage age acid Odds Ratio Estimates Point % Wald Effect Estimate Confidence Limits x_ray grade stage age acid
49
Association of Predicted Probabilities and Observed Responses
Percent Concordant Somers' D Percent Discordant Gamma Percent Tied Tau-a Pairs c Wald Confidence Interval for Adjusted Odds Ratios Effect Unit Estimate % Confidence Limits x_ray grade stage age acid
50
Obs no x_ray grade stage age acid nodes _LEVEL_ pred
。。。。。 。。。。。。 。。。。。 。
Similar presentations