制作:张大远 逯遥 指导教师:司书红 学校:兰州交通大学 2012年“深圳杯”全国大学生数学建模夏令营 深圳市人口与医疗需求预测 制作:张大远 逯遥 指导教师:司书红 学校:兰州交通大学
目 录 摘要 1 问题提出及分析 2 建模过程 3 结果分析与检验 4 模型的评价与改进 5
一. 摘要 问题一:根据题目要求,选择常住人口和非户籍人口数量为研究对象,使用excel对原始数据进行预处理,通过分析数据,建立灰色预测模型GM(1,1),结合matlab软件求出未来十年深圳市常住和非户籍人口数量。 对未来十年的人口结构进行分析,计算出各年龄段人口数,再根据各年龄段患病率得出患者人数,累加得到总患病人数。利用患者和床位数的关系式,计算出全市及各区的医疗床位需求量。 1.对数据作的预处理---从原始数据中选出常住人口和非户籍人口作为研究对象,进行预测; 再对各个年龄段人口的数据进行整合计算。得出所需的数据。 问题二:使用线性拟合工具cftool得出各年份人口数量与时间的关系式。查找资料得出高血压和糖尿病在不同年龄段的患病率和住院率,得出住院患者数量。再通过患者和床位数的关系式,求出两种疾病在不同类型医院的床位需求量。
二.问题的提出及分析 2.1问题的提出 问题一:分析深圳近十年常住人口、非常住人口变化特征,预测未来十年深圳市人口数量和结构的发展趋势,以此为基础预测未来全市和各区医疗床位需求; 问题二:根据深圳市人口的年龄结构和患病情况及所收集的数据,选择预测几种疾病在不同类型的医疗机构就医的床位需求。
2.2问题分析 问题1 (1) 分析可知人口数量模型为灰色模型,采用灰色预测方法预测出未来十年深圳市的常住人口和非户籍人口数量。 (2)通过对2000、2005、2010年的人口结构的分析,得出深圳市人口结构基本稳定的结论,计算得到各年龄段人口数量,再根据不同年龄段的患病率得出患者数量,结合患者数量和床位需求量的关系式,最终得出未来全市和各区的床位需求量。
问题2 (1)查找资料得出高血压和糖尿病在不同年龄段的患病率,再根据各年龄段的人口数,求出两种疾病的患病人数。 (2)根据已知的患者数与床位数的关系式,预测出两种疾病在不同类型医疗机构的床位需求量。
三.建模过程 3.1问题一 通过查找资料,可知病床需求量与各年龄段人口数、各年龄段患病率、平均住院天数、医院每年平均开放天数有关,关系式如下: 公式来源---
时间序列的数据分析如下 年末常住人口数量如图(1): 图(1) 年末常住人口分布
使用公式 X(1)(K)= X(0)(i) 对数据进行累加后作出图 如图(2): 使用灰色预测方法进行预测的基础--如上解释。 图(2) 累加后年末常住人口分布 为了削弱时间序列的随机性,对时间序列进行一次累加,由上两图可以清晰的看出经过累加后,此时间序列呈线形增长,排除相关影响因素,建立起灰色预测模型。
对数据进行分析后,建立灰色预测模型,通过matlab编程,预测未 来十年常住人口数和非户籍人口数,结果如表(1):(万人) 年份 2011 2012 2013 2014 2015 常住人口数预测 1076.1 1121.2 1168.1 1217.1 1268.1 2016 2017 2018 2019 2020 1321.3 1376.6 1434.3 1494.4 1557.1 年份 2011 2012 2013 2014 2015 非户籍人口数 799.7 825.4 851.9 879.3 907.5 2016 2017 2018 2019 2020 936.7 966.8 997.8 1029.9 1063 表(1) 未来十年人口预测
对于未来十年病床数的预测,首先通过2000年,2005年,2010年三年的年龄分布作图,如图(3): 分析年龄分布情况 对于未来十年病床数的预测,首先通过2000年,2005年,2010年三年的年龄分布作图,如图(3): 图(3) 深圳市各年龄段人口数量分布图 分析上图,并对2000、2005、2010年份的各年龄段人口比例的计算可得,不同年份人口分布基本稳定,所以假设未来十年内,不同年龄人口结构保持不变。并根据具体数据求出各年份的各年龄段人口比例的平均值。
通过查阅相关资料,得出各年龄段患病率如图(4):::: 图(4) 深圳市各年龄段住院率情况图 设平均住院天数、医院每年平均开放天数分别为 , 。得出 D,d数据来源---来自文献【综合性医院平均住院日的比较与研究】,【中国医院】,2010年第六期。
实际需求量与理论值的关系 得出修正后的病床需求量公式: 可得:医院病床总需求量 = 1.3 理论需求量 实际情况下,医院配置病床时,除考虑理论需求量外,还需考虑潜在需求量和流动人口对病床的需求量。 查阅资料得:城市病床潜在需求量为实际利用量的20%;根据第一次国家卫生服务调查和流动人口调查结构估算,流动人口医院病床需要数相当于本地居民需要的10%。所以通过数据计算,可以得出未来的病床需求量。 得出修正后的病床需求量公式: 医院病床总需求量 = 理论需求量 + 潜在需求量 + 流动人口需求量 可得:医院病床总需求量 = 1.3 理论需求量
代入各区的人口比例即可计算出各区所需配置的病床数。 而深圳市各区人口数所占比例如图(5): 代入各区的人口比例即可计算出各区所需配置的病床数。 图(5) 2010年深圳市人口分布情况图
通过上述公式,得出修正后的深圳市和各区的床位数需求量,数据如表(2):(万张) 年份 2011 2012 2013 2014 2015 理论床位数 1.5693 1.6351 1.7035 1.7749 1.8519 修正值 2.0401 2.1257 2.2146 2.3074 2.4075 2016 2017 2018 2019 2020 1.9270 2.0076 2.0918 2.1794 2.2708 2.5050 2.6099 2.7193 2.8332 2.9521 表(2) 未来十年深圳市床位预测
输出结果如图(6):(万张) 图(6) 未来十年深圳市床位预测
未来十年各区床位数需求量如表(3): (万张) 年份 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 宝安区 0.7916 0.8248 0.8593 0.8953 0.9341 0.9720 1.0126 1.0551 1.0993 1.1454 龙岗区 0.3958 0.4124 0.4296 0.4476 0.4671 0.4860 0.5063 0.5275 0.5496 0.5727 福田区 0.2591 0.2700 0.2813 0.2930 0.3058 0.3181 0.3315 0.3454 0.3598 0.3749 南山区 0.2142 0.2232 0.2325 0.2423 0.2528 0.2630 0.2740 0.2855 0.2975 0.3100 罗湖区 0.1816 0.1892 0.1971 0.2054 0.2143 0.2229 0.2323 0.2420 0.2522 0.2627 光明新区 0.0938 0.0978 0.1019 0.1061 0.1107 0.1152 0.1201 0.1251 0.1303 0.1358 坪山新区 0.0612 0.0638 0.0664 0.0692 0.0722 0.0752 0.0783 0.0816 0.0850 0.0886 盐田区 0.0408 0.0425 0.0443 0.0461 0.0482 0.0501 0.0522 0.0544 0.0567 0.0590 表(3) 未来十年各区床位需求量图
3.2 问题二 通过查阅资料,得到不同年龄段人群高血压和糖尿病的患病率和住院率,结合各年龄段人口比例,求出两种疾病的住院患者人数; 将研究对象确定为市级和区级医院,查询得出患者分别在市级、区级医院住院的平均天数。 通过公式: 最终求得两种医院所需配置的病床张数。
3.2.1 通过查阅资料,得到了高血压和糖尿病的不同年龄段患病率表如表(4),(5): <15 15-24 25-34 35-44 45-54 55-64 >65 高血压 患病率(%) 7.8 15.2 27.5 38.5 58.4 63.8 表(4) 各年龄段高血压患病率 绘制成柱状图如图(7),(8): 患病率数据来源---来自文献【城市居民高血压患病状况及影响因素研究】,中国医科大学研究生学术论文。 图(7) 柱状分布图
不同 年龄段 <15 15-24 25-34 35-44 45-54 55-64 >65 糖尿病 患病率(%) 2.3 3.1 2.3 3.1 6.8 11 12.2 表(5) 糖尿病患病率 糖尿病患病率数据---来自文献【城市居民糖尿病患病率及血糖水平年龄分布的特征研究】,【中华中西医杂志】 图(8) 柱状分布图
通过matlab,使用线性拟合工具箱cftool ,拟合出常住人口数的分布函数,如图所示,选择一阶拟合: 得出人口数量和时间的关系式如下: Linear model Poly1: f(x) = p1 x + p2 Coefficients (with 95% confidence bounds): p1 = 33.85 (30.73, 36.97) p2 = -6.701e+004 ( - 7.327e+004, -6.076e+004) 即:f(x)=33.85x-67000 使用线性拟合对常住人口数进行预测的意义--得出常住人口数和年份的关系式,便于进行下一步计算。
根据公式:患病人数= ∑ 某年龄段年段人数 该年龄段人的患病率 根据公式:患病人数= ∑ 某年龄段年段人数 该年龄段人的患病率 得到高血压和糖尿病患病人数。又查得高血压和糖尿病患者需入院治疗的比例分别为16.6%和9.4%。得到两种疾病的住院人数如下表(6)、(7)所示: 年份 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 高血压患者 98.2 101.3 104.4 107.5 110.6 113.7 116.8 119.9 123 126 需住院患者 9.2308 9.5222 9.8136 10.105 10.3964 10.6878 10.9792 11.2706 11.562 11.844 表(6) 未来十年高血压患者住院人数 年份 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 糖尿病患者 21.2 22.4 23.3 24.1 24.9 25.7 26.5 27.3 28.2 29 需住院患者 3.5192 3.7184 3.8678 4.0006 4.1334 4.2662 4.399 4.5318 4.6812 4.814 表(7) 未来十年糖尿病患者住院人数
3.2.2 查阅资料知: (1)大城市年床开放日数为317天,区级则为237天。 (2)高血压和糖尿病患者分别在市级、区级医院的平均住院天数如表(8): 医院类型 市级 区级 疾病 治疗天数 疗养天数 平均天数 高血压 30 46 38 44 41 42.5 糖尿病 18 22 20 24 表(8) 市区级医院平均住院天数表 住院天数数据来源---1、高血压脑叶血肿24例临床和CT分析, 【高血压杂志】 【影响糖尿病患者住院天数的因素分析】,【疾病控制杂志】 通过公式:
可得全市所需高血压及糖尿病病床数如表(9),(10):(万张) 年份 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 高血压 病床数 0.7238 0.7426 0.7708 0.799 0.8178 0.8366 0.8648 0.893 0.9118 0.9306 表(9) 高血压患者所需病床数 年份 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 糖尿病 病床数 0.2213 0.2306 0.2398 0.2490 0.2582 0.2674 0.2767 0.2859 0.2951 0.3034 表(10) 糖尿病患者所需病床数
可得深圳市各区所需高血压及糖尿病病床数如表(11),(12):(万张) 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 宝安区 0.2808 0.2881 0.2991 0.3100 0.3173 0.3246 0.3355 0.3465 0.3538 0.3611 龙岗区 0.1404 0.1441 0.1495 0.1550 0.1587 0.1623 0.1678 0.1732 0.1769 0.1805 福田区 0.0919 0.0943 0.0979 0.1015 0.1039 0.1062 0.1098 0.1134 0.1158 0.1182 南山区 0.0760 0.0780 0.0809 0.0839 0.0859 0.0878 0.0908 0.0938 0.0957 0.0977 罗湖区 0.0644 0.0661 0.0686 0.0711 0.0728 0.0745 0.0770 0.0795 0.0812 0.0828 光明新区 0.0333 0.0342 0.0355 0.0368 0.0376 0.0385 0.0398 0.0411 0.0419 0.0428 坪山新区 0.0217 0.0223 0.0231 0.0240 0.0245 0.0251 0.0259 0.0268 0.0274 0.0279 盐田区 0.0145 0.0149 0.0154 0.0160 0.0164 0.0167 0.0173 0.0179 0.0182 0.0186 表(11) 各区高血压患者所需病床数
2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 宝安区 0.0859 0.0895 0.0930 0.0966 0.1002 0.1038 0.1074 0.1109 0.1145 0.1177 龙岗区 0.0429 0.0447 0.0465 0.0483 0.0501 0.0519 0.0537 0.0555 0.0572 0.0589 福田区 0.0281 0.0293 0.0305 0.0316 0.0328 0.0340 0.0351 0.0363 0.0375 0.0385 南山区 0.0232 0.0242 0.0252 0.0261 0.0271 0.0291 0.0300 0.0310 0.0319 罗湖区 0.0197 0.0205 0.0213 0.0222 0.0230 0.0238 0.0246 0.0254 0.0263 0.0270 光明新区 0.0102 0.0106 0.0110 0.0115 0.0119 0.0123 0.0127 0.0132 0.0136 0.0140 坪山新区 0.0066 0.0069 0.0072 0.0075 0.0077 0.0080 0.0083 0.0086 0.0089 0.0091 盐田区 0.0044 0.0046 0.0048 0.0050 0.0052 0.0053 0.0055 0.0057 0.0059 0.0061 表(12) 各区糖尿病患者所需病床数
四.结果分析与检验 问题一: 灰色模型输出项分析 在上述灰色模型的预测值中,有输出项c,error1,error2,等检验系数,error残差接近于零,证明拟合成功。输出值c的优度检测为合格,即表明可以进行灰色模型处理,且其预测值较为精确, 最优度检验: c= 0.036。优度等级为:好 残差 相对误差 0.000 10.806 0.015 2.944 0.004 3.429 6.512 0.008 13.394 0.016 5.293 0.006 0.750 0.001 2.894 0.003 3.755 4.404 残差是指观测值与预测值(拟合值)之间的差,即是实际观察值与回归估计值的差。
问题二: 通过cftool工具箱进行拟合,得出了相关检验系数的数值,通过这些系数的大小可以得出拟合程度的好坏。得出的系数如下: Goodness of fit: SSE: 634.8 (残差平方和) R-square: 0.9973 (确定系数) Adjusted R-square: 0.997(调整后的确定系数) RMSE: 8.908 (均方残差) 可以得出很好的拟合关系的结论。
五.讨论模型的优缺点 5.1模型的优点 1.预测模型中的灰色预测方法GM(1,1)是最常用的一种预测方法。当系统呈指数变化时,预测精度较高。一般地说,当原始数据为光滑离散数列时,利用GM(1,1)模型能得到较好的拟合和预测精度。其优点是:要求负荷数据少、不考虑分布规律、不考虑变化趋势、运算方便、短期预测精度高、结果易于检验; 2.查找并整合了大量数据,使数据计算和预测更准确; 3.忽略次要因素,简化计算和估计,达到高效的预测; 4.通过多种形式的图象和表格,反映数据之间的内部关系,使问题更为形象直观。
5.2模型的缺点 1.假设深圳市未来十年间的人口结构基本稳定。而实际上深圳市的人口结构趋向于老龄化。因此造成预测结果偏小。 2.假设深圳市未来十年间的高血压和糖尿病的发病率基本保持不变。但是随着人们的生活条件逐年提高,预计这两种“富贵病”的发病率会逐年增高,因此预测出的病床数需求量偏少。
谢谢观看 THE END