深圳人口与医疗需求预测 深圳大学 吴心弘 杨杰 蔡炜城 1
一、总体思路与假设 问题一 分析近十年常住、非常住人口变化特征 根据历史数据分析 预测未来十年人口数量和结构发展趋势 DGM(2,1)-ARMA组合模型; 修正的Leslie模型 全市和各区医疗床位需求 医院病床配置的推荐标准公式 根据预测数据和 问题二 预测几种疾病在不同类型医疗机构床位需求 BP神经网络
一、总体思路与假设 1.收集的数据准确可靠; 2.题中指的常住人口即为户籍人口,流动人口即为非户籍人口,为避免歧义,居住时间在1年以下1个月以上则称为暂住人口; 3. 假设一对夫妻在一次育龄期间只生育一个孩子; 4.非户籍人口不在深圳生育子女,每年新增出生婴儿均为户籍人口妇女生产; 5.非户籍人口迁移入户籍人口的年龄段局限在[20,49]岁区间内,迁移出深圳的年龄段局限在50岁及以上人口; 6.生育年龄在[20,49]区间范围内,且生育率保持不变; 7.深圳市外向深圳市转移的非户籍人口年龄区间局限在[20,49]区间范围内; 8.生育率和死亡率都只跟年龄有关,将时间离散化,5个年龄为一年龄组,同一年龄组的死亡率相等,为各个年龄死亡率的平均值; 9. 深圳市同年龄人口死亡率约为全国城市死亡率的0.8; 10. 年龄大于或等于85岁统一分为一组,死亡率相等。
二、分析近十年人口变化特征 1.2010年末全市常住人口为1037.2万人,同2001年末的724.57万人相比,共增加312.63万人,增长43.15%,年平均增长率为4.07%。 2. 2010年末户籍人口达251.03万人,与2001年的132.04万人相比,共增加了118.99万人,增长0.9倍,年平均增加13.22万人,年平均增长7.40%。 3.深圳常住人口中,有786.17万人是非户籍人口,占常住总人口的75.8%,占四分之三强。
三、未来十年人口数量和结构发展趋势 未来十年人口数量与结构 2011~2015 短期(5年) DGM(2,1)-ARMA组合模型 2011~2020 长期(10年) Leslie模型 修正的
1.DGM(2,1)-ARMA组合模型 通过观察历史数据可知,深圳市人口的时间序列为既含有确定性的动态趋势又含有随机性波动的非平稳时间序列。对于随机性时间序列,自回归移动平均序列ARMA是最成熟的统计学分析方法之一,而灰色系统理论则是一种动态趋势预测理论,所以我们考虑建立DGM(2,1)-ARMA(p,q)组合预测模型。应用灰色系统理论建立深圳市历年人口趋势项且含有残差修正的模型,然后对剔除趋势项后的数据进行时间序列分析,建立ARMA模型。最后,将两组数据结合对深圳市人口进行预测。该方法容易实现,预测准确,具有较高的预测精度。
1.DGM(2,1)-ARMA组合模型 对于户籍人口,最小二乘法拟合参数为 DGM的时间响应序列为 作1-IAGO还原便可得到历年户籍人口数量趋势项; 同样地,对于非户籍户口 DGM的时间响应序列为 同样作1-IAGO还原,便可得到历年非户籍人口数量趋势项。
1.DGM(2,1)-ARMA组合模型 户籍人口随机项AIC数值列表 非户籍人口随机项AIC数值列表 p Q 1 2 3 4 -6.734459 -7.355794 -8.476037 -8.851022 -7.730144 -9.341253 -9.231236 -9.327652 -8.736740 -9.243925 -9.137552 -9.648925 -8.829565 -8.754884 -9.361485 -9.581732 -9.211502 -9.367384 -9.532327 -8.960144 非户籍人口随机项AIC数值列表 p Q 1 2 3 4 -7.236086 -7.770317 -7.772638 -8.090615 -7.320500 -7.652648 -7.655535 -7.539957 -7.567492 -7.918939 -7.516798 -7.335341 -7.519322 -7.426339 -7.300771 -7.985580 -7.659784 -8.072167 -8.667595 -7.991492
DGM(2,1)-ARMA组合模型
DGM(2,1)-ARMA组合模型
2011年~2015年人口预测数据(万人)
2011年~2015年深圳市户籍人口比重趋势图
2.Leslie模型的修正 分析一个地区人口发展的趋势离不开现在和今后各类人口数量、性别比例和年龄结构特征等的因素,对于深圳这样一个特区城市,其人口变化趋势更是要结合具体数据进行实例分析。上面的模型虽然在短期内对人口增长趋势有较强的预测精度,但是忽略了以上诸多因素的共同影响,使得分析人口变化的长期特征的有效性存在明显缺陷。 前面的模型没有考虑人口的年龄结构,只对各年度的人口总数进行预测。如果要研究未来人口的素质构成、人口的整体素质、人口的增长规律等,还需对人口结构未来的发展状况进行研究。因此,接下来主要利用Leslie模型进一步对人口的年龄结构的发展趋势及变化规律等进行预测分析。
2.Leslie模型的修正 对传统Leslie模型的几点修正:
首先,我们根据深圳市人口发展特点做出此流程图 为非户籍人口的生育; 为市外人口对深圳市非户籍人口的迁移; 深圳市非户籍人口的返乡; 户籍人口的生育; 为非户籍人口对户籍人口的转变;
参照2005年深圳分年龄、性别人口数据抽样调查表,按照5岁为一个年龄组,可划18个年龄组,其中每个年龄段的生育率,死亡率,男女比例,都是通过队该年龄组求平均来得到。我们同样地以五年为一个时段,则k时段深圳市户籍女性人口总量 的变化规律由以下具体分析得到。 首先,时段k+1第一年龄组深圳市户籍女性人口总量是时段k各年龄组生育数量之和,即 其中P可由新生儿男女性别比求出。
其次,时段k+1第i+1年龄组的深圳户籍女性人口总量是时段k第i年龄组存活下来的数量,即 (i=1,2,…17;j=5,…10) 记时段k深圳市户籍女性人口总量按年龄组的分布向量为 (n=18) 由生育率 B(i)和存活率1-Dw(i)构成的矩阵
由非深户籍迁入深圳户籍构成的矩阵 所以,时段k深圳市户籍女性人口总量为
采用迭代法可用初值 和 求出 ,具体如下 同样的方法适用于深圳市户籍男性人口,在此不作赘述
对于非户籍人口,设其初值为 则有
其中
三、全市和各区医疗床位需求 对于医疗床位需求的测算方法,我们采用1999年卫生部统计信息中心饶克勤、陈育德提出的病床需要量、一员病床配置的推荐标准模型,如下:
1、全市医疗床位需求 查阅相关文献可得,2010年深圳市医疗机构平均住院天数为8天;由2010年深圳市医疗机构病床使用率为89.5%,可得平均每家医院病床开放日为326天。综合分析相关文献推测得深圳市年龄别住院率如下图。
1、全市医疗床位需求 综合以上查阅所得数据和表7中数据,为方便计算,不考虑床位潜在需求量的年龄别,假定潜在需求量和暂住人口病床需求量总和为医院病床基本需求量的5%,根据医院病床标准化需求量的测算方法得到: 2015年的医疗床位标准化需求为40420张 2020年的医疗床位标准化需求为49345张
2、各区医疗床位需求 要想得到各个区的床位配置数,由于各个区的年龄结构不一致,仅仅用人口总数比重加权是欠缺周全的,因此我们根据医院病床需求量的公式引进了一个新的权重因子: 其中:
各区权重因子 2015和2020年深圳市各个区床位需求预测 年份 罗湖区 福田区 南山区 宝安区 龙岗区 盐田区 光明新区 坪山新区 6089 9692 5338 8682 7353 915 1311 1040 2020 7433 11832 6516 10599 8976 1117 1599 1270
四、两种疾病的床位需求 BP神经网络方法由于实用性强,被广泛应用于各个领域,它能学习和存贮大量的输入输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。其精度受到神经网络结构、样本的选取以及数据的预处理方式等诸多因素的影响,在床位需求预测建模过程中需对这些细节进一步处理。预测床位需求的拓扑结构,采用典型的3层BP网络,我们选取深圳市人口的总发病率,深圳市30岁年龄以上人数,住院天数作为输入量。恶性肿瘤发病人数,脑血管发病人数为输出量。应用BP网络预测床位需求包括下面4个基本步骤: 收集床位需求训练和测试样本; 确定疾病发病人数预测神经网络结构形式; 进行网络模型训练; 采用训练后的网络完成床位需求预测应用计算。
四、两种疾病的床位需求 模型采用3层输入,2层输出,输出是预测未来五年恶性肿瘤和脑血管病的。根据公式对隐层节点数进行试算,通过训练次数和总体误差确定最佳的隐层神经元个数。最终建立网络结构为3—7—2,设定学习参数为0.05,学习精度为0.000 65,最大训练次数为10000。使用构建好的神经网络对测试样本进行预测,通过使用matlab软件得到训练精度如下图所示。
四、两种疾病的床位需求
四、两种疾病的床位需求
2011年~2015年深圳市恶性肿瘤及脑血管病发病人数预测 四、两种疾病的床位需求 得到未来五年这两种疾病的发病人数如下表 2011年~2015年深圳市恶性肿瘤及脑血管病发病人数预测 2011 2012 2013 2014 2015 恶性肿瘤 13673 1.312 15048 15744 16017 脑血管病 17874 18505 19275 20340 22282 考虑到潜在病床需求量和流动人口需求量修正得未来五年床位需求量如下表 修正后2011年~2015年深圳市恶性肿瘤及脑血管病发病人数的预测 2011 2012 2013 2014 2015 恶性肿瘤 15040 15743 16552 17318 17618 脑血管病 19661 20355 21202 22374 24510
四、两种疾病的床位需求 对于上述疾病在不同医疗机构就医的床位需求,按深圳市的二级服务架构分:区域医疗中心(含市、区政府办医院)和基层卫生机构(含社康中心、街道医院、社会办医院、门诊部、私人诊所、卫生室及其它)占全市总诊疗量的比例(分别为33.3%和66.7%)进行计算,得区域医疗中心在未来五年的恶性肿瘤床位需求为:5008.32,5242.419,5511.816,5766.894,5866.794,脑血管病的床位需求为6547.113,6778.215,7060.266,7450.542,8161.83;基层卫生机构在未来五年恶性肿瘤床位需求为:10031.68,10500.581,11040.184,11551.106,11751.206,脑血管病的床位需求为13113.887,13576.785,14141.734,14923.458,16348.17。如需求更具体分类,则可以进一步按照更低一级的医疗机构的疾病诊疗量进行计算。
五、模型优缺点 较为创新性地建立了DGM(2,1)-ARMA模型组合模型,结合两者的优缺点,得到与实际偏差较小的预测结果; 结合深圳人口特点,独创性地引入了适合深圳人口迁移特色的迁移矩阵来改进已有的Leslie模型; 预测各区床位医疗需求时,科学合理地引进了含有年龄结构的权重因子; BP神经网络应用于医疗床位需求的预测,综合考虑各方面因素,预测结果可信度较高。
五、模型优缺点 Leslie模型的建立选用了较多的模型假设,也没有考虑到随着时间推移死亡率会不断下降的趋势,同时由于所得到的数据十分有限,很多参数都是作为一个近似估计,编程迭代所得结果会有较大的偏差。 BP神经网络模型的输入参数由于数据十分有限,只是根据已有的数据进行插值和拟合,这使得模拟结果不是非常地稳定可靠。
六、模型的改进与优化 ARMA时间序列分析可以细化到年龄和性别结构,组建一个多目标动态模型; Leslie人口模型可以结合城市化进程的人口特点对参数进行细化分析,使得结果更为可靠; BP神经网络模型还可以做进一步改进,优化各个参数和训练方法,提高模拟和预测性能。
六、模型的改进与优化 对于主办方提出的新的三点要求,我们给出如下的解决方案: 1.如果十二五期间深圳户籍人口的管理实行较为宽松的政策,每年将有更多的户籍人口转为非户籍人口。其实对于这一政策性因素,本文在Leslie模型的部分已经引入了迁移矩阵来说明非户籍人口向户籍人口的迁移过程,在具体实施过程中可以根据深圳市十二五人口发展规划纲要的要求对矩阵中的参数进行修改(如扩大户籍人口比例可将参数加倍),然后进行迭代计算。
六、模型的改进与优化
六、模型的改进与优化
六、模型的改进与优化 2.如果非户籍年轻人口在深圳安家,会有老年人口迁入深圳。这里非户籍年轻人口应该暗指没有生育子女的年轻人(否则要考虑留守儿童的迁入迁出问题),那么这一人群中有多少比例的年轻人口想在深圳安家,同时又有多少比例的年轻人口想把父母接到深圳,这需要相关部门进行系统全面的调查,然后对具体人数乘以4(夫妻双方的父母)。鉴于我们的能力所限,我们无法给出具体数字。
六、模型的改进与优化 3.其他政策(住房政策和高考政策等)的影响随机性大,较难预测,尤其是参数设置有难度。目前我们建议通过Leslie模型中的迁移矩阵的参数设置对这一问题进行间接的估计。
谢谢大家! 恳请各位指正!