第 6 章动态规划掌握最优性原理与动态规划的概念掌握应用动态规划设计求解0-1背包问题、装载问题与最优路径问题等多阶段决策典型案例

Slides:

Advertisements

Similar presentations

人是什么金塔县中学杜志明. 1 、欣赏课文语势充沛、以情动人、方法多样、层次清晰的写作特点。 2 、进一步培养学生深入思考、质疑思辩的能力。 3 、培养学生珍惜时间，奉献青春的崇高思想。教学目标.

Advertisements

《礼记 · 学记》学习心得报告教育的本质与运用主讲人：徐浩明. 一、认识什么是教育二、明白教育的本质三、如何落实德行教育.

年輕駕駛交通工具考上駕照的 18 歲，正好是高中畢業，離家工作、上大學的時候。年輕人對新環境的好奇及生疏，以及尚未養成良好駕駛習慣，造成意外的產生。

2010版基本医疗保险工伤保险和生育保险药品目录调整及管理政策介绍

王同学的苦恼﹗ MC 4.1 诚可贵﹗.

窦娥冤关汉卿感天动地元·关汉卿.

第十五章控制方法.

報告書名:父母會傷人班級:二技幼四甲姓名:吳婉如學號:1A2I0034 指導老師:高家斌

五專醫護類科介紹樹人醫專職業教育組李天豪組長.

幼　兒　遊　戲　訪　談組別：第七組班級：幼保二甲姓名：4A0I0008劉俐音 4A0I0043吳碧娟 4A0I0059劉又甄 4A0I0060江佳霓 4A0I0061蕭靖霓 4A0I0079王毓君.

兵车行杜甫.

人教版语文三年级下册语文园地四作者：佚名来源：网络.

政府採購法規概要報告人：杜國正行政院公共工程委員會企劃處.

媽，我們真的不一樣青少年期與中年期老師：趙品淳老師組員：胡珮玟4A1I0006 馬菀謙4A1I0040

第２课大一统与秦朝中央集权制度的确立课标要求：知道“始皇帝”的来历和郡县制建立的史实，了解中国古代中央集权制度的形成及其影响。

品读论语之四---- 巧言令色非君子.

知其不可而为之.

第十四篇答李翊書韓愈.

苟利国家生死以，岂因祸福避趋之。 ----禁毒英雄，一生为公 --林则徐.

史記貨殖列傳商业篇.

中国画家协会理事、安徽省美术家协会会员、工艺美术师、黄山市邮协常务理事余承平主讲

陈情表李密龙江一中高二语文备课组.

之魔析妖鬼解怪大沈家仪小组出品.

第四章运筹学模型本章重点：线性规划基础模型、目标规划模型、运输模型及其应用、图论模型、最小树问题、最短路问题.

邰港生物科技公司參訪.

秋天何其芳.

汽车在( )上行驶.

人教新课标版（2013修订）初中七上《寓言四则》.

高考复习专题文言文翻译

班級：二幼三甲姓名：郭小瑄、詹淑評學號：1A2I0029 、1A2I0025

碗花糕王充闾.

一厘米毕淑敏.

指導老師:陳韻如姓名:吳宜珊學號:4A0I0911 班級:幼保二乙

安恩和奶牛约翰尼斯·延森.

汉字的构造.

诵读欣赏古代诗词三首.

推行使用散装预拌砂浆全面贯彻落实禁现政策

我班最喜愛的零食黃行杰.

在生活中，我们看见姓李的老师称李老师，看见姓李的会计称李会计，看见姓李的厂长称李厂长，那看见姓李的粉刷师傅，我们称他什么呢？为什么称河北大街一家营造厂的师傅为“刷子李”呢？ “刷子李” 的技艺到底有多高？今天这节课我们来看看作者是怎样描写的。

第九章长期资产及摊销 2017/3/21.

傳統童玩遊戲創新組別：第八組班級：幼保二甲組員： 4A0I0005柯舒涵 4A0I0011謝孟真

食物在口腔里的变化.

酒中国是一个文化历史悠久的国家.

孔乙己鲁迅.

理解常见文言实词在文中的含义.

杨玉环（公元719－756年）杨玉环，名玉环，字太真，唐玄宗李隆基的宠妃，原名杨芙蓉（故有芙蓉出水），出生地为四川成都，祖籍山西永济。杨贵妃自小习音律，善歌舞，姿色超群。曾祖父杨汪是隋朝的上柱国、吏部尚书，唐初被李世民所杀，父杨玄琰(yǎn)，是蜀州（四川崇州）司户，其叔父杨玄璬(jiǎo)曾任河南府士曹，杨玉环的童年是在四川度过的，10岁左右，父亲去世，她寄养在洛阳的三叔杨玄璬家。后来又迁往山西永乐（山西永济）。　

左迁至蓝关示侄孙湘韩愈.

科普说明文生物入侵者高天群.

贴近教学服务师生方便老师.

六年级语文下册第四单元指尖的世界.

说一说现在的你和小时候的你相比有什么变化？.

（浙教版）四年级品德与社会下册共同生活的世界第四单元世界之窗第二课时.

文化底蕴与作文第一节：底蕴成句【温馨点拨】：底蕴成句是把含有文化底蕴的内容表达成句。底蕴成句有三种情况：

西游記-金箍棒 xī yóu jì jīn gū bàng.

说说看比较现在的你和四年前的你有什么变化?.

海燕郑振铎.

小学语文二年级下册第一单元.

引例囚徒困境：甲、乙两个人一起携枪准备作案，被警察发现抓了起来。如果两个人都不坦白，警察会以非法携带枪支罪而将二人各判1年；如果其中一人招供而另一人不招，坦白者作为证人将不会被起诉，另一人将会被重判15年；如果两人都招供，则两人都会因罪名各判10年。这两个囚犯该怎么办？斗鸡博弈：两只斗鸡遇到一起，每只斗鸡都有两个行动选择：一是退下来，一是进攻。如果一方退下来，而对方没有退下来，对方获得胜利，这只公鸡则很丢面子；如果对方也退下来，则双方打个平手；如果自己没退下来，而对方退下来，自己则胜利，对方则失败

第一课围城里的男人和女人.

玲玲的画龙山中心小学二年级张冬梅.

第三章行列式第一节线性方程组与行列式第二节排列第三节 n阶行列式第四节余子式与行列式展开第五节克莱姆规则.

20 谈礼貌合肥市螺岗小学赵勋.

Xián 伯牙绝弦安徽淮南市八公山区第二小学　陈燕朵.

16、说勤奋.

第三章线性规划问题的计算机求解.

请同学们仔细观察，这两幅画有什么不同？你认为哪幅画更好？

Presentation transcript:

第 6 章动态规划掌握最优性原理与动态规划的概念掌握应用动态规划设计求解0-1背包问题、装载问题与最优路径问题等多阶段决策典型案例第 6 章动态规划 教学要求掌握最优性原理与动态规划的概念掌握应用动态规划设计求解0-1背包问题、装载问题与最优路径问题等多阶段决策典型案例 本章重点根据案例的实际构建状态转移方程在案例求解基础上理解与掌握最优性原理

6.1 动态规划概述 1. 动态规划的概念 (1) 动态规划（Dynamic programming）是运筹学的一个分支，是求解决策过程最优化的数学方法。 (2) 动态规划处理的对象是多阶段决策问题。 (3) 多阶段决策问题，是指这样的一类特殊的活动过程，问题可以分解成若干相互联系的阶段，在每一个阶段都要做出决策，形成一个决策序列，该决策序列也称为一个策略。对于每一个决策序列，可以在满足问题的约束条件下用一个数值函数（即目标函数）衡量该策略的优劣。多阶段决策问题的最优化目标是获取导致问题最优值的最优决策序列（最优策略），即得到最优解。

2. 最优性原理作为整个过程的最优策略具有这样的性质，无论过去的状态和决策如何，对前面的决策所形成的状态而言，余下的诸决策必须构成最优策略。最优决策序列中的任何子序列都是最优的。 “最优性原理”用数学语言描述：假设为了解决某一多阶段决策过程的优化问题，需要依次作出n个决策D1,D2,…,Dn，如若这个决策序列是最优的，对于任何一个整数k，1<k<n，不论前面k个决策D1,D2,…,Dk是怎样的，以后的最优决策只取决于由前面决策所确定的当前状态，即以后的决策序列Dk+1,Dk+2,…,Dn也是最优的。最优性原理体现为问题的最优子结构特性。最优子结构特性是动态规划求解问题的必要条件。

例如，在数字串847313926中插入5个乘号，分为6个整数相乘，使乘积最大的最优解为： 8*4*731*3*92*6=38737152 3. 最优子结构特性举例例如，在数字串847313926中插入5个乘号，分为6个整数相乘，使乘积最大的最优解为： 8*4*731*3*92*6=38737152 该最优解包含了以下子问题的最优解：在84731中插入2个乘号使乘积最大为：8*4*731；在7313中插入1个乘号使乘积最大为：731*3；在3926中插入2个乘号使乘积最大为：3*92*6；在4731392中插入3个乘号使乘积最大为：4*731*3*92。这些子问题的最优解都包含在原问题的最优解中。最优性原理是动态规划的基础。

4. 动态规划实施步骤（1）把所求最优化问题分成若干个阶段，找出最优解的性质，并刻划其结构特性。 4. 动态规划实施步骤（1）把所求最优化问题分成若干个阶段，找出最优解的性质，并刻划其结构特性。（2）将问题各个阶段时所处不同的状态表示出来，确定各个阶段状态之间的递推关系，并确定初始条件。分析归纳出各个阶段状态之间的转移关系是应用动态规划的关键。（3）应用递推求解最优值。递推计算最优值是动态规划算法的实施过程。（4）根据计算最优值时所得到的信息，构造最优解。构造最优解就是具体求出最优决策序列。

6.2 最长子序列探索 6.2.1 最长非降子序列案例提出：由n个正整数组成的序列，从该序列中删除若干个整数，使剩下的整数组成非降子序列，求最长的非降子序列。例如，由12个正整数组成的序列为： 48，16，45，47，52，46，36，28，46，69，14，42 请在序列中删除若干项，使剩下的项为非降（即后面的项不小于前面的项）序列，非降序列最多为多少项？

1. 动态规划设计要点设序列的各项为a[1],a[2],…,a[n] ，对每一个整数操作为一个阶段，共为n个阶段。（1）建立递推关系 1. 动态规划设计要点设序列的各项为a[1],a[2],…,a[n] ，对每一个整数操作为一个阶段，共为n个阶段。（1）建立递推关系设置b数组，b[i]表示序列的第i个数（含第i个数）到第n个数中的最长非降子序列的长度，i=1,2,…,n。对所有的j>i，比较当a[j]≥a[i]时的b[j]的最大值，显然b[i]为这一最大值加1，表示加上a[i]本身这一项。因而有递推关系： b[i]=max(b[j])+1 (a[j]≥a[i],1≤i<j≤n) 边界条件：b[n]=1

（2）递推计算最优值 b[n]=1; for(i=n−1;i>=1;i−−) { max=0;for(j=i+1;j<=n;j++) if(a[i]<=a[j] && b[j]>max) max=b[j]; b[i]=max+1; // 逆推得b[i] } 逆推依次求得b[n−1],…,b[1]，比较这n−1个值得其中的最大值lmax，即为最优值。以上动态规划算法的时间复杂度为O(n^2)。

6.3 最优路径搜索 6.3.2 边数值矩形的最优路径案例提出： 6.3 最优路径搜索 6.3.2 边数值矩形的最优路径案例提出：已知n行m列的边数值矩阵，每一个点可向右或向下两个去向，试求左上角顶点到右下角顶点的所经边数值和最大的路径。例如，给出5行6列的边数值矩形如图所示：

1．动态规划设计要点设矩阵的每点为(i, j)，i=1,2,…,n；j=1,2,…,m。从点(i,j)水平向右的边长记为r(i,j)(j<m)，点(i,j)向下的边长记为d(i,j)(i<n)。设a(i,j)为点（i,j）到右下顶点的最大路程。st(i,j)为点(i,j)路标数组，其值取为{‘d’,’r’}。 a(i,j)的值由a(i+1,j)+d(i,j)与a(i,j+1)+r(i,j)比较，取其较大者，即有递推关系： a(i,j)=max(a(i+1,j)+d(i,j),a(i,j+1)+r(i,j)) st(i,j)={‘d’,‘r’} 其中i=1,2,…,n−1；j=1,2,…,m−1。注意到右边纵列与下边横行只有惟一出口，因而有边界条件： a(n,m)=0; // 初始化最右下顶点的路径值为0 a(i,m)=a(i+1,m)+d(i,m); i=n−1,n−2,…,1 a(n,j)=a(n,j+1)+r(n,j); j=m−1,m−2,…,1

2．动态规划设计要点 for(i=n−1;i>=1;i−−) {a[i][m]=a[i+1][m]+d[i][m];st[i][m]='d';} // 右纵列初始化 for(j=m−1;j>=1;j−−) {a[n][j]=a[n][j+1]+r[n][j];st[n][j]='r';} // 下横行初始化 for(i=n−1;i>=1;i−−) // 逆推求解a(i,j) if(a[i+1][j]+d[i][j]>a[i][j+1]+r[i][j]) {a[i][j]=a[i+1][j]+d[i][j];st[i][j]='d';} else {a[i][j]=a[i][j+1]+r[i][j];st[i][j]='r';} 所求左上角顶点到右下角顶点的最大路程即最优值为a(1,1)。

3．构造最优解利用路标数组输出最优解，从起点（1,1）即i=1,j=1开始判断： if(st[i][j]=='d') {printf("−%d−",d[i][j]);i++;} else {printf("−%d−",r[i][j]);j++;} 4. 算法的复杂度分析动态规划算法的时间复杂度为O(n^2)。

6.4 装载问题

2) 递推计算最优值 for(j=0;j<w[n];j++) m[n][j]=0; 2) 递推计算最优值 for(j=0;j<w[n];j++) m[n][j]=0; for(j=w[n];j<=c1;j++) m[n][j]=w[n]; // 计算m(n,j) for(i=n−1;i>=1;i−−) // 逆推计算m(i,j) for(j=0;j<=c1;j++) if(j>=w[i] && m[i+1][j]<m[i+1][j−w[i]]+w[i]) m[i][j]=m[i+1][j−w[i]]+w[i]; else m[i][j]=m[i+1][j]; printf("%d",m[1][c1]);

3．构造最优解构造最优解即给出所得最优值时的装载方案。 if(m[i][cw]>m[i+1][cw]) （其中cw为当前装载量）装载w[i]; else 不装载w[i]; if(所载集装箱重量≠m(1,c1)) 装载w[n]. 4. 算法的复杂度分析动态规划算法的时间复杂度为O(n^2)。

6.5 0-1背包问题 6.5.1 0−1背包问题案例提出：

1. 动态规划设计逆推求解要点

2) 逆推计算最优值 for(j=0;j<=c;j++) if(j>=w[n] ) m[n][j]=p[n]; // 首先计算m(n,j) else m[n][j]=0; for(i=n−1;i>=1;i−−) // 逆推计算m(i,j) if(j>=w[i] && m[i+1][j]<m[i+1][j−w[i]]+p[i]) m[i][j]= m[i+1][j−w[i]]+p[i]; else m[i][j]=m[i+1][j]; printf(“最优值为%d”,m(1,c));

3) 构造最优解若m(i,cw)>m(i+1,cw), i=1,2,…,n−1 则x[i]=1；装载w(i)。其中cw=c开始，cw=cw−x(i)*w(i)。否则，x(i)=0,不装载w(i)。最后，所装载的物品效益之和与最优值比较，决定w(n)是否装载。

2. 动态规划设计顺推求解要点

6.6 插入乘号问题案例提出：在指定数字串中插入运算符号问题，包括插入若干个乘号求积的最大最小，或插入若干个加号求和的最大最小，都是比较新颖且有一定难度的最优化问题。在一个由n个数字组成的数字串中插入r个乘号(1≤r<n)，将它分成r+1个整数，找出一种乘号的插入方法，使得这r+1个整数的乘积最大。例如，对给定的数串847313926，如何插入5个乘号，使其乘积最大?

6.6.1 动态规划求解 1）建立递推关系设f(i,k)表示在前i位数中插入k个乘号所得乘积的最大值，a(i,j)表示从第i个数字到第j个数字所组成的j−i+1(i≤j)位整数值。一般地，为了求取f(i,k)，考察数字串的前i个数字，设前j（k≤j<i）个数字中已插入k−1个乘号的基础上，在第j个数字后插入第k个乘号，显然此时的最大乘积为f(j,k−1)*a(j+1,i)。于是可以得递推关系式： f(i,k)=max(f(j,k−1)*a(j+1,i)) （k≤j<i）前j个数字没有插入乘号时的值显然为前j个数字组成的整数，因而得边界值： f(j,0)=a(1,j) (1≤j≤i)

2) 递推计算最优值 for(d=0,j=1;j<=n;j++) {d=d*10+b[j−1]; //在设计中可省略a数组，用变量d替代 f[j][0]=d; // 计算初始值f[j][0] } for(k=1;k<=r;k++) for(i=k+1;i<=n;i++) for(j=k;j<i;j++) {for(d=0,u=j+1;u<=i;u++) d=d*10+b[u−1]; // 计算d即为a(j+1,i) if(f[i][k]<f[j][k−1]*d) // 递推求取f[i][k] f[i][k]=f[j][k−1]*d; printf("最优值为%.0f"，f[n][r]);

3) 构造最优解为了能打印相应的插入乘号的乘积式，设置标注位置的数组t(k)与c(i,k)，其中c(i,k)为相应的f(i,k)的第k个乘号的位置，而t(k)标明第k个乘号“*”的位置，例如，t(2)=3，表明第2个“*”号在在第3个数字后面。当给数组元素赋值f(i,k)=f(j,k−1)*d时，作相应赋值c(i,k)=j，表明f(i,k)的第k个乘号的位置是j。在求得f(n,r)的第r个乘号位置t(r)=c(n,r)=j的基础上，其他t(k)(1≤k≤r−1)可应用下式逆推产生 t(k)=c(t(k+1),k) 根据t数组的值，可直接按字符形式打印出所求得的插入乘号的乘积式。

6.6.2 基于组合枚举求解注意到n个数字之间共有n−1个插入乘号的位置，在这n−1个位置中组合选取r个位置t(1),t(2),…,t(r)供插入乘号。计算被这r个乘号分成的r+1个整数的积d。每计算一个d与存储最大乘积的变量max比较，若d>max，则作赋值max=d，同时乘号位置t数组赋值给s数组。完成所有组合枚举后，得乘积最大值max，按s数组的值打印插入乘号的乘积式及其最大乘积max。

6.7 动态规划应用小结应用动态规划设计求解最优化问题，根据问题最优解的特性，找出最优解的递推关系（递归关系），是求解的关键。至于应用递推还是递归求取最优值，递推时应用顺推还是应用逆推，可根据设计者自己的习惯与爱好来定。一般来说，应用递推求最优值比应用递归求最优值效率要高。应用动态规划设计求解最优化问题，当最优值求出后，如何根据案例的具体实际构造最优解，是求解的难点。构造最优解，没有一般的模式可套，必须结合问题的具体实际，必要时在递推最优解时有针对性地记录若干必要的信息。动态规划根据不同阶段之间的状态转移，通过应用递推求得问题的最优值。这里，注意不能把动态规划与递推两种算法相混淆，不要把递推当成是动态规划，也不要把动态规划当成递推。

综合动态规划与递推之间的关系：（1）动态规划是用来求解多阶段最优化问题的有效算法，而递推一般是解决某些判定性问题、构造性或计数问题的方法，两者求解对象不同。（2）动态规划求解的多阶段决策问题必须满足最优子结构特性，而递推所求解的问题无需满足最优子结构特性。（3）动态规划在求解最优值通常应用递推来实现，递推只是完成最优值中的一种手段。（4）动态规划在求得问题的最优值后通常需构造出最优解，而递推在求出计数结果后没有最优解的构造需求。（5）当动态规划与递推需设置三维数组时，其空间复杂度都比较高，这是动态规划与递推所面临的共同问题。

第6章作业习题6: 1, 2, 3, 4, 5, 6 第6章上机（1）上机通过本章最长子序列、装载与0-1背包、最优路径与插入乘号问题等多阶段决策典型案例；（2）上机通过习题6-7,6-9 （3）分组讨论并上机通过二维约束0-1背包问题与最优路径等案例。

欢迎大家提出教学建议返回