动态规划（一）.

Slides:

Advertisements

Similar presentations

中考冲刺之 ——现代文阅读技巧2.

Advertisements

我的家乡南通 ….

第五章教师的教学研究方法.

因为我们年轻所以我们执着因为我们是戴中教师所以我们更加努力

第四章汇率与汇率制度第一节外汇与汇率一、外汇（一）外汇有狭义与广义之分

第二节金融资产的计量一、金融资产的初始计量二、公允价值的确定三、金融资产的后续计量四、以公允价值计量且其变动计入当期损益的金融

第41课　公民的财产权　.

手太阳小肠经.

英德美法标志 1689年《权利法案》 1871年《德意志帝国宪法》 1787年宪法 1875年法兰西第三共和国宪法政体君主立宪制民主共和制行政权内阁、首相皇帝、宰相总统立法权议会国会权力中心皇帝特点君主虚位议会至上军事封建皇帝权重总统共和制议会共和制.

《中医基础理论》考试题型特点和答题指导.

學生申訴管道學生受教權的維護.

企业经营者的素质主讲人：张丽娜教科院03教育.

搜索与回朔算法搜索与回朔是计算机解题中常用的算法，很多无法根据某种确定的计算法则来求解的问题，可以利用搜索与回朔方法求解。它的基本思想是：为了求得问题的解，先选择某一种可能情况向前探索，在探索的过程中，一旦发现原来的选择是错误的，就退回一步重新选择，然后再继续向前探索，如此反复进行，直到得到解或证明无解为止。

游泳四式技術分析暨初級教法.

第二编＊　流转税流转税概述第三章　增值税第四章　消费税第五章　营业税第六章　关税.

2011年广西高考政治质量分析广西师范大学附属外国语学校蒋楠.

第2节　分析综合.

古文明中的直角三角形.

职业理想近距离班级：13302班 14302班主持人：指定同学主持时间：12月12日 19日.

知识回顾 1、通过仔细观察酒精灯的火焰，你可以发现火焰可以分为、、。外焰内焰焰心外焰 2、温度最高的是。

2016届高三期初调研分析徐国民

课堂回顾 1、继承与发展的关系及处理关系：继承是发展的必要前提，发展是继承的必然要求。继承与发展，是同一个过程的两个方面。文化在继承的基础上发展，在发展的过程中继承。文化在继承中发展处理：把握好文化继承与发展的关系，批判地继承传统文化，不断推陈出新，革故鼎新，我们就能够作出正确的文化选择，成为自觉地文化传承者和享用者。

第16课时　放飞理想　立志成才考纲内容要点探究考点解读.

洋流（大规模的海水运动）.

数据结构(C语言版) Data Structure

创建广东省现代教育技术实验学校自查报告斗门区乾务镇五山中心小学 2012年5月22日.

图论算法 ---最大流问题长沙市雅礼中学朱全民.

上課囉職場甘苦談小資男孩向錢衝育碁數位科技呂宗益/副理.

第一课神奇的货币第二框信用工具和外汇 1-2 信用工具和外汇.

触电预防与急救杜芳艳.

我的社區_觀塘第三課.

第2讲从汉至元政治制度的演变和明清君主专制的加强基础落实一、从汉至元政治制度的演变 1.中央集权的发展

第四章时间序列的分析本章教学目的：①了解从数量方面研究社会经济现象发展变化过程和发展趋势是统计分析的一种重要方法；②掌握时间数列编制的基本要求；③理解和掌握水平速度两方面指标的计算及运用④理解和掌握长期趋势分析和预测的方法。本章教学重点：现象发展的水平指标和速度指标。本章教学难点：现象变动的趋势分析。

五、学习方法及应考对策（一）学习方法 1．保证复习时间，吃透教材：上课之前应该对课程相关内容进行预习，把不理解的问题记录下来，带着问题听课。考试之前务必把课本看3遍以上，第一遍一定要精读，最好能做笔记，边读边记，不要快，要记牢。第二、三遍可以查缺补漏型的看，通过做题目看书，加深课本印象。 2．加强概念、理论性内容的重复记忆：概念、理论性内容一般比较抽象，所以在理解的基础上一定要重复记忆，在接受辅导之后，再加以重点记忆，以便及时巩固所学内容，切忌走马观花似的复习，既浪费时间，效果也不好。

第16课抗日战争.

世界的物质性人类社会也是物质的自然界是物质的从古猿到人的进化中脑量的变化

空間向量朱泰吉蔡宇翔張力夫莊孟霏.

温故知新 1、凸透镜成像的规律有哪些？ 2、照相机成像的原理是什么？.

第二单元文化传承与创新.

政治常识第一课我国的国家制度（上）第4课时政体及其与国体的关系.

文化生活第三单元中华文化和民族精神.

第二课程序组成、基本数据类型、表达式我们以上一章练习题为例说明Pascal程序的结构形式：

一、单选题 1、字符串“ababacbab”和字符串“abcba”的最长公共子串是（）。

狂賀!妝品系同學美容乙級通過妝品系三甲學號姓名 AB 陳柔諺 AB 陳思妤 AB 張蔡婷安

第七章财务报告主讲老师：王琼上周知识回顾.

递推算法递推是一种重要的数学方法，在数学和计算机领域都有广泛应用。这种算法的特点是：一个问题的求解需要一系列的计算，在已知条件和所求问题之间总存在某种相互联系的关系。在计算时，可以找到前后过程间的数量关系，即递推。递推算法包括顺推和逆推。递推算法的关键在于找到相邻数据项之间的关系，即递推关系，建立递推关系式。我们有时将递推算法看成一种特殊的迭代算法。

第四章程序设计初步顺序结构：赋值语句、输出语句

第六课 CASE语句、判断结构的应用第三节 case语句

编译原理课程设计.

李元金计算机与信息工程学院第 4 讲进程管理(2) 李元金计算机与信息工程学院 1/

貨幣需求與貨幣市場的均衡.

第二节　时间　位移.

陳維魁博士儒林圖書公司第五章控制結構陳維魁博士儒林圖書公司.

編譯程式設計期末專題說明 V1.1 May 2004.

最大公约数 ——解题报告作者：宋含章七（12）班 1.

《2015考试说明》新增考点：“江苏省地级市名称”简析

乘法公式 (1) 乘法分配律 (2) 和的平方公式 (3) 差的平方公式 (4) 平方差公式.

变阻器常州市北郊初级中学陆俊.

商業行為成立的要件動動腦 Q 請試著判斷下列何者為商業行為？請試著判斷下列何者為商業行為？.

§ 5-1 電流的磁效應磁學發展的歷史： 1820年 7月，厄司特發現，一載有電流的直導線，可使周圍的磁針產生偏轉。

第九章运行时存储空间组织网上教学系统: : 编译原理

中五級電腦科 PASCAL檔案處理.

埃及永生之旅報告者：陳菱霙.

动态规划（五）.

數學遊戲二大象轉彎.

三顺序结构程序设计厦大附中信息技术.

106年免試入學第一次模擬選填重要日程表說明 1.106年1月10日中午12時～106年1月16日中午12時完成第一次模擬

第八章投資組合風險衡量第一節投資組合管理的基本流程與步驟第二節債券投資組合的利率風險衡量第三節債券投資組合的信用風險衡量.

PASCAL语言吉林大学计算机科学与技术学院.

Presentation transcript:

动态规划（一）

背景近年来，涉及动态规划的各种竞赛题越来越多，每一年的NOI几乎都至少有一道题目需要用动态规划的方法来解决。动态规划算法通常用来解决最优化问题。这些问题可能存在多个解，每个解具有一个值。我们希望找到一个具有最优（最大或最小）值的解。在动态规划算法中，主要关心的是找到一个最优解和求出最优解的值，而不是找出所有的最优解。

背景动态规划算法可分解成从先到后的4个步骤： 1. 描述一个最优解的结构； 2. 递归地定义最优解的值； 3. 以“自底向上”的方式计算最优解的值； 4. 从已计算的信息中构建出最优解的路径。其中步骤1~3是动态规划求解问题的基础。如果题目只要求最优解的值，则步骤4可以省略。

从一个例子谈起问题: 求城市间最短通路. 设有如图所示的N座城市, 相邻城市之间有若干条通路, 线上的数字表示通路的距离. 试求出从A到D的最短距离. A B1 B2 C2 C1 C3 D 5 2 3 7 4 图1

最短通路问题的解结构分析: 我们可以用搜索，枚举图中的每条路径。但当图的规模大起来时，搜索的效率显然是非常低的。让我们试着用动态规划的思路来分析这道题：动态规划策略的第一步是描述一个最优解的结构。对最短通路问题解的结构，我们这样来分析：从图中可以看到，从A点要到D点必然要经过B1和B2中的一个。到底选择B1还是B2，不能只比较A到B1和A到B2这两段的长度。本问题的性质表明：局部最优并不能保证全局最优。例如，按照局部最优的策略选择的路径是：A-B2-C3-D，路径长度为11。而实际上A-B1-C2-D才是最优解，其路径长度为10。所以“贪心法”在本题中不可用。 A B1 B2 C2 C1 C3 D 5 2 3 7 4

最短通路问题的解结构因此，我们既要考查选择B1的解又要考查选择B2的解。然后再比较两个解，看哪个最优。首先，我们假定选择B1的解是最优的，也就是说A-B1…D是最短通路。那么一个关键的观察是：B1 …D也必须是最短的。为什么？证明如下：假设从B1到D还有更短的路径，那么替换掉组成A -B1…D的路径，必然就得到一个更短的A-D的通路，这与题目假设A -B1…D是最短通路相矛盾。因此，B1 …D是最短通路。同理，我们假定选择B2的解是最优的，即A-B2 …D是最短通路。那么B2 …D也必须是最短通路。 A B1 B2 C2 C1 C3 D 5 2 3 7 4

最短通路问题的解结构更一般地说，对最短通路问题，问题的一个最优解（找到从A到D的最短通路）中包含着子问题（找到从B1到D的最短通路或从B2到D的最短通路）的一个最优解。我们把这一性质称为最优子结构。最优子结构是可以应用动态规划解题的标志性特点之一。 A B1 B2 C2 C1 C3 D 5 2 3 7 4

最短通路问题的解结构最优子结构性质表明我们可以利用子问题的最优解来构造问题的最优解。对最短通路问题，子问题的最优解这样来构造问题的最优解：问题的最优解 = MIN(B1~D的最优解+A~B1的长度，B2~D的最优解+A~B2的长度) 因此，为了解决A~D的最短通路问题，我们必须首先解决B1~D的最短通路问题和B2~D的最短通路问题。这显然是一个递归的过程。 A B1 B2 C2 C1 C3 D 5 2 3 7 4

递归地定义最优解的值动态规划策略的第二步是根据子问题的最优解递归地定义问题的最优解的值。我们用 MD(v)表示点v到点D的最短通路的长度，用w(v,u)表示点v到点u的线段长度, d(v)是与v相邻的节点的集合。那么根据前面的分析就有： A B1 B2 C2 C1 C3 D 5 2 3 7 4

递归地定义最优解的值根据这个这个公式，我们可以推导出： MD(A) = min{w(A,B1)+MD(B1), w(A, B2)+MD(B2)} MD(B1)= min{w(B1,C1) + MD(C1), w(B1, C2)+MD(C2)} MD(B2)= min{w(B2,C2) + MD(C2), w(B2,C3)+MD(C3)} MD(C1)= min{w(C1,D)+MD(D)} MD(C2)= min{w(C2,D)+MD(D)} MD(C3)= min{w(C3,D)+MD(D)} MD(D) = 0 递归边界条件 MD(C1) = 4 MD(C2) = 3 MD(C3) = 5 MD(B1) = 5 MD(B2) = 9 MD(A) = 10 上述手工方式推导出本题的解是为了让大家熟悉递归法求解问题的过程。根据上述递归式写出相应的递归程序应当是不难的事情。留给大家做课后练习。 A B1 B2 C2 C1 C3 D 5 2 3 7 4

自底向上计算最优解的值如果我们满足于用递归式计算出问题的解，则没有达到动态规划的目的。通过分析前面递归计算过程，我们发现MD(C2)在计算MD(B1)和MD(B2)时均要用到，而在计算完MD(B1)后, 并没有保存MD(C2)的值, 所以在计算MD(B2)时还要重新计算MD(C2). 而MD(D)则被重复计算了3次. 在本题中的图是经过简化的, 所以重复计算量看上去并不多(共4次), 但考虑到总的计算量只有7次(7个结点的MD), 所以重复计算的比例还是相当高的. 如果图的宽度和深度更大一些, 则重复计算量还要大!

自底向上计算最优解的值我们注意到: 越是接近底层的子问题被重复计算的次数也就越多. 我们能不能将上述递归法的求解过程进行优化, 避免重复计算, 使所有的子问题都只计算一次! 要实现这一点, 必须做到二件事: 1. 自底向上计算子问题最优解. 越是靠近底层的子问题, 越是先计算出来. 2. 用表格存储计算出的子问题的最优解的值, 以便在计算它的“上层”子问题时能够直接引用, 而不是去重新计算.

自底向上计算最优解的值为简化问题, 图1的顶点用数字编号, 依次是: A : 1 B1: 2 B2: 3 C1: 4 C2: 5 C3: 6 D: 7 这样, 图1用邻接矩阵作为存储结构, 即为: Const M : array[1..7, 1..7] of integer = ( (0, 5, 2, 0, 0, 0, 0), (0, 0, 0, 3, 2, 0, 0), (0, 0, 0, 0, 7, 4, 0), (0, 0, 0, 0, 0, 0, 4), (0 ,0, 0, 0, 0, 0, 3), (0, 0, 0, 0, 0, 0, 5), (0, 0, 0, 0, 0, 0, 0)); Var S : array[1..7] of integer; {用来存储各个结点的最短通路的数组}

完整的动态规划求解的程序 Program DP1_R; {动态规划讲义例题1，动态规划解法} const MaxV = 7; MaxLen = MaxInt; M : array[1..MaxV, 1..MaxV] of integer = ( (0, 5, 2, 0, 0, 0, 0), (0, 0, 0, 3, 2, 0, 0), (0, 0, 0, 0, 7, 4, 0), (0, 0, 0, 0, 0, 0, 4), (0 ,0, 0, 0, 0, 0, 3), (0, 0, 0, 0, 0, 0, 5), (0, 0, 0, 0, 0, 0, 0) ); var S: array[1..MaxV] of integer; {用来存储各个结点的最短通路的数组, 全局变量} {计算点K到点D的最短通路长度。图以邻接矩阵存储，点D是图的终点，出度为0。} procedure MD; i, j, t: integer; begin S[MaxV] := 0; {最底层的D点的MD值为0}

完整的动态规划求解的程序 for i := 6 downto 1 do begin {自底向上计算各个结点的MD值} S[i] := MaxLen; {当前结点的MD初值为无穷大} for j := i + 1 to MaxV do {遍历结点i的“底层”结点} if M[i,j] <> 0 then begin {如果j是i的下层结点，则计算经过j的MD值} t := M[i,j] + S[j]; if t < S[i] then {如果计算出的MD值小于当前保存的S[i]，则更新S[i]} S[i] := t; end; end; {MD} begin MD; {调用求最短通路的过程} writeln(S[1]); {输出问题的最优解S[1]} end. 在自底向上的动态规划算法求解最优解的过程中, 问题的最优解是最后得到的.

构建最优解的路径本题已经得到一个最优解, 但没有获得这个最优解是“怎样”得到的, 也就是说我们除了知道10从A到D的最短通路长度外, 无法知道是怎样从A走到D才是最短的通路. 而往往这才是更有价值的问题. 要得到最优解的路径(最优解的形成过程), 需要在计算的过程中记录额外的过程信息. 在最短通路问题中，在计算结点I的最短路径时，每当我们找到一个比当前路径长度更小的值时，只是记录了这个更小的值，而没有记录这个值是由哪个结点产生的。利用一个数组来记录这一信息。 Var w: array[1..MaxV] of integer; {存储结点的最短通路的下一跳结点编号} 由于D是最后一个结点，没有后续结点了，所以w[D](在程序中是w[7])的值规定为0.

构建最优解的路径然后在计算S[i]时, 程序修改如下: for i := 6 downto 1 do begin {自底向上计算各个结点的MD值} S[i] := MaxLen; {当前结点的MD初值为无穷大} w[i] := 0; {“ 下一跳初值设为0”} for j := i + 1 to MaxV do {遍历结点i的“底层”结点} if M[i,j] <> 0 then begin {如果j是i的下层结点，则计算经过j的MD值} t := M[i,j] + S[j]; if t < S[i] then begin {如果计算出的MD值小于当前保存的S[i]，则更新S[i]} S[i] := t; w[i] := j; {新的MD值是由点j产生的, 因此“下一跳”是点j} end;

构建最优解的路径输出最优解的路径. 我们定义了一个过程Print来输出最优解的路径. 注意到从起始点A开始, 数组w记录了每个结点的下一跳的编号, 数组下标就是当前结点的编号. 而终点D的下一跳编号为0, 作为循环终止的条件. 而w是全局数组, 在程序的所有地方都可以访问. Procedure Print; var i: integer; begin i := 1; repeat write(i:3); i := w[i]; until i = 0; writeln; end; 通常,可以把输出最优解的路径的过程处理为递归过程.

小结动态规划是一种算法策略, 它采用了两个主要的设计方法: 表格化 - 利用数组存储中间计算环节自底向上 - 从最底层子问题开始, 逐步上升计算, 最后得到问题的解动态规划主要适用于一类所谓的“最优化”问题, 即求最大(或最小)值. 当分析问题的性质, 满足如下二点时, 就可采用动态规划策略求解: 最优子结构 - 问题的一个最优解中包含着子问题的一个最优解. 重叠子问题 – 求解问题的解时要反复计算若干个子问题. 同理, 求解各个子问题时又要反复计算若干子子问题, 这些子子问题可能是新产生的, 也可能是重复产生的.

练习调试运行整个最短通路问题. 装配线调度问题: 汽车厂的总装车间有两条装配线. 每条装配线上都有n个装配点,编号分别为j=1,2,…,n. 我们标记第I条(I=1,2)装配线的第j个装配点为Si,j . 我们规定S1,j 和S2,j做的工作相同, 但由于效率, 技术等原因使S1,j和S2,j的工作时间却不同. 我们标记Ai,j为Si,j的工作时间. 汽车底盘进入两条装配线的进入时间分别标记为E1和E2. 汽车除了在一条装配线上流动外, 还可以转移到另一条装配线上去. 我们把在Si,j工作完后转移到另一条装配线的时间标记为Ti,j. 汽车可以在两条装配线上随意地调度. 请问: 在如图(见下页)所示的装配线中, 怎样安排汽车的装配点, 使得装配时间最短?

E1 E2 A1,1 A2,1 A1,2 A2,2 A1,3 A2,3 A1,4 A2,4 …… A1,n-1 A2,n-1 A1,n A2,n T1,1 T2,1 T1,2 T1,3 T1,n-1 T2,2 T2,3 T2,n-1

S1,1 S1,1 S1,2 S1,3 S1,4 S1,5 S1,6 2 4 7 8 9 5 3 6 A2,n-1 1 S2,1 S2,2 S2,3 S2,4 S2,5 S2,6