动态规划(二).

Slides:



Advertisements
Similar presentations

Advertisements

3 的倍数的特征 的倍数有 : 。 5 的倍数有 : 。 既是 2 的倍数又是 5 的倍数有 : 。 12 , 18 , 20 , 48 , 60 , 72 , , 25 , 60 ,
一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
第五节 全微分方程 一、全微分方程及其求法 二、积分因子法 三、一阶微分方程小结. 例如 所以是全微分方程. 定义 : 则 若有全微分形式 一、全微分方程及其求法.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
冀教版四年级数学上册 本节课我们主要来学习 2 、 3 、 5 的倍数特征,同学们要注意观察 和总结规律,掌握 2 、 3 、 5 的倍 数分别有什么特点,并且能够按 要求找出符合条件的数。
《解析几何》 -Chapter 3 §7 空间两直线的相关位置.
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
第4章动态规划 (Dynamic Programming)
西南科技大学网络教育系列课程 数学建模与数学实验 第7讲 动态规划 主讲教师: 彭煜 杨学南 西南科技大学理学院数学系.
《高等数学》(理学) 常数项级数的概念 袁安锋
动态规划(四).
不确定度的传递与合成 间接测量结果不确定度的评估
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
探索三角形相似的条件(2).
初中数学八年级下册 (苏科版) 10.4 探索三角形 相似的条件(2).
Hadoop I/O By ShiChaojie.
走进编程 程序的顺序结构(二).
Online job scheduling in Distributed Machine Learning Clusters
What have we learned?.
动态规划(Dynamic Programming)
绿色圃中小学教育网 比例 比例的意义 绿色圃中小学教育网
动态规划(一).
2.1.2 空间中直线与直线 之间的位置关系.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
第一章 函数与极限.
人教版五年级数学上册第四单元 解方程(一) 马郎小学 陈伟.
数列.
专题作业.
6.4不等式的解法举例(1) 2019年4月17日星期三.
线段的有关计算.
线性规 Linear Programming
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
4.2 证明⑶.
复习.
作业 P158 习题 2 1(2)(4) (5). 2(1). 预习 P156— /5/2.
第5章 动态规划 5.1, 5.2 多阶段决策和最优化原理 2019/5/1.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
淘气的猴子.
用穷举法设计程序 南京师范大学 教育技术系 倪佳慧
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
等差与等比综合(3).
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
1.非线性规划模型 2.非线性规划的Matlab形式
第七、八次实验要求.
基于最大margin的决策树归纳 李 宁.
数学建模方法及其应用 韩中庚 编著.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
主讲人: 吕敏 { } Spring 2012 ,USTC 算法基础 主讲人: 吕敏 { } Spring 2012 ,USTC.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
高中数学必修 平面向量的基本定理.
§2 方阵的特征值与特征向量.
2.3.运用公式法 1 —平方差公式.
滤波减速器的体积优化 仵凡 Advanced Design Group.
动态规划算法 Dynamic Programming
线性规划 Linear Programming
第三节 数量积 向量积 混合积 一、向量的数量积 二、向量的向量积 三、向量的混合积 四、小结 思考题.
第十七讲 密码执行(1).
第十二讲 密码执行(上).
《偏微分方程》第一章 绪论 第一章 绪论 1.1.
§4.5 最大公因式的矩阵求法( Ⅱ ).
第二次课后作业答案 函数式编程和逻辑式编程
质量控制(QC)模式 BrookFIELD.
最小生成树 最优二叉树.
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
3.3.2 两点间的距离 山东省临沂第一中学.
Presentation transcript:

动态规划(二)

复习:动态规划解题四步骤 描述一个最优解的结构; 递归地定义最优解的值; 以“自底向上”的方式计算最优解的值; 从已计算的信息中构建最优解的形成路径。

复习:可以应用动态规划解题的两个基本条件是什么? 题目性质具有“最优子结构”特征,即问题的一个最优解中包含着子问题的最优解。 重叠子问题 ,即求解问题的解时要反复计算若干个相同子问题。 同理,求解各个子问题时又要反复计算若干子子问题,这些子子问题可能是新产生的,也可能是重复产生的。

讨论:装配线调度问题 装配线调度问题: 汽车厂的总装车间有两条装配线. 每条装配线上都有n个装配点,编号分别为j=1,2,…,n. 我们标记第I条(I=1,2)装配线的第j个装配点为Si,j . 我们规定S1,j 和S2,j做的工作相同, 但由于效率, 技术等原因使S1,j和S2,j的工作时间却不同. 我们标记Ai,j为Si,j的工作时间. 汽车底盘进入两条装配线的进入时间分别标记为E1和E2. 汽车除了在一条装配线上流动外, 还可以转移到另一条装配线上去. 我们把在Si,j工作完后转移到另一条装配线的时间标记为Ti,j. 汽车可以在两条装配线上随意地调度. 请问: 在如图(见下页)所示的装配线中, 怎样安排汽车的装配点, 使得装配时间最短? E1 E2 A1,1 A2,1 A1,2 A2,2 A1,3 A2,3 A1,4 A2,4 …… A1,n-1 A2,n-1 A1,n A2,n T1,1 T2,1 T1,2 T1,3 T1,n-1 T2,2 T2,3 T2,n-1

分析:装配线调度问题 你怎样分析出装配线调度问题具备“最优子结构”性质? 提示:在分析问题的时候,可能需要引进一些符号来表示一些数学量。想一想,在本问题中我们需要引进哪些符号来表示哪些数学量? 提示2:你必需引进一些符号来表达所有的已知量,也必需引进适当的符号来表示出问题的解以及子问题的解。 2 4 7 8 9 5 3 6 A2,n-1 1

分析:装配线调度问题-续 你怎样分析出装配线调度问题具备“重叠子问题”性质? 提示:在这里只需要定性地分析和描述重叠子问题性质。也就是说你自己要在心里面清楚问题具备重叠子问题性质。 2 4 7 8 9 5 3 6 A2,n-1 1

分析:装配线调度问题-续 你怎样递归地定义最优解的值?用子问题的最优解表示问题的最优解 提示:在书写递归式的时候要注意两个方面:一是通项公式怎么写?通项的取值范围是什么?二是递归的边界条件怎么写? 没有通项公式就还没有写出递归式;没有边界条件,递归式就不会结束。 2 4 7 8 9 5 3 6 A2,n-1 1

分析:装配线调度问题-续 你怎样“自底向上”地求解本问题(将递归式转化为递推式)? 提示:在思考递推式时,我们要考虑怎样表示第一项?怎样由第一项表示第二项?等等。 要求:在纸上实现整个程序,并用测试数据进行测试。 2 4 7 8 9 5 3 6 A2,n-1 1

分析:装配线调度问题-续 你怎样输出最优解的形成路径? 提示:修改程序,增加一个记录每一步最优解位置的数据结构。在动态规划求得最优解的值完成后,用另一个过程输出最优解的形成路径。 要求:在纸上实现整个程序,并上机调试程序。 2 4 7 8 9 5 3 6 A2,n-1 1

思考:装配线调度问题 假设汽车在最后一站装配完成后,离开装配线还需要个“离开时间”,如下图所示,则程序又要作怎样的修改? 2 4 7 8 9 5 3 6 A2,n-1 1

For k :=2 to n begin t1 := m[1,k-1]; t2 := m[2,k-1] + t[2,k-1]; if t1 < t2 then begin m[1,k] := t1+ a[1,k]; w[1,k] := 1; end else begin m[1,k] := t2 + a[1,k]; w[1,k] := 2; end; m[2,k]

Procedure print(I,j :integer); Var k:integer; Begin if j > 1 then begin k := w[I,j]; pirnt(k,j-1); End; writeln(‘S’,I,’,’, j);

了解动态规划的有关概念 什么是多阶段决策问题? 什么是阶段、状态、决策?

多阶段决策问题 多阶段决策问题:多阶段决策过程,是指这样的一类特殊的活动过程,问题可以按时间顺序分解成若干相互联系的阶段,在每一个阶段都要做出决策,全部过程的决策是一个决策序列。要使整个活动的总体效果达到最优的问题,称为多阶段决策问题。 装配线调度问题就是一个典型的多阶段决策问题。

阶段 阶段(step)是对整个过程的自然划分。通常根据时间顺序或空间特征来划分阶段,以便按阶段的次序求解最优化问题。阶段变量一般用k=1,2,..,n表示。在最短通路问题中由A出发为k=1,由Bi(i=1,2)出发为k=2,依此下去从Di(i=1,2,3)出发为k=4,共n=4个阶段。 思考:装配线调度问题可分为多少个阶段?

状态 状态(state)表示每个阶段开始时过程所处的自然状况。它应该能够描述过程的特征并且具有无后向性。 所谓无后向性即当某阶段的状态给定时,这个阶段以后过程的演变与该阶段以前各阶段的状态无关,即每个状态都是过去历史的一个完整总结。例如,在最短通路问题中,假设第2阶段的状态是B1,则第3、4阶段的过程演变就与第1阶段的状态无关。 通常还要求状态是直接或间接可以观测的。

状态-续 描述状态的变量称状态变量。变量允许取值的范围称允许状态集合。 用xk表示第k阶段的状态变量,它可以是一个数或一个向量。用Xk表示第k阶段的允许状态集合。在最短通路问题中x2可取B1,B2,X2={B1,B2}。 n个阶段的决策过程有n+1个状态变量,x n+1表示xn演变的结果,在例1中x5取φ。 状态变量简称为状态。 思考:在装配线调度问题中,每个阶段有几个状态?是什么?

决策 当一个阶段的状态确定后,可以作出各种选择从而演变到下一阶段的某个状态,这种选择手段称为决策(decision),在最优控制问题中也称为控制(control)。 描述决策的变量称决策变量。变量允许取值的范围称允许决策集合。用uk(xk)表示第k阶段处于状态xk时的决策变量,它是xk的函数,用Uk(xk)表示了xk的允许决策集合。在最短通路问题中u2(B1)可取C1,C2 决策变量简称决策。 思考: u2(B2)可取什么值? A B1 B2 C2 C1 C3 D 5 2 3 7 4

动态规划的基本思想 动态规划的实质是分治思想和解决冗余,因此,动态规划是一种将问题实例分解为更小的、相似的子问题,并存储子问题的解而避免计算重复的子问题,以解决最优化问题的算法策略。 因此,动态规划法所针对的问题有一个显著的特征,即它所对应的子问题树中的子问题呈现大量的重复。动态规划法的关键就在于,对于重复出现的子问题,只在第一次遇到时加以求解,并把答案保存起来,让以后再遇到时直接引用,不必重新求解。