应用运筹学 第七章 决策分析 浙江大学管理学院 杜红 博士 副教授
第七章 决策分析 确定型决策 风险型决策 不确定型决策
确定型决策 条件、因素等均已知的情况下的决策 根据损益矩阵在已知的自然状态下选择一个最优方案。 盈亏平衡分析、投资项目评价、线性规划及扩展问题
风险决策 存在几种自然状态,哪一种状态发生不确定,但每种自然状态发生的可能性可以预计(主观概率值)。 决策依据:最大期望收益、最小期望损失标准 期望值:不同自然状态下可能得到的值 期望值=∑(概率×结果值) 决策方法:最大期望计算、条件概率、决策树、效用曲线分析
风险决策 最大期望收益值计算 i为备择方案,i=1,2,…,n j为自然状态,j=1,2,…,m 为第i个备择方案的期望收益值 pj为第j个自然状态出现的概率 Oij为第i个备择方案在第j个自然状态下的收益 Vi0 为第i个备择方案的初始投资值
风险决策 风险的衡量 当备择方案的期望收益值相等时,需计算风险值。风险应尽可能地小。 为第i个备择方案的风险
风险决策 风险决策举例 因此,考虑选择 I 方案 例7-1:有两个所需代价相同的投资如何决策? 成功获利 概率 失败获利 概率 成功获利 概率 失败获利 概率 I方案 500 60% -50 40% II方案 800 50% -240 50% =0.6×500+0.4×(-50)=280, 因此,考虑选择 I 方案
风险决策 决策树结构 收益 概率值 状态 节点 收益 概率值 决策 节点 概率值 收益 状态 节点 概率值 收益 方案枝 概率枝
风险决策 利用决策树决策 绘出决策树 预计各状态概率 从右向左计算各个方案的收益期望 根据期望值大小选择方案 决策树求解多阶段决策问题
风险决策 例7-2:多阶段决策树求解 某地规划建厂,提出三个方案: I方案:新建大厂,需投资300万元。估计销路好时每年获利100万元,销路不好时每年亏20万元,经营期限10年。 II方案:新建小厂,需投资140万。销路好时每年可获利40万元,销路不好时每年仍可获利30万元。 III方案:先建小厂,三年后销路好时再扩建,投资200万元,经营期限7年,每年可获利95万元。 市场销售形势预测是销路好的概率为0.7,销路不好的概率为0.3。销路情况10年内保持一致。根据上述情况,作出决策。
风险决策 ⅰ ⅱ 前3年 后7年 第1次决策 第2次决策 销路好 0.7 100 建大厂 300 1 销路差 0.3 -20 扩建 200 销路好 0.7 100 建大厂 300 1 销路差 0.3 -20 扩建 200 ⅰ 3 1.0 95 销路好0.7 ⅱ 2 4 1.0 40 不扩建 销路差0.3 建小厂 140 30 前3年 后7年 第1次决策 第2次决策
风险决策 各点的期望收益值计算: 点1:[0.7×100+0.3×(-20)]×10-300=340 点3:1.0×95×7-200=465 点4:1.0×40×7=280 决策点ⅱ:点3的期望值较大,采用3年后扩建的方案 点2:包括有两种状态下的两个方案: 销路好:前3年小厂,后7年扩建,期望收益: 40×0.7×3+465×0.7 销路差:小厂10年,期望收益:30×0.3×10 40×0.7×3+465×0.7+ 30×0.3×10-140=359.5 决策点ⅰ:点2的期望值较大,采用先建小厂3年后扩建
风险决策 练习题: 某厂工艺改进有两条途径: I:自行研究,成功可能性0.6; II: 国外引进,谈判成功可能性是0.8。 不论何种途径成功,生产规模都考虑两种方案:产量不变和增加产量。 如果都失败,则仍采用原工艺进行生产,产量也保持不变。 据市场预测,今后5年内这种产品跌价的可能性是0.1,保持中等价的可能性是0.5,涨价的可能性是0.4。
风险决策 各状态下的收益值如下: 试用决策树进行决策。 按原工艺生产 引进技术成功 自行研究成功 产量 不变 增加 产量 价格低0.1 价格中0.5 价格高0.4 -100 100 -200 50 150 -300 250 200 -250 600
决策树练习答案: II I III 30 82 95 95 65 85 85 60 63 30 低价(0.1) -100 中价(0.5) 3 失败 (0.2) 高价(0.4) 100 82 95 -300 低价(0.1) 引 进 技 术 1 增加 产量 中价(0.5) 4 50 95 高价(0.4) 250 成功 (0.8) II 65 -200 低价(0.1) 中价(0.5) 5 产量 不变 50 高价(0.4) I 150 85 -300 低价(0.1) 增加 产量 中价(0.5) 6 -250 85 高价(0.4) 600 自 行 研 究 III -200 低价(0.1) 成功 (0.6) 60 中价(0.5) 63 7 产量 不变 2 高价(0.4) 200 低价(0.1) 30 -100 失败 (0.4) 中价(0.5) 8 高价(0.4) 100
风险型决策 贝叶斯决策 自然状态出现的概率估计的正确程度直接影响到决策中收益期望值。在条件许可的情况下,往往需要补充新信息。但获得补充信息需支付一定的费用。根据获得的新信息修正原先对自然状态出现的概率的估计值,并利用修正的概率重新进行决策。修正概率主要利用贝叶斯定理。
风险型决策 贝叶斯决策过程 先验分析 预验分析 后验分析 根据资料及经验对各自然状态出现的概率作出估 计,称为先验概率; 根据资料及经验对各自然状态出现的概率作出估 计,称为先验概率; 根据先验概率可作出决策,得到最优期望值,记为 EMV*。 预验分析 补充信息的成本-收益分析 后验分析 获取条件概率,运用贝叶斯定理对先验概率进行修正,得到后验概率; 根据后验概率作出决策,计算补充信息的价值。
风险型决策 先验分析-先验概率的专家估计法 例7-3:推荐三名大学生考研究生,请五位任课老师估计他们谁得第一的概率: 教师 权数 学生1 学生2 学生3 1 2 3 4 5 0.6 0.7 0.9 0.8 0.4 0.5 0.2 0.3 0.1 ∑ 加权求和 1.67 1.31 0.55 3.53 归一化后 0.47 0.37 0.16 1.00
风险型决策 预验分析 信息的价值在于它能提高决策的最大期望值。但获取信息的费用超过它所能提高的期望收益就不合算了。 所有信息中最好、最理想的信息自然是完全可靠、准确的信息,这种信息预报某自然状态出现,则在实际中必定出现这自然状态,这种信息称为完备信息。 补充信息费用应远小于完备信息的价值(上限)。 当完全信息预报出现第K个自然状态出现时,最优方案由 MAX{Ukj}j 确定。 在完备信息下,决策所能获得的最大期望收益值: ERPI与EMV*之间的差额就是得到完全信息而使期望值增加的部分,即为完备信息价值EVPI。
风险型决策 预验分析举例 方案1 方案2 方案3 MAX P1=0.3 P2=0.4 P3=0.3 50 30 10 20 25 10 例7-3:计算以下问题的完备信息价值 先验分析最大期望收益: EMV*= 17(方案1) 完备信息下:预报P1出现:MAX(50,30,10)=50, 选方案1; P2出现:选方案2 (最大期望收益25); P3出现:选方案3 (最大期望收益10) 。 完备信息下最大期望收益值为(收集信息前不知何种自然状态能出现): ERPI=0.3×50+0.4×25+0.3×10=28 完备信息的价值:EVPI=EPPI-EMV*=11 可以进一步去收集信息 。 方案 状态及概率 方案1 方案2 方案3 MAX P1=0.3 P2=0.4 P3=0.3 50 30 10 20 25 10 -20 -10 10 50 25 10
风险型决策 后验分析 补充新信息,通过对X1,X2,…,XS共S个状态的调查,获得实际出现自然状态θi而预报Xj的概率,即:P(Xj|θi)。 在已知先验概率P(θj)(j=1,2,…,m)及条件概率P(Xj|θi)(j=1,2,…,s;i=1,2,…,m)的基础上,利用贝叶斯定理计算修正概率,即后验概率: 根据后验概率,计算各方案的期望收益值,并依据期望收益值,重新作出决策(最大期望收益)。 计算获得补充信息后,最大期望收益的实际增量。
风险型决策 后验分析计算的表格形式 I 先验状态概率 P(θj) II 条件概率 P(Xi|θj) III P(θj) P(Xi|θj) X1, … , Xi, … , XS X1, … , Xi, … , XS θ1 : P(θ1) …, P(Xi|θ1),... …, P(θ1) P(Xi|θ1), ... θ2 : P(θ2) …, P(Xi|θ2), … …, P(θ2) P(Xi|θ2), ... …… … … θm : P(θm) …, P(Xi|θm), … …, P(θm) P(Xi|θm), ... 对第III部分的每一列求和 P(X1), …, P(Xi) , …, P(Xm) 后验概率: θ1 P(θ1|X1), …, P(θ1|Xi),… P(θj|Xi)= θ2 P(θj) P(Xi|θj)/ P(Xi) θm P(θ2|X1), …, P(θ2|Xi),… P(θm|X1), …, P(θm|Xi),…
风险型决策 例7-3 教材P271 实例9.12 事件状态(θ) :运动会规模大、小 后验状态( X ):预售门票多、中、少 条件概率:以往大、小规模运动会与一周前预售门票 P(X|θ) 规模大的情况下预售门票多的概率 规模大的情况下预售门票中的概率 …… 规模小的情况下预售门票少的概率 全概率: 预售门票多、中、少各自的概率 P(X) 预售多: P(X1)=P(θ1)×P(X1|θ1)+ P(θ2)×P(X1|θ2)
风险型决策 后验概率:门票预售多且实际规模大的概率 P (θ|X ) 门票预售多且实际规模小的概率 …… 门票预售少且实际规模小的概率 期望收益:∑后验概率×计划收益 决策: 门票预售多时执行期望收益大的计划 门票预售中时执行期望收益大的计划 门票预售少时执行期望收益大的计划 总期望收益:∑全概率×各项决策的期望收益 补充信息价值:后验总期望收益-先验总期望收益 完备信息价值: ∑先验概率×各状态的最大收益
风险型决策 贝叶斯决策练习: 假定天气是影响某工程项目能否按期完工的决定因素,如果天气好,工程能按期完工,施工单位能获利5万元;如果天气不好,不能按期完工,则要罚款1万元;但如不施工则要损失人工费0.2万元。根据过去的经验,在计划期内天气好的可能性为30%。为更好地掌握天气情况,可请气象部门作进一步的预报,需支付信息费0.08万元。从所提供的预报信息可知,气象部门对好天气的预测准确性为80%,对坏天气的预报准确性为90%。问该如何进行决策?
风险型决策 效用决策 考虑以下两个方案: A: 稳得100元奖金; B: 掷一枚均匀硬币,若出现正面可得250 元奖金,若出现反面则一无所获。 请你从A、B中选择一个方案。 根据最大期望收益准则: A的期望收益为100,而B则为125 因此,必须选择B方案才是正确的。
风险型决策 期望值准则的缺陷 两个方案,期望值相差不大,但风险差距很大,实际决策时很多人会选择风险较小的一个方案,即使它的期望收益稍小一点。 相等的期望值对决策者的吸引力相同? 决策者的风险态度、经济地位、价值观相同? 期望值为平均值,一项决策需要多次重复? 完全的数量价值指标?
风险型决策 效用与效用函数 为定量地描述决策者对风险的偏好和厌恶程度。用效用来衡量同一期望值在不同人主观上的价值(满意程度的衡量尺度)。 习惯上,效用最大为1,最小为0 一个决策者对不同期望值的效用值,构成了一条效用曲线U(X)。它描述了特定的期望损益值水平和与之相对应的满足程度之间的关系。 效用函数的确定 直接提问法 如:收入2万您是满意的,收入增加到多少,您会加倍满意? 心理试验法 首先确定甲、乙两个方案,询问决策者选择哪一个方案。 甲:以概率P得到a元,或以(1-P)的概率损失b元; 乙:无风险稳得c元;(a>c>b) 如果决策者认为甲、乙两方案等价时有: p U(a)+(1- p) U(b) = U(c)
风险型决策 a,b,c,p四个变量中,已知任意三个,向决策者提问第四个变量应取何值?如此反复回答,便可绘制出该决策者的效用曲线。 常用的提问:固定a,b,p(=0.5)值,问决策者c取何值时甲、乙两方案等价。 0.5U(a)+0.5U(b)=U(X) 1 U(X) X a0 b0 b2 b1 a1
风险型决策 例7-4:效用曲线的确定 [0.5U(a)+0.5U(b)=U(C)] 最大收益 a0=2000,最小收益 b0=-1000 根据约定:U(2000)=1,U(-1000)=0 第一次提问:C取多少时,稳拿c的方案与相同的可能性获得最大收益和最小收益的方案是等价的? 若回答为C=0,则有U(0)=1/2; 第二次提问:C取多少时,稳拿C的方案与相同的可能性获取2000和0的方案是等价的。 若回答为C=800,则有U(800)=3/4; 第三次提问:C取多少时,稳拿C的方案与相同的可能性获取-1000和0的方案是等价的。 若回答为C=-600,则有U(-600)=1/4 根据以上五点用光滑曲线连起来,就得到他的效用曲线
风险型决策 例7-4的效用曲线图 U(X) 1 0.75 0.50 0.25 X -1000 800 2000 -600
某一决策者可能兼有三种基本类型,不同情景下表现不同 风险型决策 效用曲线的基本类型 I 型:对损失的敏感性高于 对收益的敏感性 属于保守型决策者 II型:对收益的敏感性高于 对损失的敏感性 属于风险型决策者 III型:对收益的敏感性等同 于对损失的敏感性 按期望准则决策 U(X) 1 I III II X 某一决策者可能兼有三种基本类型,不同情景下表现不同
风险型决策 效用值准则 方法与期望价值相同,只是用效用值替代损益值。计算得到每一方案的期望效用价值,取最大值对应的方案为最后的决策方案。 例7-5 效用准则决策 教材P275 实例9.14
不确定型决策 两类不确定型决策(按不确定程度区分) 两类问题的决策方法 已知自然条件,但不知发生的概率(I类) 自然条件未知(II类)
不确定型决策 决策准则 乐观准则:大中取大、 max max 悲观准则(WALD)小中取大max min 不放弃任何获取最大收益的机会 悲观准则(WALD)小中取大max min 假定最差的结果出现,再求得最大收益的机会 折衷主义准则(乐观系数α,悲观系数 1-α) 既不乐观也不悲观,介于两者之间,0≤α≤ 1 等可能性准则(LAPLACE准则) 假定每一种自然状态出现的可能性相同 最小机会损失准则(后悔值准则、SAVAGE准则) 后悔值:最好的可能结果与实际结果之间的差。min max 源于悲观的假设(最大后悔情况出现),再要求最小后悔方案
不确定型决策 完备信息的最大价值问题 完备信息最大价值 ( F ) 的确定 额外的正确信息(完备)有利于更好的决策!! 获得完备信息可以确定将是何种自然状态出现。 为获得这些额外完备信息,值得支付的费用?? 完备信息最大价值 ( F ) 的确定 决策将根据出现的自然状态的最大收益值确定 实际获利数额=该自然状态下各方案最大收益-F 构建虚拟方案,以实际获利值为各自然状态下的收益 (虚拟方案意思为是否值得投资F去获取完备信息) 利用各种决策准则,获取完备信息F取值的范围
不确定型决策 min 例7-4:不同决策准则的选用 4 3.6 1.2 以下为某产品生产-销售的收益矩阵: max A1: 2万件 A2: 畅销 一般 滞销 (后悔值) (后悔值) (后悔值) max min A1: 2万件 A2: 2.5万件 A3: 5.6万件 4 3.6 1.2 5 3.4 1.6 5.6 3.3 0.9 后悔值 MAX 4 1.2 (1.6) (0) (0.4) (1.6) 5 1.6 (0.6) (0.2) (0) (0.6) 5.6 0.9 (0) (0.3) (0.7) (0.7)
不确定型决策 乐观准则:MAX (4,5,6)=6, 选A3 悲观准则:MAX (1.2,1.6,0.9)=1.6 选A2 折衷准则:假定α=0.4, 1- α=0.6 对每一方案:最大值×α+(1-α)×最小值 A1: 4×0.4+1.2×0.6=2.32 A2: 5×0.4+1.6×0.6=2.96 A3: 5.6×0.4+0.9×0.6=2.78 选 A2
不确定型决策 等可能性准则:三种自然状态,概率1/3 转化为风险问题计算期望收益值。 A1: (4+3.6+1.2)/3=2.93 A2最大,选A2 后悔值准则:MIN (1.6,0.6,0.7)=0.6 选A2
不确定型决策 完备信息价值F min 4 3.6 1.2 max A1: 2万件 A2: 2.5万件 A3: 5.6万件 A4: 完备价值 畅销 一般 滞销 (后悔值) (后悔值) (后悔值) max min A1: 2万件 A2: 2.5万件 A3: 5.6万件 A4: 完备价值 4 3.6 1.2 5 3.4 1.6 5.6 3.3 0.9 5.6-F 3.6-F 1.6-F 4 5 5.6 5.6-F 1.2 1.6 0.9 1.6-F
不确定型决策 根据不同准则确定最大F值: 等可能性准则:A1,A2,A3中选A2(=3.33) A4:(5.6-F+3.6-F+1.6-F)/3=3.6-F 如果值得付费F的话,必须 3.6-F≥3.33, 即:F≤0.27 因此,为完备信息付费的最大值为0.27 后悔准则:A1,A2,A3中选A2(0.6) A4后悔值均为F, 因此有:F≤0.6 悲观准则?乐观准则?