第9讲 策略思考的数学模型 —博弈论模型.

Slides:



Advertisements
Similar presentations
质数和合数 中心小学 顾禹 人教版小学五年级数学下册 一、激趣导入 提示:密码是一个三位 数,它既是一个偶数, 又是 5 的倍数;最高位是 9 的最大因数;中间一位 是最小的质数。你能打 开密码锁吗?
Advertisements

因数与倍数 2 、 5 的倍数的特征
质数和合数 2 的因数( ) 6 的因数( ) 10 的因数 ( ) 12 的因数 ( ) 14 的因数 ( ) 11 的因数 ( ) 4 的因数( ) 9 的因数( ) 8 的因数( ) 7 的因数( ) 1 、 2 、 3 、 4 、 6 、 12 1 、 11 1 、 2 、 5 、 10.

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
2 、 5 的倍数特征 集合 2 的倍数(要求) 在百数表上依次将 2 的倍数找出 并用红色的彩笔涂上颜色。
3.4 空间直线的方程.
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
教材版本:新教材人教版九年级(上) 作品名称:同类二次根式 主讲老师:张翀 所在单位:珠海市平沙第一中学.
第三章 函数逼近 — 最佳平方逼近.
第九章 博弈论-无处不在的游戏 第一节 博弈论的基本概念与分类 第二节 完全信息博弈 第三节 不完全信息博弈(自学)
微观经济学 主讲教师:吴义凤.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
博弈论初步 第1课时 乐清中学 施克满.
《高等数学》(理学) 常数项级数的概念 袁安锋
常用逻辑用语复习课 李娟.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
§5.3 定积分的换元法 和分部积分法 一、 定积分的换元法 二、 定积分的分部积分法 三、 小结、作业.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
余角、补角.
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
探索三角形相似的条件(2).
初中数学八年级下册 (苏科版) 10.4 探索三角形 相似的条件(2).
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
Harvard ManageMentor®
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
 做一做   阅读思考 .
Bayesian Nash Equilibrium
计算机数学基础 主讲老师: 邓辉文.
宁波市高校慕课联盟课程 与 进行交互 Linux 系统管理.
宁波市高校慕课联盟课程 与 进行交互 Linux 系统管理.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
相似三角形 石家庄市第十中学 刘静会 电话:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
Three stability circuits analysis with TINA-TI
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
Harvard ManageMentor®
复习.
企业文化内涵体系 持续循环 企业标志 品牌力:…… 服务力:…… 品牌力/服务力 潜规则是…… 1、品质 2、战略 1、价值 2、绩效
定理21.9(可满足性定理)设A是P(Y)的协调子集,则存在P(Y)的解释域U和项解释,使得赋值函数v(A){1}。
第16讲 相似矩阵与方阵的对角化 主要内容: 1.相似矩阵 2. 方阵的对角化.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
3.1 变化率与导数   3.1.1 变化率问题 3.1.2 导数的概念.
第一节 不定积分的概念与性质 一、原函数与不定积分的概念 二、不定积分的几何意义 三、基本积分表 四、不定积分的性质 五、小结 思考题.
第4课时 绝对值.
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
导 言 经济学的基本问题 经济学的基本研究方法 需求和供给.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
§2 方阵的特征值与特征向量.
定义5 把矩阵 A 的行换成同序数的列得到的矩阵,
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
FH实验中电子能量分布的测定 乐永康,陈亮 2008年10月7日.
第三节 数量积 向量积 混合积 一、向量的数量积 二、向量的向量积 三、向量的混合积 四、小结 思考题.
第十七讲 密码执行(1).
使用Fragment 本讲大纲: 1、创建Fragment 2、在Activity中添加Fragment
§4.5 最大公因式的矩阵求法( Ⅱ ).
请添加标题 请添加作者.
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
§3.1.2 两条直线平行与垂直的判定 l1 // l2 l1 ⊥ l2 k1与k2 满足什么关系?
Sssss.
Presentation transcript:

第9讲 策略思考的数学模型 —博弈论模型

数学建模 数学建模 【本讲简介】    本讲介绍博弈模型,包括博弈论中最基本的一些概念,以及非合作博弈中的Nash平衡和Pareto最优概念,同时,介绍博弈论中的几个著名案例:囚徒困境,智猪博弈,脏脸之谜,以及不完全信息静态博弈模型的贝叶斯纳什均衡的一个应用案例——拍卖模型。 。

博弈论(Game Theory) *博弈论是在策略性环境下进行思考并作出决策的工具。 —— 日本经济学家梶井厚志 数学建模 博弈论(Game Theory)   *博弈论是在策略性环境下进行思考并作出决策的工具。 —— 日本经济学家梶井厚志   * 博弈是策略交往的一种建模方式。 —— 美国经济学家Samuel Bowles * 要在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解。—— 美国经济学家萨缪尔森 数学建模 我们先来看看学者们是如何表述博弈论的。 关键词:策略。学习博弈论,就是学习“策略性思考”,建立起两个意识:对手意识,对策意识。 “策略性思考” 对手意识 对策意识

数学建模 数学建模 博弈有5个基本要素: 1.局中人(选手)——参与博弈的个人或团体。 2.策略(对策)——可供局中人选择的行动方案。 3.赢利(效用)——局中人的收益或支付。 4.信息——在策略选择中,信息是最关键的因素。 5.均衡——博弈的最终结果。 上述要素中,局中人、策略、赢利及信息规定了一局博弈的游戏规则。均衡是游戏的最终结局。 中国古代最有名的博弈案例相信大家都听说过:田忌赛马。齐王的马比田忌好,为何齐王败、田忌胜?区别就在于“信息”。

n人博弈模型的几个符号约定: 选手集: 策略集: 决策集: 赢利函数: 数学建模 数学建模 每个人的策略集可以不同。“田忌赛马”案例中齐王与田忌各有3!=6个策略。 局中各方每人出一个策略,放到一起,便构成一个决策。

数学建模 数学建模 例如:“田忌赛马” S 齐=S 田={(上中下), (中下上),(下上中), (上下中), (中上下),(下中上)} f 齐((上中下),(下上中)) = 0 f 田((上中下),(下上中)) = 1 双方若随机抽取策略,则齐王有六分之五的获胜概率,田忌只有六分之一。 在博弈问题中,每一方的“最佳策略”都必须依赖对方的“策略”。 这种即互相冲突又互相依赖,“我中有你,你中有我”的问题正是博弈论研究的问题。

如果选手 k 知道了其他选手的策略xi , ( i =1,2, …,n, i≠k ),自然希望取策略 xk ∈ Sk 使得: 数学建模  下面讨论非合作情形下的博弈。 如果选手 k 知道了其他选手的策略xi , ( i =1,2, …,n, i≠k ),自然希望取策略 xk ∈ Sk  使得: 定义选手 k 的合理反应集为 各选手都希望决策在各自的合理反应集中,故此称 为 n 人非合作对策的一个Nash平衡点。 数学建模 注意,Rk是选手k的合理反应集,是决策集而不是选手k的策略集,是在别的选手的策略都取定的前提下,对选手k最有利的决策。

Nash定理 非零和非合作博弈的Nash平衡点一定存在。 数学建模 数学建模 对于Nash平衡点,在别人不改变对策的情形下,每个选手的对策都是最好的,故他们都不会轻易去改变自己的对策。所以,非合作博弈的解将在 Nash平衡点处出现。 Nash定理 非零和非合作博弈的Nash平衡点一定存在。 如果决策不在Nash平衡点处,则博弈各方有调整策略的冲动,无法稳定。而一旦到达Nash平衡点,则各方不会再轻易改变自己的策略,从而达到稳定。 零和指博弈各方的收益之和为0,非零和博弈则可以实现共赢。 Nash平衡点可能不唯一

数学建模 数学建模 ※分钱游戏:两人分100元钱,每人写下自己主张得到的数字x与y,若x+y≤100,则各自得到自己主张的钱数,否则,此100元钱充公。 问题:该游戏的纳什均衡点在哪儿? 直观结论:(50,50)是纳什均衡解。 一般结论: (x,y)(x+y =100)都是纳什均衡解。 举个简单例子加深对纳什均衡概念的理解。

问题: Nash平衡点对博弈各方是否一定是最优的? 数学建模 问题: Nash平衡点对博弈各方是否一定是最优的? 数学建模 乙方获利 B 1 3 2 5 4 A Nash平衡点对各方来说都未必是最优的,甚至可能存在这样一种情形:所有各方的利益都可以得到改善,甚至是大幅度的改善。有这样的好事!那为什么不去实现它?这是由于是非合作对策,没有商量的机会,谁也不敢首先改变自己的策略,因为若自己改变了策略,而别人不改变,则利益肯定受损。这就引出了一个有意思的结论。(见图) a,b都是Nash平衡点。为什么会取a而不取b?由于双方都认为自己是当前情形下最好的选择,故都不会先动。如果商量,则是合作情形 再来看另一种情形,假设蓝点是非Nash平衡点,甲方认为这时对自己不是最优的,因此会改变策略,使对自己最有利。但乙方也不甘心,也改变策略,使对自己最优。甲方再次改变策略。乙方也再次改变策略…,最终到达a点,大家都满意了,终于消停了。 这里揭示了一个深刻道理:损人不利己。 甲方获利 Nash平衡点示意图

数学建模 数学建模 通过追求自身利益,人们常常会比其实际上想做的那样更有效地促进社会利益。 ——亚当·斯密 纳什均衡理论引出了亚当·斯密的“看不见的手”的市场经济理论的一个悖论:从利己目的出发,结果可能是损人不利己。 亚当.斯密,大经济学家,经典经济学巨著《国富论》的作者。“主观利己,客观利他”。

你可以将一只鹦鹉训练成经济学家,因为它只需要学习两个词:供给与需求。 数学建模 数学建模    你可以将一只鹦鹉训练成经济学家,因为它只需要学习两个词:供给与需求。               ——萨缪尔森 要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词是“纳什均衡”。               ——坎多瑞 关于“纳什均衡”在经济学上的地位,有这样一种说法。

1950年,在他那篇仅仅27页的博士论文中提出了后来被称为“纳什均衡”的博弈理论。 数学建模 数学建模 1950年,在他那篇仅仅27页的博士论文中提出了后来被称为“纳什均衡”的博弈理论。 1958年起20多年严重精神病折磨。 1994年与人分享诺贝尔经济学奖 。 John F. Nash, 1928-

数学建模 数学建模 决策 x ∈ D 称为是帕累托(Pareto)最优的是指:D中不存在决策 y 使得 f (y ) > f (x) 。 社会资源如何才能实现最优配置,只有资源配置已经达到这样一种状态,也就是在不使其中一个变得更坏的情况下,另一个也不能变得更好。 ——意大利经济学家帕累托 通俗地说,若博弈中任一方的利益的提升,必然要以某一方的利益受损为代价,则这个决策是帕累托最优的。 说到帕累托,还有一个著名的帕累托法则:80/20法则。 Nash平衡点未必是帕累托最优的。见下图。

数学建模 数学建模 乙方获利 B A 好,概念介绍到此,下面我们看一些博弈论中的著名案例。 甲方获利 Nash平衡点示意图

囚徒困境—非零和博弈 设两偷盗犯因被发现藏有被盗物品而被拘留。现被分别单独关押。两人都知道,如果都不承认偷盗,将以窝赃罪各判1年监禁;如果都承认,将以偷盗罪各判5年。但如果一人招认而另一人不承认,则坦白者将从宽处理获得释放,而抗拒者从严被判10年。这两个囚犯该如何选择自己的最优策略?

两位囚犯的策略集都是{x (招认), y (不招认)},赢利函数分别为: f1 ( x, x ) = -5 , f1 ( x, y ) = 0 f1 ( y, x ) = -10 , f1 ( y, y ) = -1 f2 ( x, x ) = -5 , f2 ( x, y ) = -10 f2 ( y, x ) = 0 , f2 ( y, y ) = -1 各自的合理反应集为: R1 = { ( x, x ) , ( x, y ) } R2 = { ( x, x ) , ( y, x ) } 所以该问题的Nash平衡点只有一个: ( x, x ) 即在非合作条件下,坦白是双方的最好选择。

智猪博弈—弱势方的抉择 猪圈里有一头大猪,一头小猪。猪圈的一头有一个食槽,另一头有一个控制猪食供应的按钮。按一次按钮,有10个单位的猪食入槽,但是按按钮要付出两个单位的跑动成本。若大猪先到食槽,则大猪吃到9个单位猪食,小猪吃到1个单位;若两猪同时到达食槽,大猪吃7个单位猪食,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。

数学建模 数学建模 大、小猪策略集 同为: { 0(不动) , 1(按钮) } 大猪的合理反应集为: { (0,1) , (1,0 ) } 小猪的合理集反应为: { (1,0) , (0,0 ) } 所以最终结果为:大猪按钮,小猪不动。 激励机制需合理制定。  小猪  大猪  1 (5,1) (4,4) (9,-1) (0,0)

脏脸之谜—共同知识 三姐妹 从外面回到家里,她们的脸都是脏的,但她们自己并不知道。母亲见到她们后说道:“你们三人中至少有一个人的脸是脏的”,她们没有反应,因为这是一个显然的事实,她们认为母亲说的是一句“废话”。但当母亲追问一句:“你们知道是谁吗?”,她们先是互相看了一下,然后都脸红了,都知道自己的脸是脏的,这是为什么?

数学建模 数学建模 推理过程:其中任一人会想:如果我的脸是干净的,那么她们两人都可以从对方的犹豫中知道自己的脸是脏的,但她们没有脸红,说明我的脸也是脏的。 首先,每个人都知道“没有两张干净的脸”这个事实(这是废话!)。 根据别人的犹豫,每个人又知道了这样一个事实:“每个人都知道‘没有两张干净的脸’” (这不是废话!) 通过这个案例,我们还想得到更深刻一些的结论。 为什么一句“废话”会引出正确的结论?其实,“废话”引出了各方的反应,因此引出了新的信息(尽管这个信息没有用语言表达)。

共同知识——每个人都知道这个事实,每个人都知道每个人都知道这个事实,每个人都知道每个人都知道每个人都知道这个事实,… 共同知识的直观但并不严格的定义。 “皇帝的新装”是一个解释共同知识的好例子。在小孩没有说话前,每个人都知道“皇帝没有穿衣服”这个事实,但是它还不是共同知识。当小孩喊出“他没有穿衣服”这句话以后,“皇帝没有穿衣服”就由大家都知道的事实变成了共同知识。 最后作个小结。

数学建模 不完全信息静态博弈模型 完全信息博弈:每个参与人的特征、收益以及策略空间都是所有参与人的共同知识。 不完全信息博弈:至少上述信息之一不是共同知识 数学建模 在现实中,许多博弈不满足完全信息博弈模型的要求,例如,产品推销员推销产品时,不了解消费者的偏好与支付函数;市场竞争各方不知道对方的成本函数;

“市场扩张”博弈模型 企业甲、乙对市场概率分布是已知的,企业甲了解企业乙的收益情况,但企业乙不知道企业甲的生产成本 扩张(K) 保持(B) 市场需求高 (0.2) 扩张 3,2 5,1 保持 0,3 2,1 市场需求低 (0.8) -2,-2 -1,0 0,-1

数学建模 数学建模 由于存在不确定因素,这时的纳什均衡解是指在期望收益最大条件下的策略组合,称为贝叶斯纳什均衡解。 以“市场扩张”模型为例。 企业甲的纯策略有: a(K,K), b(K,B), c(B,B), d(B,K) 企业乙由于不知道企业甲的所有信息,从而必须考虑甲采取的策略,故有: w(K/K,B/K), x(K/K,B/B),y(K/B,B/K),z(K/B,B/B) 从而甲乙双方的策略组合共有12种。 甲如果采取纯扩张策略,则aw组合与ax组合的效果是一样的,ay和az也是一样的效果。所以与a的不同组合只有两种。同理,与c的不同组合也只有两种。我们以下来计算以下所有策略组合的期望收益。 (说明:甲的策略是对应市场的两种情况,采用不同的策略;乙的策略是根据甲的策略,采取不同的策略。)

此时唯一的贝叶斯纳什均衡点为:b(K,B) x(K/K,B/B),即甲乙双方都采取“高扩低保”的策略。 数学建模 数学建模 “市场扩张”模型期望收益矩阵 w x y z a -1,-1.2 —— 0.2,0.2 b 0.6,-0.4 2.2,1.2 1,-0.6 2.6,1 c 0,-0.2 2,1 d -1.6,-1 -0.6,0 -1.2,-1.4 -0.4,0.2 此时唯一的贝叶斯纳什均衡点为:b(K,B) x(K/K,B/B),即甲乙双方都采取“高扩低保”的策略。 在实际操作中乙采取跟随策略在时间上需要滞后。

拍卖(召投标)模型 拍卖机制分析 信息经济学 威廉·维克瑞 (William Vickrey,1914-1996) ● 美国经济学家 数学建模 拍卖(召投标)模型 数学建模 拍卖机制分析 信息经济学 威廉·维克瑞 (William Vickrey,1914-1996) ● 美国经济学家 ● 在信息经济学方面作出开创性研究 ● 1996年获诺贝尔经济学奖 对拍卖及拍卖机制的分析直接成为信息经济学的发端,

拍卖(召投标)模型 数学建模 数学建模 最高价密封拍卖:每个竞买者出个报价,密封后交予拍卖方,所有报价同时解封,出价最高者获得该拍品,按最高报价成交。 次高价密封拍卖:每个竞买者出个报价,密封后交予拍卖方,所有报价同时解封,出价最高者获得该拍品,按次最高报价成交。 次高价成交方案的目的是鼓励竞买者出更高价。 竞拍者的出价是一种策略,这个出价依赖于竞拍人自己对拍品的价值的估计,还依赖于对其他竞拍人的估价的估计。由于其他竞拍人的估价是未知的,所以这是一个不完全信息博弈问题。

数学建模 数学建模 最高价成交模型 假设有N个竞拍人,第i个竞拍人的估价为 vi ,出价为bi。 根据竞拍规则,竞拍人的收益函数为: 竞拍人都无法知道其他人的估价,但假设知道它是区间[0,1]上均匀分布的一个随机变量。设竞拍人的出价策略为 其中βi 是严格递增函数。 设每个竞拍人都是理智的,他们希望获得拍品且物有所值。

数学建模 先讨论两个局中人的情形。 数学建模 求期望过程中,自己的估价v1不是随机变量,随机性来自于对方的估价不知道。

考虑对称情形,假定所有局中人的出价策略相同,记为 则局中人1的优化目标为 极值条件为: 数学建模 数学建模

结论:仅有两个竞拍人的情形,此竞拍博弈模型的贝叶斯纳什均衡解是:每个竞拍人的出价是自己估价的一半。 数学建模 数学建模 结论:仅有两个竞拍人的情形,此竞拍博弈模型的贝叶斯纳什均衡解是:每个竞拍人的出价是自己估价的一半。 两条关键假设:1、每人估价是[0,1]内均匀分布随机变量;2、每人出价策略相同,且相互独立。

回到N人竞拍情形,假设同前。 极值条件: 数学建模 数学建模 两条关键假设:1、每人估价是[0,1]内均匀分布随机变量;2、每人出价策略相同,且相互独立。

结论:最高价成交N人竞拍模型的贝叶斯纳什均衡解为:每个竞拍人按自己估价的(N-1)/N出价。 数学建模 数学建模 结论:最高价成交N人竞拍模型的贝叶斯纳什均衡解为:每个竞拍人按自己估价的(N-1)/N出价。 也就是说:竞拍者越多对拍卖者越有利。

次高价成交模型 可以得出结论:此时的贝叶斯纳什均衡解为:各竞拍方按各自的估价出价。 接下来分别计算两种拍卖方案下的成交价期望值。 最高价成交方案中,成交价期望为 数学建模 数学建模

数学建模 数学建模 次高价成交方案中,成交价期望为 最高价成交方案的效率更高一些。

进一步计算方差可得:

二手车市场—逆向选择 二手车市场上,买者往往不能得到车辆质量的完全信息,所以他只愿意按二手车的平均质量支付价格,于是,质量高出平均质量的车辆便会选择退出这个市场, 于是此市场的二手车平均质量降低,又进一步导致价格降低,…。

逆向选择:在信息不对称背景下,交易中的卖方往往有意隐瞒某些真实信息,使得买方作出的选择并非最有利于自己,故称为逆向选择。 ——信息不对称! 劣币驱逐良币! 质 量 价 格

数学建模 1964年3月13号凌晨3点, 纽约市民Kitty Genovese在 即将回到住处时,遭到持刀暴 徒的侵犯,她惊恐的尖叫并恳 求帮助。但她的38户邻居,很 多人走到窗户前观望了片刻, 目睹她在歹徒手中挣扎,但直到歹徒离开,才有人打电话 报警。但Genovese却未能得到及时救治很快就死去了。 心理学家的解释——旁观者效应。 为什么围观者会见死不救? 数学建模 大量的实验和研究显示在公共场所观看危机事件的旁观者越多,愿意提供帮助的人就越少。当旁观者的数目增加时,任何一个旁观者都会更少地认为自己有采取行动的责任。这被称为 旁观者效应 。

数学建模 我们来看看这一现象的博弈论解释。 假设1:人类的行为总是倾向于最大化自己的效用。 假设2:有人提供帮助时,围观者每人可以获得固定收益a。 假设3:提供帮助者会有损失b。 假设4:每个旁观者在事件中的地位是相同的。 设共有n人旁观,其中任一人A的收益矩阵为 数学建模 其他人不帮助 其他人有人帮助 A不帮助 a A帮助 a-b

假设每个人 不帮助的概率为 p,那么: A不帮助的期望收益 Q1= 0. p n-1 + a 假设每个人 不帮助的概率为 p,那么: A不帮助的期望收益 Q1= 0 * p n-1 + a * (1- p n-1 ) A帮助的期望收益 Q2 =(a-b)* p n-1 +(a-b)* (1- p n-1 ) 则A总的期望收益 Q(p)= p * Q1 +(1-p) * Q2 = a - b –apn + bp 令dQ(p)/dp = 0,解得 p = (b/(na)) 1/(n-1) 容易验证,不帮助的概率p关于围观人数n是递增的。 数学建模 数学建模

数学建模 数学建模 结论: 1、围观者越多,围观者施以援手的愿望越低; 2、和谐社会,需要增加 a 值,比如给予助人为乐者金 钱上或者精神上的奖励。 3、和谐社会,需要降低 b 值,营造一个信任度高的社会环境。而诸如钓鱼执法,南京老太这样的事件,却大大提高了 b 值,使社会成本大大增加。 本案例取材于果壳网。

思考题:如果旁观者的收益矩阵改变如下,有 何结论? 其他人不帮助 其他人有人帮助 A不帮助 a A帮助 a-b a-b/2

了解博弈论的基本思想,加强思维中的“对手意识”与“对策意识”,对增强决策力是很有益处的。   本讲小结:    了解博弈论的基本思想,加强思维中的“对手意识”与“对策意识”,对增强决策力是很有益处的。

作业: 9. 1. 在最高价成交模型中,若各竞拍方的估价是独立的两点分布随机变量,且分布参数已知,则此时的贝叶斯纳什均衡解如何? 9. 2 作业: 9.1.在最高价成交模型中,若各竞拍方的估价是独立的两点分布随机变量,且分布参数已知,则此时的贝叶斯纳什均衡解如何? 9.2. 思考题

谢 谢 !