Agent模拟原理 4.1 多Agent模拟 4.2 元胞自动机模拟 北京林森科技培训材料www.anylogic-china.com
4.1 多Agent模拟 4.1.1 多Agent模拟原理 20世纪70年代,人工智能领域启用了Agent的概念,其含义指,分布式系统由多个Agent组成,Agent之间以及Agent与环境之间的活动都是并发的,具有自主性、交互性、反应性和主动性特征,常简称为多智能体。 1)多Agent建模原理 主要特征:Agent之间的简单规则,导致宏观复杂的模式。 理论基础:涌现原理、自组织原理。 北京林森科技培训材料www.anylogic-china.com
(1)涌现原理 涌现这个概念在复杂性研究中非常重要。当低层次单元间交互导致高一层次新的现象发生时,我们称之为涌现。如温度是分子运动的涌现,单个分子没有温度特性,但是许多分子就涌现出温度。 (2)自组织原理 自组织关注的是一个机体或组织自产生、自维持的现象。在社会、经济、管理领域,系统中也存在大量的自组织聚集的现象,如城市、供应链、企业集群、专业市场等。 北京林森科技培训材料www.anylogic-china.com
(1)通过实际系统分析,建立多Agent模型 a. 确定Agent类型及数目 即分析被模拟对象的基本组成。例如社会系统中的社会组织有权利组织、盈利组织等不同类型,那么,就可以分别用不同类型的Agent来代表;权利组织、盈利组织有几个,那么相应的不同类型的Agent就有几个对象。又如,管理系统中“人”大致分为管理者和普通员工两类,那么,就可以分别用两类Agent来代替,并根据管理者和普通员工的人数来设置相应的对象的个数。 北京林森科技培训材料www.anylogic-china.com
b. 确定Agent的属性 Agent的属性如“人”的人性特征(是社会型、还是经济型?)、工作态度(是积极还是消极?)等。又如盈利组织的组织文化、生命周期阶段、市场竞争力等。一般来说,有的Agent的属性,就是模拟输出要得到的东西,我们的模拟目的,就是要得到这些属性值随时间的变化。 c. 分析Agent的行为 分析现实系统中每个Agent的行为,这要从两两Agent之间的相互作用来分析,包括:不同类型Agent之间、以及同类型Agent之间。例如经济系统中,政府Agent调整银行Agent的贷款利率,那么这个“调整”就是政府Agent的行为,即政府对象发给银行对象的消息。居民Agent之间就是否购买房产商Agent的商品房,而相互传播观念,那么,“观念”就是居民对象的属性,“更改观念”是居民对象的方法。 北京林森科技培训材料www.anylogic-china.com
Agent行为发生的原因,即Agent采取行动的条件,包括两个方面: d. 分析Agent行为的原因 Agent行为发生的原因,即Agent采取行动的条件,包括两个方面: 一是Agent之间互动的规则。例如管理系统中,企业Agent根据经济效益,决定是否裁减员工Agent;员工Agent根据员工群体之间的行为规范要求(社会场的影响)、以及管理者Agent在物质上的激励措施,权衡自己是否为企业卖力(即提高员工Agent的工作努力度)。 二是Agent采取行动要具备什么样的外部环境。例如股票市场中,每个投资者的行为(买、卖、持有)发生,除了受相互之间的影响,还受外部环境的影响,这个外部环境就是政府的宏观政策。 北京林森科技培训材料www.anylogic-china.com
(2)运用计算机语言,建立多Agent模拟模型 a. 搭建一个平台 即建立一个模仿现实系统中Agent相互影响、相互作用的一个平台,类似于沙盘模型的一个台面。模拟运行时,Agent就在该台面上活动。 b. 确定Agent的空间特征 即确定每个Agent的空间位置是移动的还是静止的。如果是移动的,那么每个Agent就可以在平台上到处移动,与相遇的Agent或资源发生行为互动;Agent如果是静止的,那么每个Agent在平面上的各自的位置都相对固定,只与其周边的Agent发生行为互动,元胞自动机就是按这种方式运行的。 c. 实现所有Agent行动的并发过程 在现实系统中,所有Agent的行动是同时发生的,不是一个一个地进行的,这就要求编程实现时要采用并行处理方式,不能是串行方式。而计算机CPU的工作方式在理论上是无法实现并行方式的。因此,并行模拟一直是计算机模拟领域的热门研究课题。 Agent建模与模拟软件:已出现的多Agent建模与模拟软件有多种, Swarm、Reparst、NetLogo、AnyLogic 北京林森科技培训材料www.anylogic-china.com
区域经济系统,包含有居民、银行、各类企业、政府等组成要素。 4.1.3 区域经济系统Agent模拟 宏观经济学原理从总量均衡的角度解释区域经济系统的宏观运行现象,微观经济学原理则关注其底层的组成要素的运作规律。而各组成要素的微观经济学运作规律,是如何演化形成区域经济系统的均衡或非均衡的宏观现象的?微观经济学和宏观经济学之间,显然是脱节的。而多Agent建模与模拟方法,有望弥补这个脱节的过程。 区域经济系统,包含有居民、银行、各类企业、政府等组成要素。 北京林森科技培训材料www.anylogic-china.com
ASPEN模型: 见word文档。 北京林森科技培训材料www.anylogic-china.com
将概率论方法与多Agent建模进行集成,具体体现为: (1)将Agent的属性值概率分布化 Aspen模型的特点: 将概率论方法与多Agent建模进行集成,具体体现为: (1)将Agent的属性值概率分布化 即将Agent的某个或某些属性,视为随机变量。首先,找到该随机变量的概率分布函数及其参数,例如,家庭Agent的户主年龄服从(21.0,76.0)的均匀分布,又如企业Agent的现金资产服从($10000, $50000)的均匀分布等等。然后,在Agent将要进行两两互动之前,用概率分布函数对该属性值进行抽样,用于Agent的两两互动之中。 北京林森科技培训材料www.anylogic-china.com
企业对产品定价时,有三种可能的行为,包括涨价、持平和降价,企业采取那一种行为,则由离散概率分布函数抽样决定。 (2)Agent的行为遵循离散概率分布 企业对产品定价时,有三种可能的行为,包括涨价、持平和降价,企业采取那一种行为,则由离散概率分布函数抽样决定。 ( 3)对最终的模拟输出进行统计分析 多Agent之间通过多个阶段的两两互动,根据终止条件停止运算,则对Agent的属性值的变化过程进行统计,对事先设计好的整个系统的性能指标进行计算、统计。 北京林森科技培训材料www.anylogic-china.com
4.2 元胞自动机模拟 4.2.1 元胞自动机的定义 是时间、空间和状态都按离散方式变化的动力系统。散布在珊格(Lattice)中的每个元胞(Cell)取有限的离散状态,遵循同样的相互作用规则,同步更新各自的状态。 4.2.2 元胞自动机的组成 元胞自动机最基本的组成为元胞、元胞空间、邻居及规则四部分。如图1.4.5所示。 北京林森科技培训材料www.anylogic-china.com
元胞又可称为单元、或基元,是元胞自动机的最基本的组成部分。元胞分布在离散的一维、二维或多维空间上。 图1.4.5 元胞自动机的组成 1)元胞 元胞又可称为单元、或基元,是元胞自动机的最基本的组成部分。元胞分布在离散的一维、二维或多维空间上。 2)状态 状态可以是{0,1}的二进制形式,或是{s0, s2, …, si, …, sk}整数形式的离散集。 北京林森科技培训材料www.anylogic-china.com
(a)三角网格 (b)四边网格 (c)六边网格 3)元胞空间 处于分布状态的元胞空间网点集合就是元胞空间。 元胞空间的几何划分: (a)三角网格 (b)四边网格 (c)六边网格 图1.4.6 二维元胞机的三种网格划分 北京林森科技培训材料www.anylogic-china.com
(a)Von Neumann型 (b)Moore型 c)扩展的Moore型 4)邻居 最常见的:冯-诺依曼(Von Neumann)型、摩尔(Moore)型。 (a)Von Neumann型 (b)Moore型 c)扩展的Moore型 图1.4.8 元胞自动机的邻居模型 北京林森科技培训材料www.anylogic-china.com
根据元胞当前状态及其邻居状况确定下一时刻该元胞状态的动力学函数,即状态转移函数,该函数可以记为: 5)规则(Rule) 根据元胞当前状态及其邻居状况确定下一时刻该元胞状态的动力学函数,即状态转移函数,该函数可以记为: f:sit+1=f (sit, sNt) 其中,sNt为t时刻的邻居状态组合,我们称f为元胞自动机的局部映射或局部规则。 6)时间(Time) 元胞自动机是一个动态系统,它在时间维上的变化是离散的,即时间t是一个整数值,而且连续等间距。假设时间间距dt = 1,若t = 0为初始时刻,那么t = 1为其下一时刻。 北京林森科技培训材料www.anylogic-china.com
4.2.3 元胞自动机模拟示例 1)民意集中模拟 (1)问题 当外界环境发生变化时,对于一群人如何应对环境的变化而言,在这群人里会产生多种不同的观点或意见,随着人群中个人和个人之间不断地交换意见,即随着时间的推移,意见的种数会发生变化。我们可以运用元胞自动机,对人群中意见种数发生的变化做如下工作: a. 模拟变化过程; b. 分析变化过程的规律。 北京林森科技培训材料www.anylogic-china.com
(2)建模 离散化的方法: 上述过程可以简单描述如下: 每个元胞都看作有主张的个人,元胞的状态代表每个人的意见,状态的集合服从(0, 1)均匀分布。 每个人依据其邻居的状态(包括自己)定期改变它自身的状态,每个邻居的影响力相同。uj(t)表示在第t个阶段元胞j的状态,Ni表示元胞的所有邻居的集合,#Ni表示邻居的数目。元胞j在下一个阶段的状态可以用公示表示为: 离散化的方法: (1.4.2) 离散化函数 上述过程可以简单描述如下: 北京林森科技培训材料www.anylogic-china.com
(3)模拟与分析 图1.4.10表示了在2, 5, 10, 15和30种意见的情况下模拟的典型结果。在模拟开始时,每种意见的元胞是等数目的。 图1.4.10f给出了连续状态下的模拟结果,即用到的是式1.4.1而不是式1.4.2,可以看出,当t趋于无穷大时,所有个体的意见基本相同。 北京林森科技培训材料www.anylogic-china.com
a.状态集合中包含的意见种类越多,最终个体间的意见越容易统一。 (a)2种意见 (b) 5种意见 (c) 10种意见 (d) 15 种意见 结论: a.状态集合中包含的意见种类越多,最终个体间的意见越容易统一。 b.而只有少数几种意见时,容易出现两极分化的结果。 (e) 30 种意见 (f) 连续的意见(无穷种意见) 北京林森科技培训材料www.anylogic-china.com (d) 意见的颜色编码
2)群体形成过程模拟 (1)问题 有两个不同种族人群,最初各个成员都无意地居住在某个区域的各处,在两类人群中,成员之间的价值观的取向(即一个成员对另一个成员的价值评判或看法)包括三种:正向、中立和负向(在模拟计算时,分别取值1、0、-1)。正向表示欣赏对方,负向表示敌视对方。当外部环境稳定时,大家都相安无事,各自都居住在原处。 但是,由于社会环境发生了变化,比如两个种群所属的国家发生了战争,成员之间的态度就发生改变了,一种是“隔离”态度(segregation attitude),另一种是“怀疑”态度(suspicion attitude),在这两种态度的驱使下,两类人群的成员们开始选择新的居住地了,表现为成员们不断地搬家。 我们在此介绍Sakoda运用元胞自动机,对搬家过程所做的如下工作: a. 模拟搬家过程; b. 分析搬家过程中的现象或规律。 北京林森科技培训材料www.anylogic-china.com
(2)建模 为了便于模拟,把正向、中立和负向的价值取向进行离散的量化处理,把它们称为“价” (Valences),用整数来表示,记为Vij 。 移动规则:个体i最终移动到 最大的元胞中其中,d表示个体i与j之间的距离,w表示随着距离的增加,价减少的百分比,从式中可以看出,w越大,距离的增加对价的减少的影响越小。 表1.4.1 两种态度条件下“价” 的取值 隔离 □ + 怀疑 1 -1 北京林森科技培训材料www.anylogic-china.com
模型建立在8×8的棋盘上,一共有两类群体,每类群体包括6个成员,一类群体的成员用“□”表示,另一类成员用“+”表示。两种态度条件下,成员之间的价值取向值如表1.4.1所示。 表1.4.1 两种态度条件下“价” 的取值 隔离 □ + 怀疑 1 -1 中立的价值取向 北京林森科技培训材料www.anylogic-china.com
(3)模拟与分析 图1.4.12显示了在隔离态度下,两类群体形成的动态过程。从最开始的随机分布到最终聚集在一起只花费了很短的时间。 图1.4.12 隔离态度下群体形成的过程 北京林森科技培训材料www.anylogic-china.com
图1.4.12显示的最终结果和我们预想的相同。但是在怀疑态度下,群体最终形成另一种情形,如图1.4.13所示。 图1.4.13 怀疑态度下群体形成的过程 北京林森科技培训材料www.anylogic-china.com
分析: 隔离态度( segregation attitude)下的模拟结果 怀疑态度( suspicion attitude)下的模拟结果 结论:当个体对另一群体持负向价值取向,且对自身所在的群体漠不关心(即中立)时,会比对自身所在群体持正向价值取向时表现出更明显的集群现象。 内部人员之间的价值取向为:中立 北京林森科技培训材料www.anylogic-china.com
为了验证这个结果,在更大范围的棋盘内进行实验:40×40的棋盘,两个群体各包含180个成员,分别用蓝色和红色来表示。 隔离态度 怀疑态度 结论:在隔离态度下,同一群体中的成员在移动的过程中,当碰到同一群体中的其他成员时,会在相遇点停止移动,并产生足够的影响力,使得他们能够在相遇点停留下来。而当成员对自身所在群体持中立价值取向时,同一群体的成员之间不会产生吸引力,所以这些成员的唯一目标是远离别的群体的成员,最后导致了同一群体的成员全部聚集在一起,并且远离另一个群体。 北京林森科技培训材料www.anylogic-china.com
本章作业 建立股票投资者行为演化的元胞自动机模型。 问题: 元胞:股票投资者; 元胞状态:买入、卖出、持有 局部规则:元胞状态受邻居状态、自身偏好、宏观政策的影响。其中,自身偏好:乐观型、保守型、悲观型;宏观政策:利好、利空。 北京林森科技培训材料www.anylogic-china.com