问题求解基本原理 搜 索 技 术 ( 三 ) 博 弈 搜 索 博 弈:被认为高智能行为游戏; 不断为AI研究提出新课题,推动AI研究的发展。

Slides:



Advertisements
Similar presentations
做中国梦 走特色路 —— 宁波电大业余党校时政课 林志标 四川雅安地震 2013 年 4 月 20 日 8 时 02 分四川省雅安市芦山县(北纬 30.3, 东 经 )发生 7.0 级地震。震源深度 13 公里。震中距成都约 100 公里。成都、重庆及陕西的宝鸡、汉中、安康等地均有较.
Advertisements

製作人 : 鍾沐昀. 目錄 ★緣起 1.H1N1 是什麼東西? 2. H1N1 病毒是接觸傳染嗎? 3. 人類感染 H1N1 的症狀 4. H1N1 病毒如何傳染? 5. 我要怎麼做才能避免流感 ? 6. H1N1 病人的傳染力道持續多久 ? 7. 那些地方最有可能成為有 H1N1 病毒來源? 8.
手工加工全框眼镜技术 前调整确定加工基准制作模板割边 磨边磨安全角 (抛光) 装配 后调整检测.
海南省疾病预防控制中心. (一)基本情况  工作用房面积: ㎡,其中实验室使用面积为 6500 ㎡  中心定编 213 人,其中全额预算编制 193 人,自筹编制 20 人  现有在职职工 320 名,其中专业技术人员占 84.3% 。 人性化的办公场所实验室区域 一、海南省疾病预防控制中心概况.
融资融券业务的保证金与保证金比例 光大证券 · 信用业务管理总部 2015 年 12 月 ★融资融券业务投资者教育活动材料★
道家養生保健長壽藥膳 藥膳應用原則: 天人相應,道法自然 藥膳有兩個職能: 一是保健增壽,一是治療疾病。 ◎ 黃蕙棻.
H7N9 禽流感. H7N9 流感确诊病例主要表现 1 、起病急; 2 、病程早期均有高热 (38 ℃以上 ) ,伴咳嗽等呼 吸道感染症状,起病 5-7 天出现呼吸困难; 3 、典 型的病毒性肺炎,重症肺炎并进行性加重,部分 病例可迅速发展为急性呼吸窘迫综合症并死亡。
《公路纵断面设计》 —— 纵断面设计的要求 道桥系 二○○七年五月. 纵断面设计的一般要求 1 .纵坡设计必须满足《公路工程技术标准》中的各项规定。 2 .为保证汽车能以一定的车速安全舒顺地行驶,纵坡应具有 — 定 的平顺性,起伏不宜过大及过于频繁。尽量避免采用极限纵坡 值.缓和坡段应自然地配合地形设置,在连续采用极限长度的.
第二节 脉搏的评估及异 常时的护理. 教学目标  1 、解释有关名词  2 、说出脉搏、呼吸的正常值  3 、叙述脉搏、呼吸的测量方法;识别脉搏、 呼吸的异常变化  4 、叙述测量脉搏、呼吸的注意事项  5 、正确记录脉搏、呼吸,做到认真负责,实 事求是。
人感染H7N9禽流感医院感染 预防与控制技术指南
传染病预检分诊工作要求 发热门诊管理要求.
项目四、腻子的施工  一、准备工作  二、安全与卫生  三、板件表面的处理  四、准备腻子  五、刮腻子  六、腻子的干燥  七、腻子的打磨  结束.
窦娥冤 关汉卿 感天动地 元·关汉卿.
冷 热 疗 法.
報告書名:父母會傷人 班級:二技幼四甲 姓名:吳婉如 學號:1A2I0034 指導老師:高家斌
個人理財規劃 第八章 投資規劃.
保育员工作职责.
开天门 梅州市中医医院 郑雪辉.
小儿斜颈的诊断与治疗.
做好学校甲型H1N1流感防控工作 确保师生身体健康
H7N9禽流感相关知识
歡迎各位111 家長 111 開學花絮 (相見歡) (小一新鮮人) 2. 班親會組織 3. 老師簡介 4. 班級經營理念說明.
政府採購法規概要 報告人:杜國正 行政院公共工程委員會企劃處.
甘肃4班面试专项练习4 应急应变 主讲: 凌宇 时间:6月3日.
中式面点技艺 长春市商业职业技术学校 王成贵 中式面点技艺 长春市商业职业技术学校 授课教师: 王 成 贵.
北京中医药大学东直门医院 把握“癌”的命脉 祁烁 血液肿瘤科.
媽,我們真的不一樣 青少年期與中年期 老師: 趙品淳老師 組員: 胡珮玟4A1I0006 馬菀謙4A1I0040
只要大家共同努力,禽流感是可以預防的疾病。
菏泽市初中历史水平考试备考研讨与交流 菏泽市教研室 张红霞.
消防安全知识讲座 ---校园防火与逃生 保卫科.
知其不可而为之.
中国画家协会理事、安徽省美术家协会会员、 工艺美术师、黄山市邮协常务理事余承平主讲
之 魔 析 妖 鬼 解 怪 大 沈家仪小组出品.
歡迎蒞臨 三年八班大家族 導師:陳冠諠老師 16個帥氣寶貝 16個漂亮寶貝.
第三章 儿童少年、女子及 中老年的体育卫生 第一节 儿童少年的体育卫生
班級:二幼三甲 姓名:郭小瑄 、 詹淑評 學號:1A2I0029 、1A2I0025
人力資源管理委員會 主席:魏麗香部長 執秘:董家檥督導 委員:林姿伶HN、黃士豪HN、潘秋華HN 林素琴專師組長、卓惠瑄、張維恩、王孟萱、
第五組 幼兒安全與衛生教育 組員: 譚郁馨 張喻晴 沈恩華
学生学业水平诊断与提升策略探究 平阳中学 周秀丽.
征服火灾是全社会的事业,它需要科技的进步,需要消防监督,也需要消防科学知识的普及和提高。通过各类的消防安全培训,从而使人们更好的掌握消防常识和了解消防法规,提高消防安全意识,提高自防自救能力,使我们的生产和生活远离火灾的侵袭。
指導老師:陳韻如 姓名:吳宜珊 學號:4A0I0911 班級:幼保二乙
汉字的构造.
诵读欣赏 古代诗词三首.
足球運動情報蒐集與分析 趙榮瑞 教授.
講師:賴玉珊 心理師 證照:諮商心理師(諮心字第001495號) 學歷:國立台南大學諮商與輔導研究所 畢 現任:長榮大學諮商中心專任心理師
国家和我省禽业发展政策 和扶持项目解读 安徽省畜牧兽医局
二、汽化和液化.
10.2 分子动理论的初步知识 蒙城县乐土中学 袁亮.
工 程 力 学 主讲教师:李林安.
复习: 一、细胞膜的成分 1、脂质 2、蛋白质 3、糖类 二、生物膜的功能: 1、界膜 2、控制物质的进出 3、进行细胞间信息交流.
第九章 长期资产及摊销 2017/3/21.
傳統童玩遊戲創新 組別:第八組 班級:幼保二甲 組員: 4A0I0005柯舒涵 4A0I0011謝孟真
《中华人民共和国传染病防治法》部分知识 河西区卫生局.
第1节人体内物质的运输 人体的组织细胞每时每刻都需要营养物质和氧,并不断产生二氧化碳、尿素等废物。这些物质在人体内运输主要依靠 系统。人体的血液循环系统由 、 和 组成。 血液循环 血管 心脏 血液.
建議題.
甲型H1N1流感预防常识 北仑区疾病预防控制中心.
第3节 以水为主要传热介质 的烹调方法.
贴近教学 服务师生 方便老师.
六年级 语文 下册 第四单元 指尖的世界.
(浙教版)四年级品德与社会下册 共同生活的世界 第四单元 世界之窗 第二课时.
第一章 汽车的解体与清洗 第一节 汽车解体工艺 一、零件的拆卸原则 1、拆卸前应熟悉被拆总成的结构
人的认识从何而来 授课人: 刘 丽 珍.
高效能太陽能車 指導老師: 蔡志成,王國禎 教授 組員 張友倫( ) 溫承豫( ) 李志健( )
網路遊戲版 幸福農場168號.
評分標準.
Xián 伯 牙 绝 弦 安徽淮南市八公山区第二小学 陈燕朵.
基底压力和基底附加压力 基底压力(接触压力) (Pressure of foundation) 基础向地基传递荷载时,基底与地基
認識H1N1 盧亞人醫院 感控護士 劉秀屏.
新高中通識教育科課堂的 教學規劃和應試訓練
認識﹋禽流感*.
Presentation transcript:

问题求解基本原理 搜 索 技 术 ( 三 ) 博 弈 搜 索 博 弈:被认为高智能行为游戏; 不断为AI研究提出新课题,推动AI研究的发展。

基于博弈搜索的搜索策略 博弈问题及博弈树概念 博弈搜索控制策略 博弈搜索算法及其应用实例 博弈树的 α - β 剪枝

博弈问题及博弈树概念 博弈问题: 双人完备信息: 对抗的双方参加博弈,取胜的因素不仅取决于一方的如意算盘,还需充分考虑对方的应付策略,(一字棋、国际象棋、打扑克、中国象棋、围棋)。 双人完备信息: 对垒的双方轮流走步,对弈的条件和走步规则完全相同。每一方不仅知道对方已走过的所有棋步,而且还能估计出对方未来可能走的棋步。

博弈问题及博弈树概念 博弈问题求解: 博弈问题描述: 棋局描述; 棋局走步规则。 博弈搜索过程: 搜索棋局走步规则,隐含生成一棵特殊的与或树

博弈问题及博弈树概念 或节点 与节点 完全取胜解 图 甲走步 或节点 从甲的立场出发 与或节点分层交替出现的与或树

博弈问题及博弈树概念 判断走步的极小-极大原则: 考虑对方走步时(与节点):假定对手不会犯错误,他总是选择对自己最有利,对我方最不利的棋步走。因此,我方不能采取任何冒险行动,视对手将走出的棋局为极小值;  考虑我方走步时(或节点):应在对方造成的最坏的局势中尽可能地选择最好的棋着走,视自己可能走出的棋局为极大值。

基于博弈搜索的搜索策略 博弈问题及博弈树 博弈搜索控制策略 博弈搜索算法及其应用实例 博弈树的 α - β 剪枝 完整的博弈搜索策略(盲目搜索策略) 有界深度博弈搜索策略

完整的博弈搜索策略 核心思想: 从博弈的初始格局开始,轮番考虑自己与对方可能的所有走步,生成出棋局的各个格局,直到达到分出胜负输赢的终止格局为止,此搜索过程产生的一棵完整的博弈树。

完整的博弈搜索策略 走步规则: 分堆格局(状态): (x1,x2,…,xn,M), 其中, 博弈问题实例: 博弈问题描述: xi: 第 i 堆钱币的个数; M: 当前走步人编号 -(MAX, MIN) 走步规则: IF (x1,x2,…,xn,M) ∧ (xi = Y+Z) ∧ (Y ≠ Z) THEN (x1,x2,…,xi-1, Y, Z, xi+1, …, xn,  M)

完整的博弈搜索策略 与节点 完全取胜的完备策略 或节点 与节点 站在MAX立场

完整的博弈搜索策略 特点: 例,中国象棋: 有必要引入有界深度博弈搜索策略。 搜索策略简单,易于控制,可用于简单的博弈或一个复杂博弈的残局; 不适合复杂的博弈问题搜索 - 指数爆炸。 例,中国象棋: 设每种格局有40种走法,一盘棋双方平均走50步, 完整的博弈搜索 - 搜索节点数(402)50 ≈ 10160,搜索深度达100层。 有必要引入有界深度博弈搜索策略。

基于博弈搜索的搜索策略 博弈问题及博弈树 博弈搜索控制策略 完整的博弈搜索策略(盲目搜索策略) 有界深度博弈搜索策略(启发式搜索策略)

有界深度搜索策略 核心思想: 需解决的关键问题: 根据对方已走出的棋步,构造出具有一定深度的博弈树,并从此局部博弈树中选择相对好的棋着走。 定义估计终结棋局优劣的评价函数; 给出棋局优劣性传递的计算方法。

定义棋局的评价函数 设 P 为有界博弈树中棋局;h(P): 棋局P优劣的评价函数。 h(P)MAX赢 = h(P)MIN输 = +∞ 例1:从当前棋局到离我方最后取胜的差距: 胜利在望 – h(P)值较大,败局显露 – h(P)值较小; 例2:从当前棋局到到某个明显有利于我方棋局的差距: 吃掉对方一子, 或者 “叫吃”。

计算棋局的评价函数 有界博弈树中任一棋局(节点P)评价函数值的计算: 对于终叶节点P:赋静态评价函数值h(P);

基于极小-极大原则的评价函数计算实例 站在MAX立场 动态评价函数值 静态启发式评价函数值

基于博弈搜索的搜索策略 博弈问题及博弈树 博弈搜索控制策略 有界深度搜索算法及其应用实例 博弈树的 α - β 剪枝

有界深度搜索算法及其应用实例 针对当前对方给出的棋局 s : 1、按宽度优先法自上而下地生成规定深度的博弈树; 2、为有界深度博弈树的所有叶节点赋静态评价函数估计值 3、根据极小-极大走步原则自下而上地逐级计算各非终叶节点的动态评价函数估计值,直至求到起始节点的评价函数值 h(s)为止。 比较我方可走的各棋局的评价函数估计值,从中选择最好的棋步走。 再根据对方走出的棋局 s,重复上述过程。

有界深度搜索算法及其应用实例 一字棋(站在MAX的立场) 定义特殊棋局估计函数h1(P) h1(P)MAX赢 = +∞

有界深度搜索算法及其应用实例 一字棋(站在MAX的立场) 定义棋局评价函数: 将整行、整列或整条对角线称为赢线。如果一条赢线上只有MAX(MIN)方的棋子或为空,而没有MIN(MAX)方的棋子,则称此赢线称为MAX(MIN)方的赢线。  设MAX方任意棋局的静态评价函数 h1(P) : h1(P) = MAX的赢线数 – MIN的赢线数 h(p)MAX = 6 – 4 = 2 h(p)MIN = 4 – 6 = - 2

有界深度搜索算法及其应用实例 MAX走棋第一步( 深度为2 ): MAX走步

有界深度搜索算法及其应用实例 MAX走棋第二步: MAX走棋第三步: MAX走步 MAX走步

基于博弈搜索的搜索策略 问题: 启发式博弈搜索策略 - 将扩展生成博弈树的过程与计算、评价及确定最优走步的过程完全分开进行,导致了搜索效率的低下。 对策: α - β剪枝技术 - 在生成博弈树同时计算和评价棋局节点,对不必要展开的节点进行剪枝,可减少许多不必要节点的生成和计算工作量,提高搜索效率。

基于博弈搜索的搜索策略 博弈问题及博弈树 博弈搜索控制策略 有界深度搜索算法及其应用实例 博弈树的 α - β 剪枝

博弈树的 α - β 剪枝 h(3) ≤ 17 h(3)  25

博弈树的α - β 剪枝 n n1 α 值: 设博弈树中某节点 n 属于极大层。它左边第一个子节点 n1的评价函数值 h(n1)可视为节点 n 的下界值,或称为 α 值,节点 n 的评价函数值 h(n)决不会小于此 α 值。 n 的α值

博弈树的α - β 剪枝 n n1 β 值: 设博弈树中某节点 n 属于极小层。它左边第一个子节点 n1的评价函数值 h(n1)可视为节点 n 的上界值,或称为 β 值,节点 n 的 h(n)决不会大于此 β 值。 n 的β值

博弈树的α - β 剪枝 α剪枝: 若任一极小层节点 m 的 β 值小于或等于其位于极大层的父节点的 α 值,即 α  β,则可终止该极小层中节点 m 以下的搜索过程。 m α值 β值

博弈树的 α - β 剪枝 m β 剪枝: 若任一极大层节点 m 的 α 值大于或等于其位于极小层的父节点的 β 值,即 α  β,则可终止该极大层中节点 m 以下的搜索过程。 β值 α值

进一步研究技术: 博弈子树改变排列顺序时,α - β 剪枝可能无计可施。 对弈双方不大可能使用同一个棋局估计函数。 静态评价函数并非绝对可靠。一旦某个节点发生误差,由于无法动态调整误差,则此误差将会通过极大-极小计算原则向上传播,导致决策的失误。 在有界深度搜索的全过程中,将深度固定不尽合理。有时暂时的局部的放弃可能导致全面的重大胜利。 呆板的自下而上的计算估计值方法,难于体现对弈弈手的灵活的作战意图,如声东击西、诱敌深入等。

作 业

博弈搜索作业: 设局部博弈树如图所示,其中,方格表示‘或’节点属极大层,圆圈表示‘与’节点属极小层,叶节点下面的数字为静态评价函数值 h,请在图上标出: 1. 对博弈树进行的必要的α或β剪枝(要求标出剪去的分枝以及剪枝采用的技术类型); 2. 按极小极大原则计算的非叶节点的函数估计值; 3. 确定1最终走出的棋步。 1 2 3 4 5 6 7 10 11 8 9 30 21 73 91 43