五子棋棋略的演化學習法.

Slides:

Advertisements

Similar presentations

第 4 章基于遗传算法的随机优化搜索 4.1 基本概念 4.2 基本遗传算法 4.3 遗传算法应用举例 4.4 遗传算法的特点与优势.

Advertisements

CH2: 微分學切 The definition of derivatives CH2: 微分學 Step1 ：

變數與函數大綱 : 對應關係函數函數值顧震宇台灣數位學習科技股份有限公司. 對應關係蛋餅飯糰土司漢堡咖啡奶茶 25 元 30 元 25 元 35 元 25 元 20 元顧震宇老師台灣數位學習科技股份有限公司變數與函數下表是早餐店價格表的一部分：蛋餅飯糰土司漢堡咖啡奶茶.

第一單元建立java 程式.

Author ： Hyesook Lim, Changhoon Yim, and Earl E. Swartzlander, Jr., Fellow Publisher ： IEEE TRANSACTIONS ON COMPUTERS, VOL. 59, NO. 6, JUNE 2010 Presenter.

Introduction to C Programming

巫山职教中心欢迎您.

樞紐分析與資料庫蕭世斌 Nov 20, 2010.

人工智慧 - 五子棋報告人：張任頡班級：碩研資工二甲.

08 CSS 基本語法 8-1 CSS 的演進 8-2 CSS 樣式規則與選擇器 8-3 連結HTML 文件與CSS 樣式表

陳維魁博士儒林圖書公司第九章資料抽象化陳維魁博士儒林圖書公司.

徐志摩与四大美女.

消防产品监督管理规定《消防产品监督管理规定》已经2012年4月10日公安部部长办公会议通过，并经国家工商行政管理总局、国家质量监督检验检疫总局同意，现予发布，自2013年1月1日起施行。 2013年3月17日.

Project 2 JMVC code tracing

Chapter 5 遞迴資料結構導論 - C語言實作.

Chapter 5 迴圈.

第六章智慧型的行銷資訊系統課程名稱行銷資訊系統進度第六章授課老師總時數 3小時線行銷資訊系統 – E世代的行銷管理.

DreamWeaver MX (II) 林偉川.

Visual C++ introduction

第12章樹狀搜尋結構（Search Trees）

JAVA程序设计第5章深入理解JAVA语言----补充.

2-1 接腳說明 2018/11/30 第2章系統分析.

SQL Stored Procedure SQL 預存程序.

(Circular Linked Lists)

Java 程式設計講師：FrankLin.

本章中將會更詳細地考慮有關重複的概念，並且會介紹for和do…while等兩種用來控制重複的敘述式。也將會介紹switch多重選擇敘述式。我們會討論直接和迅速離開某種控制敘述式的 break敘述式，以及用來跳過重複敘述式本體剩餘部份的continue敘述式。本章會討論用來組合控制條件的邏輯運算子，最後.

Chap3 Linked List 鏈結串列.

遗传算法（Genetic Algorithm） Natural Computing

樹 2 Michael Tsai 2013/3/26.

第一單元建立java 程式.

網頁程式設計本章投影片錄自HTML5、CSS3、RWD、jQuery Mobile跨裝網頁設計陳惠貞著碁峰資訊股份有限公司出版

資料結構優點缺點 1 陣列 (Array) 沒有額外變量 (例head, next,...) 運作/操作較簡單更新資料時，若要保持順序，需要移動較大量資料靜態結構Static (宣告時已決定了陣列元素多少，不能在程式執行期間增減元素) 2 隊列Queue (FIFO) 容易更新加入enqueue:

第一章直角坐標系 1-3　函數圖形.

第 19 章 XML記憶體執行模式.

Introduction to C Programming

指導老師：謝文魁老師組員：邱獻德蔡雅芳鐘筱嬿陳姿伶王彥婷

Definition of Trace Function

第一次Labview就上手參考書籍： LabVIEW for Everyone (Jeffrey Travis/Jim Kring)

CH05. 選擇敘述.

挑戰C++程式語言 ──第8章進一步談字元與字串

圓的定義在平面上，與一定點等距的所有點所形成的圖形稱為圓。定點稱為圓心，圓心至圓上任意一點的距離稱為半徑，「圓」指的是曲線部分的圖形，故圓心並不在圓上.

GridView操作 (II).

如何使用Gene Ontology 網址:

流程控制：Switch-Case 94學年度第一學期‧資訊教育東海大學物理系.

陣列與結構.

動畫演示 Node規範了一些基本的方法，像是增加節點、刪除節點、讓節點做一些事、取得第n個節點等等

影響計算準確度的關鍵因素基底函數.

實習八函式指標.

OMIM教學投影片網址: 點此下載.

第十一章基因演算法 (Genetic Algorithms)

Parasitics Extraction (PEX) 與 postsimulation(posim)

MultiThread Introduction

程式設計--Quick Sort 通訊一甲 B 楊穎穆.

第一章直角坐標系 1－3　函數及其圖形.

第四章陣列、指標與參考 4-1 物件陣列 4-2 使用物件指標 4-3 this指標 4-4 new 與 delete

作業系統實習課(二) -Scheduler-Related System Calls-

ABAP Basic Concept (2) 運算子控制式與迴圈 Subroutines Event Block

Array(陣列) Anny

SQLite資料庫靜宜大學資管系楊子青.

Chapter 4 Multi-Threads (多執行緒).

快取映射之直接對映計算整理.

Develop and Build Drives by Visual C++ IDE

JAVA 程式設計與資料結構第十七章 Tree.

方法(Method) 函數.

ABAP Basic Concept (2) 運算子控制式與迴圈 Subroutines Event Block

InputStreamReader Console Scanner

Presentation transcript:

五子棋棋略的演化學習法

五子棋策略搜尋樹(IF rule Tree) 1.文法定義與演化方式 Introduction 基本演算結構五子棋策略搜尋樹(IF rule Tree) 1.文法定義與演化方式 2.Weight的設定 3.基因函式庫 4.Crossover 五子棋策略搜尋樹(SWITCH tree) 演化完成後的去蕪存菁實驗數據

Introduction ◎母體大小（Population Size）利用基因演算法，建立一個能自我學習的五子棋程式建立系統後，更改以下基因演算法的控制參數，以期找到最佳設定 ◎母體大小（Population Size） ◎交配率（Crossover Rate） ◎突變率（Mutation Rate） ◎適應度函數（Fitness fumction）

基本演算結構棋盤資料結構：table [size] [size] 0:空位 X，＊：各代表其中一方的棋子評估棋型表：雙方各建立一張棋型表 int computer [size] [size] [4] 0:表直線 1：表橫線 2：表左斜 3：表右斜

例如 computer[4][6][0]=2 computer[4][6][1]=1 computer[4][6][2]=2 以上即表示在座標(4 ， 6)的點，在直方向有己方2子相連，橫方向有1己方子，左斜方向有己方3 子相連，右斜方向有己方2 子相連，但其末端有對方子阻擋，所以為負值。

五子棋策略搜尋樹(IF rule Tree) Definition of Functional argument：

Definition of Terminal node： SET_WEIGHT : 對棋盤上的一點設定weight L1 : 探測棋盤上一點的四個方向，存在1 個己方棋子的數目 L2 : 探測棋盤上一點的四個方向，存在2 相鄰己方棋子的數目 L3 : 探測棋盤上一點的四個方向，存在3 相鄰己方棋子的數目 L4 : 探測棋盤上一點的四個方向，存在4 相鄰己方棋子的數目 L5 : 探測棋盤上一點的四個方向，存在5 相鄰己方棋子的數目 D1 : 探測棋盤上一點的四個方向，存在1 相鄰己方棋子的數目(末端有對方的子阻擋) D2 : 探測棋盤上一點的四個方向，存在2 相鄰己方棋子的數目(末端有 D3 : 探測棋盤上一點的四個方向，存在3 相鄰己方棋子的數目(末端有對方的子阻擋) D4 : 探測棋盤上一點的四個方向，存在4 相鄰己方棋子的數目(末端有 D5 : 探測棋盤上一點的四個方向，存在5 相鄰己方棋子的數目(末端有

IF rule tree 演化方式：

Gene node 的節構定義： class Gene { int symbolic; int type; // function or terminal Gene* child; //只有function node 才有child Gene* next; // child->next 便是其第2 個子結點 . . . . }

Weight值設定： 3 維陣列構成了五子棋的基本資料骨架，之後再加入一些輔助評估的weight變數便可以處裡各種棋盤的局勢!!! 。

Integer weight[size][size] //initial all value in array to 0 for( I = 0 to size-1 ) { for( J = 0 to size-1) for( K = 0 to 4) switch(computer[I][J][K]) case 1 weight[I][J]+10 case 2 weight[I][J]+15 case 3 weight[I][J]+40 case 4 weight[I][J]+20000 case -1 weight[I][J]+5 case -2 weight[I][J]+10 case -3 weight[I][J]+35 case -4 weight[I][J]+20000

基因函式庫：利用偵測無用或多餘的sub espression避免演化後的expression 數量過大造成使用過多的記憶體用量和執行效率減低。將每個subtree 中加入一個記數變數，變數值初設為0，每當各subtree 若被走到時，記數值則加1，並儲存在TABLE裡，如下圖所示

將之前記錄的TABLE表中依rank 的前百分比取出前幾個來放入此函式庫，而存放的內容是只存各 subtree 的condition-expression。函式庫的內容可供特殊crossover 時引用，而引用時依照被插接樹將被插接處的深度之深淺參考到基因函式庫的排序範圍來引用，也就是說深度越淺的引用基因函式庫排越前面的，即平均使用次數越多的。

1.選出要被crossover的個體，在個體中選出點 2.依照該點在樹中的depth來印射到基因函式庫的特定範圍 3.在此範圍中隨機選擇一個函式來插接到該點 4.範圍印射方法如下 D：要被crossover的個體之深度 d：被選中要cross 之點的深度 N：基因函式庫的大小 R：（r-%, r+%），印射到的範圍 r-=[(d/D)*100]-5, r-≧0低於0，以0計 r+=[(d/D)*100]+5,r+≦100，超過100，以100計

五子棋策略搜尋樹(SWITCH tree) a.GA 染色體的內容染色體內放置許多五子棋的棋型，一個棋型代表一個基因，而染色體中基因的排序便可視為棋型重要度的排列。 b.五子棋GA 的演化由於染色體中基因的排序是為棋型重要度的排列，故調整染色體中基因的排序，便是對棋型重要度的再排序。而GA 經由演化時不斷排列染色體中基因的序列，意即棋型重要地位不斷地排列，最後得到一個最好策略性的棋型排列順序。 c.五子棋策略學習讓每個在染色體內的棋型擁有一個weight 值,棋型重要度越高其weight 值亦越高，當此套策略輸棋或贏棋時，GA 會對所用過的棋型之weight 的增加或減少，如此便可造成染色體內的棋型順序重新排列。當輸棋時將對手最後幾步的下子點之棋型weight 增加,則相對應的棋型重要度便上升,GA 便從對手學習到棋型間相對的重要性。

各operator 的詳細說明： (1) SWITCH : SWITCH operator 的參數個數沒有限制，第一個參數接SELECTION operator，而之後的參數接CASE operators。 (2)CASE : CASE operator 有兩個參數，第一個SELECTION，第二個為SETWEIGHT，而CASE operator 會將SELECTION 的內容與其父SWITCH operator 所接的SELECTION 內容作比較，如果內容相符，便執行其SETWEIGHT。 (3) CASE_CONDITION : 內容型態與SELECTION 相同，CASE operator 會將其與SELECTION 作比較。 (4) SETWEIGHT :此terminal node 為設定參考weight。

(5) SELECTION : 此terminal node 內放置一組集合，內容來自於對棋盤上之點的偵測，此集合是供CASE condition 來判斷。格式如下： {橫，直，左斜，右斜}{2，＊3，1，0} 這個空點的橫方向有2 個連續點，＊3 則表示直方向有3 子相連，但其兩末端皆有他子阻擋。順序問題： {2，2，1，0} 是否等於{0，1，2，2}

(5) SELECTION : 此terminal node 內放置一組集合，內容來自於對棋盤上之點的偵測，此集合是供CASE condition 來判斷。格式如下： {橫，直，左斜，右斜}{2，＊3，1，0} 這個空點的橫方向有2 個連續點，＊3 則表示直方向有3 子相連，但其兩末端皆有他子阻擋。順序問題： {2，2，1，0} {0，1，2，2} 順時針轉45度

SELECTION operator 加入”不介意值” 我們希望加入一個偵測符號,其目的在於: 1.希望提高演化學者效能 2.縮小CASE operators 的數量在棋型資料上另外加入一個”不介意值”,即是可表示各種棋型,如以下棋型: { 2 , ＊ , -1 , 1 } , { 1 , 4, ＊ , ＊} “＊“符號可代表所有範圍內的元素

個體（individual）的fitness評斷方式輸的時候: 1. 一個走15 步與一個走7 步皆輸的兩個GP，較快輸的則判定為較差。 2. 將其fitness 值直接設定為其走的棋步數。贏的時候: 1. 一個走12 步與一個走19 步皆贏的兩個GP，較快贏的則判定較優。將其fitness 設為[ 2 倍的棋盤大下 – 步數 ] 。

fitness 值的計算方式如下: INTEGER size : (size * size)為棋盤大小 INTEGER W : 當局棋步總數 BOOLEAN R : 結果是輸或贏 IF( R is Win) { Fitness= [ 2 * ( size * size) – W ] } ELSE Fitness = W

GA Crossover: 1.在population 中隨機選擇兩個GP 2.比較兩者的fitness 高低，低的一方將接受改變 3.在雙方中隨機選取一點，高的一方以其選之點之前(左)截斷 4.將之插入低的一方所選之點之前如以下圖例：

Crossover 修正： crossover 完後必須偵測子GP，將相同的地方去除，還有weight 的排列順序也已經改變，故必須將之重新排序

建立基因函式庫：各individual GP 中有被使用過的CASE 都會被作一個記號，有被使用過的CASE 都會被匯集起來作整理之後送到基因函式庫中存放，但是僅取前30%。依照GP的fitness值大小，將排序好的CASE放入基因函式庫中，但是並非依序排入，在此以跳格的方式置入函式庫，以此種跳格的方式，可以盡量讓CASE的地位能得到較合理的位置，如以下所示。

遇到CASE CONDITION重複時（第二代）基因函式庫的內容修正：遇到CASE CONDITION重複時（第二代） CASE記錄為LOSE：則扣掉一些WEIGHT CASE記錄為WIN：則加上一些WEIGH 若間隔值 >>weight CASE升降緩慢若間隔值 <<weight CASE升降快速

增加一個暫存對手棋步的紀錄器（最後3步棋），若GA輸了可以對基因函式庫做高額的量的加權，以免GA重蹈覆轍。

演化完成後的去蕪存菁簡化後的好處: 1. 可節省記憶體的儲存空間。 2. 讓下次需要再演化時，效率比之前快。 3. 演化出來的規則，更淺顯易懂。

簡化tree 中多餘的分枝或可合併的分枝何謂多餘的分枝之定義: a. 永遠不會被走到的subtree。 b. 對整棵樹之fitness 不會有影響之subtree。

何謂可合併的分枝之定義: a. condition-expression 相同的subtree 可合併為一枝，其weight 值相加。 b. condition-expression 與子結點的condition- expression 有呼叫相同的terminal node

實驗數據