106.5.22 古佳怡 AI 人工智慧.

Slides:



Advertisements
Similar presentations
简单迭代法的概念与结论 简单迭代法又称逐次迭代法,基本思想是构造不动点 方程,以求得近似根。即由方程 f(x)=0 变换为 x=  (x), 然后建立迭代格式, 返回下一页 则称迭代格式 收敛, 否则称为发散 上一页.
Advertisements

中医护理 —— 鱼腥草 护理 1334 班 小组成员:郭丽丹 43 杨专 39 张建 35 李晓敏 27 陈燕红 25 张良州 8 分工合作: 收集整理 43 郭丽丹 35 张建 27 李晓敏 讲解 39 杨专 25 陈燕红 8 张良洲.
§ 4.3 功能模拟方法和黑箱方法 萧振高级中学 廖海平. 回顾与导入 前言:控制的应用 自古就有,并在近 代得到迅速发展, 在社会生产生活的 各个领域都有极其 广泛的应用。
第三节 排气护理. 一、肠胀气病人的护理 肠胀气是指胃肠道内有过多的气体积聚,不能 排出。 1. 心理护理 2. 适当活动 3. 必要时遵医嘱给药或行肛管排气 4. 健康教育.
第四章 基础护理操作技术 中 国 医 科 大 学朱 闻 溪中 国 医 科 大 学朱 闻 溪 中 国 医 科 大 学朱 闻 溪中 国 医 科 大 学朱 闻 溪.
數概念 國立台南大學應用數學系 謝 堅. 昨天晚上,小明夢見天上 只剩下      顆星星! 早上醒來已經看不見星星 如何溝通昨晚看到星星的個數?
湖南省长沙市第一中学 黄旭华. 开心辞典 1 、现在美国国旗星条旗上有多少颗星 ? 2 、英国绅士为什么总要手提一把雨伞,为什么? 3 、北极的气温比南极的气温高吗? 4 、企鹅是否可以生活在赤道附近? 5 、 “ 沪宁杭 ” 地区的 “ 宁 ” 是指哪座城市? 6 、 “ 七月流火 ” 指天气发生了什么变化?
口試準備及口語表達技巧 民國 98 年 2 月 26 日 12:00pm 國立三重高中 陸芳瑜老師 1.
《公路纵断面设计》 —— 纵断面设计的要求 道桥系 二○○七年五月. 纵断面设计的一般要求 1 .纵坡设计必须满足《公路工程技术标准》中的各项规定。 2 .为保证汽车能以一定的车速安全舒顺地行驶,纵坡应具有 — 定 的平顺性,起伏不宜过大及过于频繁。尽量避免采用极限纵坡 值.缓和坡段应自然地配合地形设置,在连续采用极限长度的.
图说 毕业生档案 学生工作部 2016 年 5 月. 毕业生档案 毕业前 文字记载 书面材料 家庭情况政治思想 身体状况学习成绩 高校毕业前文字记载的书面材料 用人单位选拔、聘用毕业生的重 要人事依据 工作后人事档案的基础和雏形 什么是毕业生档案?
人工智能 吉林大学珠海学院计算机科学与技术系 2.1 与或图 (AND/OR Graph) 的搜索 为严格描述 AND/OR 图,我们先推广弧的概念。在 有向图中的弧是从一个父亲节点指向它的儿子节 点的。 在 AND/OR 图中使用的弧叫做超弧,一个 超弧可以把一个父亲节点和 k 个儿子节点同时连接.
客家娘酒 生命科学院 062 第二组 组长:李宗权 组员:林立强 李嘉豪 郑灿明 李耀斌 程惠源.
营养俱乐部零售 & 接待客人技巧详解. 成功销售的必要条件 自信心 (自信来自专业,有自信才有气势) 得宜的穿着打扮 (必要的化妆) 注意坐的位置及环境 工具备妥当 (秤,相片簿,细心关怀表,量尺 … ) 足够的产品.
山西职业技术学院 蒋晋红.
南宁市中小学生学籍信息化管理系统 用户培训手册
肺癌放疗新概念: 瘤根靶向放疗 北京大学临床肿瘤学院 北京肿瘤医院放疗科.
专利技术交底书的撰写方法 ——公司知识产权讲座
報告書名:父母會傷人 班級:二技幼四甲 姓名:吳婉如 學號:1A2I0034 指導老師:高家斌
无锡商业职业技术学院 机电工程学院党总支孙蓓雄
学校特色建设与教师专业发展 上海市第八中学 卢起升 2014年12月.
2016年全国中级会计资格考试 经济法 主讲老师:葛江静.
南京市中等职业学校 2013级人才培养方案 编制说明.
中医美容保健.
態度與態度改變 授課老師:林東龍 授課日期:2005/10/28.
Svm基本知识与原理 张立新.
第7章 隔离技术 厦门医学高等专科学校 基础护理教研室.
生活护理技术 项目一 医院感染的预防与控制 项目二 排泄护理技术 项目三 促进呼吸功能护理 项目一 冷热疗法 项目二 标本采集 项目三
全面了解入党程序 认真履行入党手续 第一讲 主讲人:陈亭而.
中共湖北大学知行学院委员会党校 入党材料规范填写指导 学工处 李华琼 二〇一三年十二月.
云南财经大学2010年党员发展培训—— 党员发展工作培训 校党委组织部 2010年9月17日.
An Introduction to Applied AI
甜甜圈 90221高渝晴.
媽,我們真的不一樣 青少年期與中年期 老師: 趙品淳老師 組員: 胡珮玟4A1I0006 馬菀謙4A1I0040
之 魔 析 妖 鬼 解 怪 大 沈家仪小组出品.
股 指 期 货 的 应 用 1.
努力做好新常态下 反映社情民意信息工作 省政协研究室 欧阳东 2016年5月31日.
班級:二幼三甲 姓名:郭小瑄 、 詹淑評 學號:1A2I0029 、1A2I0025
教育部補助計畫經費動支應行注意事項 報告單位:主 計 室 104年10月.
(讲座幻灯课件请在网上下载,让我们一起思考!)
第一节 舞蹈的概念 第二节 舞蹈基本知识 第三节 舞蹈动作成套欣赏 第四节 舞蹈的编排 学习思考题 推荐书目及网站
12年國教前哨站 談適性輔導及免試入學 12年國教前哨站 談適性輔導及免試入學 主講人:龍門國中王意蘭 校長 輔導主任 潘姿伶.
指導老師:陳韻如 姓名:吳宜珊 學號:4A0I0911 班級:幼保二乙
我 自我介绍 我爱看的 书 名片 格言.
农事学实践教程 主讲:XXXX 作物繁种技术.
第八章 诉讼法 第一节 诉讼法概述 第二节 民事诉讼法 第三节 行政诉讼法 第四节 刑事诉讼法.
第七章 紋理描述與分類.
投手丘上的勇者 王建民 導讀者:黃柏涵.
粪 便 检 查 主讲老师:沈萍.
四种命题 班级:C274 指导教师:钟志勤 任课教师:颜小娟.
傳統童玩遊戲創新 組別:第八組 班級:幼保二甲 組員: 4A0I0005柯舒涵 4A0I0011謝孟真
誰的電話永遠沒人接 您播(凌波)的 電話號碼是空號.
普及纳米知识 推动科技进步.
盆腔炎的护理 梅剑娟.
现代教师的职业素养与职业理想 程红兵.
第二章 信息的获取 2.1 获取信息的过程与方法.
通 知 通知是批转下级机关的公文,转发上级机关和不相隶属机关的公文,传达要求下级机关办理和需要有关单位周知或执行的事项,任免人员时使用的公文。
2017年乘务人员绩效考核办法 修订内容介绍 东航客舱部业务管理部.
網路遊戲版 幸福農場168號.
107年度 主計業務宣導及教育訓練 報告人:主計室賴美燕組長
教育部補助計畫經費動支應行注意事項 報告單位:主 計 室 107年11月6日.
PBL的核心目標與實例分享 國立台南大學 蔣佳玲.
第十一章 應付公司債與長期應付票據 11-1 公司債之性質及分類 11-2 應付公司債之會計處理 11-3 分期還本公司債
教學輔導教師 認證資料繳交說明 認證申請期間:108年4月10日至108年6月30日 請教師自行確認符合各項取證資格再行送件.
教育處資訊服務入口 功能簡介.
2015年雪佛兰经销商7-8月夏季市场活动激励政策 执行手册及模板
床上洗头.
数据挖掘导论 福建医科大学 郑伟成.
構想審查簡報說明(1/8) 經濟部技術處 AI on chip 研發補助計畫 構想審查簡報 XXXX計畫 申請公司名稱
8的乘法口诀 导入 新授 练习.
Presentation transcript:

106.5.22 古佳怡 AI 人工智慧

大綱 2 概論 流程 KNN SVM MINMAX 類神經網路 玩些AI小玩意 跑跑看兩種AI小實驗 使用兩種不同作法 來實作下棋AI

大綱 3 概論 流程 KNN SVM MINMAX 類神經網路

AI是什麼? 4 訂立好規則或數學模型後,讓電腦能夠根據所輸入的資料(模仿人類)輸出判斷後的結果 貓 AI就像個黑盒子

早期AI 5 困境: 總有特例,列出的 條件很難盡善盡美 貓 …貓? 而且和人的思考 好像有所差距…? …不是貓?

想想人的思考方式 6 想想遇到新事物的時候,人是怎麼學習的? 是水豚 不是水豚 是水豚

現今AI 貓 貓 不是貓 藉由已經標好答案的資料,讓機器自行學習規則(machine learning) 7 藉由已經標好答案的資料,讓機器自行學習規則(machine learning) 貓 不是貓 當有新資料進來的時候,猜測可能的答案 貓

以時間軸來說 8 AlphaGo

學習方法(黑盒子)一樣,差別在於輸入和輸出什麼 只要訂好要怎麼從資料學習,那麼 9 貓 圖形辨識 貓 語音辨識 貓 一種毛茸茸的生物 自然語言 資料探勘 學習方法(黑盒子)一樣,差別在於輸入和輸出什麼 推薦可能感興趣的電影

當然也可以是 10 第一手5之五 第二手天元 也就是一個遊戲AI

黑盒子裡到底長什麼樣子? 根據不同的機器學習方法,又可以分為 Machine Learning 近十年主流 最簡單、直覺的ML之一 11 根據不同的機器學習方法,又可以分為 Machine Learning 近十年主流 吳恩達(英語:Andrew Ng,1976年-)是史丹福大學計算機科學系的副教授,同時也是人工智慧實驗室的主任。 2011年,吳恩達在Google創建了Google Brain項目,以開發超大規模的人工神經網絡。2014年5月16日,吳恩達加入百度,負責「百度大腦」計劃,並擔任百度公司首席科學家。2017年3月20日,吳恩達宣布從百度辭職。 最簡單、直覺的ML之一 KNN Google主推(AlphaGo)

休息一下,玩些小玩意 自動畫圖 畫圖 遊戲 圖片翻譯 鋼琴合奏 12 自動畫圖 畫圖 遊戲 圖片翻譯 鋼琴合奏 Google的AI實驗室 https://aiexperiments.withgoogle.com/

休息一下,玩些小玩意 13 圖片分析 訓練自己的分類器 內容 臉部 情緒

休息一下,玩些小玩意 14 文字分析 錯字修正 斷句修正

休息一下,玩些小玩意 在過程中,你有沒有發現什麼? 語音合成 聲紋辨識 語音辨識 15 語音合成 聲紋辨識 語音辨識 在過程中,你有沒有發現什麼? 請嘗試回答以下問題,並撰寫為不超過一面A4的報告(.pdf): (1) 請列舉一個成功例子,並分析原因 (2) 請列舉一個失敗例子,並分析原因 (3) 有沒有哪些技術已經應用到日常?

大綱 16 概論 流程 KNN SVM MINMAX 類神經網路

流程更詳細的說 像個黑盒子 訓練資料 抽取特徵 測試資料 抽取特徵 Model 猜測答案 training data (已經知道答案的) 17 訓練資料 training data (已經知道答案的) 抽取特徵 抽取方式必須相同 測試資料 抽取特徵 Model 猜測答案 testing data (還不知道答案的) 像個黑盒子

首先你需要有資料 dataset 18 訓練資料 抽取特徵 測試資料 抽取特徵 Model 猜測答案

資料從哪來? 網 路資源 dataset https://archive.ics.uci.edu/ml/datasets.html 19 網 路資源 https://archive.ics.uci.edu/ml/datasets.html UCI--加州大學爾灣分校 https://www.kaggle.com/datasets Kaggle--知名資料分析競賽平台,現已被google買下

資料從哪來? dataset 20 爬蟲 撰寫程式,讓程式主動收集特定領域、網站的資料 使用者不自覺提供

誰來標示資料的答案? 人工標示 使用者不自覺標示 ground truth 自己、善良小精靈、付費他人 21 人工標示 自己、善良小精靈、付費他人 使用者不自覺標示 https://www.mturk.com/mturk/welcome

補充、政府資料開放平台 22 http://data.gov.tw/

補充、資料分析競賽 23 https://www.kaggle.com/competitions

再來,也許你會想要抽取特徵 feature 24 訓練資料 抽取特徵 測試資料 抽取特徵 Model 猜測答案

什麼是抽取特徵? feature 25 對於一筆資料,不使用它原始的全部內容, 而只使用它經過處理、具有代表性的某些特徵 作為模型的輸入

以文字來說 這 間 小 吃 店 給 我 一 種 歷 史 悠 久 的 感 覺 。 很 居 家 用 餐 環 境 , 沒 有 任 何 壓 力 員 26 這 間 小 吃 店 給 我 一 種 歷 史 悠 久 的 感 覺 。 很 居 家 用 餐 環 境 , 沒 有 任 何 壓 力 員 也 親 切 解法: 用(預先)建好的字詞字典來斷詞, 字典本身也可能是學習後的結果 字詞 小吃店 …… 對於文章,人習慣以最小的意義單位--「詞」來閱讀 這 間 小 吃 店 給 我 一 種 歷 史 悠 久 的 感 覺 。 很 居 家 用 餐 環 境 , 沒 有 任 何 壓 力 員 也 親 切 停用詞 的 …… 有些字詞是常出現又較不具意義的(e.g.,的,標點符號) 解法: 用預先建好的停用詞字典來移除它們 間 小 吃 店 給 種 歷 史 悠 久 感 覺 居 家 用 餐 環 境 沒 有 任 何 壓 力 員 親 切

最後,文字資料可能長這個樣子 間 小 吃 店 給 種 歷 史 悠 久 感 覺 居 家 用 餐 環 境 沒 有 任 何 壓 力 員 親 切 27 間 小 吃 店 給 種 歷 史 悠 久 感 覺 居 家 用 餐 環 境 沒 有 任 何 壓 力 員 親 切 以數字來表示最後抽取出的特徵值 為了之後的計算, 因為所謂建造模型,其實背後藏著許多數學計算 Why? 0.067 …… 字詞 小吃店 1 悠久 2 壓力 …… 表示字典裡編號0的字詞在文章裡的出現頻率 有沒有發現它的儲存結構跟我們之前教的ㄧ個東西長得很像? 沒錯! 就是一維陣列

以圖片來說 實際上電腦看到的是一格一格的 像素,每一格會有值去代表顏色 顏色對於許多圖形辨識 不具有太大意義 解法: 利用公式,把RGB值轉成灰階值(灰階化) 辨識時,主要專注於輪廓和外形 解法: 把自己和周圍的像素比較, 當有顯著深淺差異時,就是輪廓

最後,圖片資料可能長這個樣子 和前面一樣,最後特徵值要用數字來表示 不對……它本來就是數字了XDD 同樣的, 29 和前面一樣,最後特徵值要用數字來表示 不對……它本來就是數字了XDD 6x6 同樣的, 有發現它的儲存結構跟我們之前教的ㄧ個東西長得有點像嗎? 沒錯! 就是二維陣列 但是習慣上,我們會把它「壓平」來看 1x36 1 … 1 … 1 … 1 … 也就是存成一維陣列 表示(0,0)那一格經處理後的像素值

除了文字和圖片,還有別種資料? 當然有! 像是商品資訊、打卡紀錄、瀏覽行為、病人病歷等等, 實際上還有非常、非常多待發掘的資料 真是太讓人興奮了(´・ω・`) 以電影來說 導演:荻上直子 演員:市川實日子 平均分數:7 票房:50萬台幣 片長:110分鐘 類型:溫馨/家庭 出品國:日本 語言:日文 關鍵字:貓、陪伴、療癒 導演:0 演員:1 平均分數:7 票房:50 片長:110 類型:0 出品國:0 語言:0 關鍵字:0、1、2 和前面一樣,最後特徵值要用數字來表示 解法: 同處理文字,用預先 建好的各種字典來編號 人名 荻上直子 市川實日子 …… 類型 溫馨/家庭 …… 國家 日本 …… 字詞 貓 ……

最後,電影資料可能長這個樣子 導演:0 演員:1 平均分數:7 票房:50 片長:110 類型:0 出品國:0 語言:0 關鍵字:0、1、2 31 導演:0 演員:1 平均分數:7 票房:50 片長:110 類型:0 出品國:0 語言:0 關鍵字:0、1、2 一樣用一維陣列來儲存 1 7 50 110 2 表示導演這個特徵的值

簡單來說,抽取特徵就是 對於一筆資料,不使用它原始的全部內容, 而只使用它經過處理、具有代表性的某些特徵。 並且為了之後(可怕)的數學計算, feature 32 對於一筆資料,不使用它原始的全部內容, 而只使用它經過處理、具有代表性的某些特徵。 並且為了之後(可怕)的數學計算, 以數字的一維陣列來儲存與輸入。 表示第一個特徵的值

特徵裡,可能還有特徵 間 小 吃 店 給 種 歷 史 悠 久 感 覺 居 家 用 餐 環 境 沒 有 任 何 壓 力 員 親 切 0.067 …… 1.87 15 …… 字詞出現頻率 平均字詞長度、 相異字詞數…… 導演:0 演員:1 平均分數:7 票房:50 片長:110 類型:0 …… 同類型電影的平均分數:8 同關鍵字電影的平均分數:9

抽特徵有沒有風險? 抽了沒有意義的特徵 抽了重覆意義的特徵 有時辨識不錯只是湊巧,整體來說會干擾結果 太過看重某些特徵值,干擾結果 導演:0 演員:1 平均分數:7 票房:50 片長:110 類型:0 …… 導演喜歡吃的食物:0 導演討厭吃的食物:1 票房(美金):1.64 票房(日幣):184.27 票房(韓元):1835.43

影片、什麼是好的特徵(5’40’’)

我可不可以不要抽特徵? 不抽特徵 = 全部都是特徵 前面風險仍在;並且太多特徵,可能會造成後續計算過慢 從茫茫特徵中,選出比較好的幾個,又是一門課題 或者使用會自行調整特徵權重的學習方法

那如果資料是棋譜呢? 其中一種簡單的想法, 將19x19的二維陣列壓平為一維陣列 其中0代表空,1代表黑子,-1代表白子 李世石(白) vs. AlphaGo(黑) 第四局,白子勝 https://deepmind.com/research/alphago/alphago-games-traditional-chinese/

大綱 38 概論 流程 KNN SVM MINMAX 類神經網路

終於到了重頭戲,建立Model 39 訓練資料 抽取特徵 測試資料 抽取特徵 Model 猜測答案

現在已知資料長這個樣子 貓 狗 如果有一筆未知資料進來,你要怎麼判斷它是貓還是狗? training data 1 … 1 … 1 … 1 40 貓 狗 1 … 1 … 1 … 1 … 1 … 1 … 1 … 1 … 如果有一筆未知資料進來,你要怎麼判斷它是貓還是狗? testing data 1 …

一個簡單想法 ? 把資料用空間座標表示,找最像的(最近的)當作答案 x2 第i個特徵值的差的平方 特徵數量 x1 41 Mean Square Error 均方差 x2 第i個特徵值的差的平方 特徵數量 ? x1

這樣就足夠了? 42 你覺得待測資料是貓還是狗? x2 ? x1

K-Nearest Neighbors(KNN) 43 找K個最近的鄰居 少數服從多數,避免異常資料(outlier)干擾 x2 K = 5 ? x1 隨著資料不同,適合的K值也不同

建好Model以後? 44 訓練資料 抽取特徵 ? 狗? 貓? 1 … 測試資料 抽取特徵 Model 猜測答案

KNN小實驗 Iris 鳶尾花資料集 (共150筆資料) 1936年建立 特徵X = [x1,x2,x3,x4] 答案y 資料空間視覺化 http://projector.tensorflow.org/ 45 Iris 鳶尾花資料集 (共150筆資料) 1936年建立 特徵X = [x1,x2,x3,x4] 答案y 維吉尼亞鳶尾(virginica) 山鳶尾(setosa) 變色鳶尾(versicolor)

KNN小實驗 46 請觀察不同K值的準確度變化,並嘗試分析原因

大綱 47 概論 流程 KNN SVM MINMAX 類神經網路

KNN雖然簡單,但 KNN效果不一定較差,實際上它是最知名的方法之一 不過他有一個致命性的缺點…… 48 KNN效果不一定較差,實際上它是最知名的方法之一 不過他有一個致命性的缺點…… 對於每筆未知資料,都需要和所有資料計算彼此距離 當資料量龐大時,不免太過耗時

Support Vector Machine(SVM) 49 找條線把它劃分開來,當有新資料進來的時候,就可以直接求解 x2 f(x) = 0 f(x) > 0 f(x) < 0 x1

Support Vector Machine(SVM) 50 f(x1, …, xn) = w1x1 + … + wnxn + b = 0, 現在問題只剩下找適合的 w1, w2,…和 b, 但是怎樣的 w1, …, wn 和 b 比較好? x2 x1 (1) 儘可能把不同類別分開(準確) (2) 離最近的資料越遠越好(彈性)

Support Vector Machine(SVM) 51 以上就是 SVM 背後的精神,但是 W 和 b 當然不是漫無目的的找,接著來嘗試推導 W 和 b (這部份聽不懂也沒關係,只希望大家不要被數學式子嚇跑了……) 對於 WX + b = 0,為了符合離最近的黑點、白點「都」越遠越好的特性,它一定在離它最近的黑點、白點中間 所以可以列出: 離它最近的黑點會在WX + b = d 離它最近的白點會在WX + b = -d 又因為 W 和 b 可以放大縮小,(2W, 2b)、(3W, 3b)等都會是最佳解; 為了只有唯一解,所以縮放 d 到 1

Support Vector Machine(SVM) 52 根據平行面距離公式,WX + b - 1 = 0 和 WX + b + 1 = 0兩平面距離會是: 為了讓這個距離越大越好,也就是求: 去根號並不影響 W 結果,所以變成求: 也就是 離最近的資料越遠越好(彈性)

Support Vector Machine(SVM) 53 接著,因為最近的黑點落在WX + b = 1;最近的白點落在WX + b = -1 , 所以可以列出,所有黑點都符合WX + b ≧ 1 ;所有白點都符合WX + b ≦ -1 因為點有兩種顏色;所以我們用 y = +1來代表黑點, y = -1來代表白點 (***這邊的y並不是WX+b,而只是點的「顏色」) 所以對於所有點,都符合 y(WX + b) ≧ 1 也就是 儘可能把不同類分開(準確)

Support Vector Machine(SVM) 54 最後…… Quadratic Programming 我們想要解的 數學上已經有解的二次規劃形式 從左至右的一些轉換 感謝台大林軒田教授的機器學習課程影片(´・ω・`)

Support Vector Machine(SVM) 55 如果無法簡單的用直線來劃分? 將資料藉由特定核函數(kernel)來映射到更高維度, 再用平面(超平面)來劃分 RBF kernel 隨著資料不同,適合的kernel也不同 http://mlkernels.readthedocs.io/en/functions/kernels.html

SVM小實驗 Digits 手寫數字資料集 (共1797筆資料) 特徵為64個介於0到16的灰階值 X = [x1,x2,…,x64] 56 Digits 手寫數字資料集 (共1797筆資料) 1998年建立,筆跡來自43人 數字2 數字0 數字3 特徵為64個介於0到16的灰階值 X = [x1,x2,…,x64] 答案 y ∈ {0,1,…,9} 數字1

SVM小實驗 57 只要修改這兩行, 就可以套用各種Model 其實幾乎就是複製剛剛KNN的程式碼(´・ω・`)

SVM小實驗2 58 請觀察不同測試圖的結果,並嘗試分析原因

大綱 59 概論 流程 KNN SVM MINMAX 類神經網路

在開始聊AlphaGo以前 聽過Deep Blue嗎? 他是一個專門下西洋棋的AI,1997年由IBM所開發 60 聽過Deep Blue嗎? 他是一個專門下西洋棋的AI,1997年由IBM所開發 並且贏過了當時的世界棋王卡斯巴羅夫 從此, 它背後的MINMAX演算法一直被視為棋類AI主流 (直到AlphaGo出來為止)

稍微離題一下 61 老實說,下面的圖片讓我忍不住想到… 87%像不能再更多了 (歷史總是會不斷重演……)

在開始聊MINMAX以前 62 如果你是叉叉,你覺得下一步應該要下哪裡?

一個簡單想法 63 把彼此所有的 可能情況都列出來 有感覺下一步應該要下哪裡嗎?

MINMAX 輪到我方: 儘可能讓我方加分,也就把MAX傳上去 +1 輪到敵方: 儘可能不讓我方加分,也就是把MIN傳上去 +1 最好的 假設 贏+1、平手0、輸-1 輪到我方: 儘可能讓我方加分,也就把MAX傳上去 64 +1 輪到敵方: 儘可能不讓我方加分,也就是把MIN傳上去 +1 最好的 選擇 +1 +1 +1 +1 +1 +1 +1 +1

Alpha-Beta剪枝 我方:傳MAX上去 當分枝不可能比已知小(大)時,就不再找 敵方:傳MIN上去 -1 -1 -1 -1 +1 65 我方:傳MAX上去 當分枝不可能比已知小(大)時,就不再找 敵方:傳MIN上去 -1 -1 -1 -1 +1 不可能比已知小,找了也沒有意義 不可能比已知小,找了也沒有意義 +1

稍微整理一下 MINMAX Alpha-Beta剪枝 1.首先定義走到底的情況:贏+1、平手 0、輸-1 2.只要還沒有走到底,就繼續往下走 66 MINMAX 1.首先定義走到底的情況:贏+1、平手 0、輸-1 2.只要還沒有走到底,就繼續往下走 3.一但走到底,就開始把值往上傳 若是我方下,選對我方最有利的,即傳MAX上去 若是敵方下,選對我方最不利的,即傳MIN上去 4.回到目前盤面,真正決定下一步 Alpha-Beta剪枝 確定分枝不可能比已知大(小)的時候, 找了也是白找,可以剪枝,以節省時間 適用於兩人 對弈的遊戲 E.g., 棋類,撲克牌2048 等

但實際上DeepBlue 並沒有真的走到底! 這會有什麼問題? 根據統計,人類至多約可以估計隨後10步棋 67 並沒有真的走到底! 根據統計,人類至多約可以估計隨後10步棋 所以電腦只要估計的比那多,就可以得到不錯的結果 (Deep Blue可以估計隨後12步棋) 這會有什麼問題? 1.找到的不一定是最好的解,而是推測較佳的解 2.沒有真的走到底,所以要對中間盤面給一個分數 e.g., [自己得分 – 對方得分] 五子相連 >>> 活四 > 活三 > 單活四 ……

先預告期末作業 68 利用MINMAX、Alpha-Beta剪枝 和估分函數,來完成小型五子棋AI

補充、五子棋AI世界盃 69

傳統遊戲AI的優缺 優點: 缺點: 不需要準備棋譜資料(dataset),只需要訂定規則;並且因狀況單純,適合用樹狀圖求解;觀察全面 70 優點: 不需要準備棋譜資料(dataset),只需要訂定規則;並且因狀況單純,適合用樹狀圖求解;觀察全面 缺點: 不具備學習能力;樹狀圖容易分枝過多(158 = 2,562,890,625),即使剪枝,仍然過慢 What does AlphaGo’s victory mean?(42’’)