AlphaGo -人工智能的新纪元 WhyX 2016/3
“人工智能就像一列火车,它临近时你听到 了轰隆隆的声音,你在不断期待着它的到 来。他终于到了,一闪而过,随后便远远地 把你抛在身后。”
关于围棋的背景 3000多年历史 4000万全球围棋选手(主要在中日韩) 复杂度: Chess 状态 1046, 博弈树10123 Go 状态 10172,博弈树10360
为啥叫Go? 围棋在日语中叫「囲碁(いご)」(/igo/),简称为「碁 (ご)」(/go/)。英语就是取自后者。
为什么是围棋? 围棋是人类有史以来发明的最复杂的游戏 围棋的复杂度使得搜索不好使 所以要下好围棋需要懂得模式识别和运筹帷幄 搜索范围太大 很难评估判断哪方能够获胜 所以要下好围棋需要懂得模式识别和运筹帷幄
直觉与计算 围棋与直接的关系比它和计算的关系更大一些 所以在许多情况下面,顶级选手更多的使用直觉 不可能制订出一套规则告诉计算机哪方能够获 胜
AlphaGo 对阵 李世乭 赛前:2015年10月5:0 李世乭(9段):国际排名第5 战绩:3:1 樊麾(2段) 2013-2016 欧洲围棋冠军 比人工智能专家预测早了10年 李世乭(9段):国际排名第5 战绩:3:1
代表人类出战的李世乭
Deepmind 2014年1月被google 4亿英镑收购 “AlphaGo之父”杰米斯.哈萨比斯(Demis Hassabis ) 13岁获得国际象棋大师 17岁进Bullfrog实习开发(主题公园)游戏 1998年剑桥毕业后成立自己的游戏公司 2005年攻读神经科学博士 2011年成立DeepMind,目标:解决智能问题
这次比赛的意义 创造了一个新的通用的人工智能算法 如5BC希腊人提出尺规作图难题 Deepmind任务 化圆为方: 1882年 林德曼证明 π是超越数 三等分角: 伽罗瓦用《群论》证明是不可能的 Deepmind任务 解决智能问题 利用智能让世界变得更美好
深蓝VS卡斯帕罗夫
深蓝 AlphaGo 人工输入象棋知 识 从专家对弈和自我对弈中 学到知识 全局搜索 由策略和价值网络引导的 高度选择性搜索 每秒2亿次局面 每秒10万次局面
制造通用学习机 学习:从原始输入而非预先编程的数据中自动学 习 通用:同样的系统可以应用于不同的任务 人工通用智能(AGI):灵活\可适应\具有创造性
人工智能 弱人工智能(ANI) 强人工智能(AGI) 超人工智能(ASI) Artificial Narrow Intelligence 某些领域强于人类 强人工智能(AGI) Artificial General Intelligence 人类级别:能够进行思考、计划、解决问题、抽象思 维、理解复杂理念、快速学习和从经验中学习等操作 超人工智能(ASI) Artificial Superintelligence 在几乎所有领域都比最聪明的人类大脑都聪明很多, 包括科学创新、通识和社交技能
计算能力 运算能力单位:cps 人脑cps估计值:1016 cps,1亿亿次/秒。 天河二号: 3.4x1016 cps calculations per second,每秒计算次数 人脑cps估计值:1016 cps,1亿亿次/秒。 天河二号: 3.4x1016 cps 占地720平方米,耗电2400万瓦,3.9亿美元 摩尔定律:每1000美元能够买到的运算能力 乐观估计:2025年能够买到人脑级别cps
计算能力指数增长
人工智能优势:硬件 速度 神经元200hz,大脑内部信息传播速度120m/s 容量和储存空间 可靠性和持久性 人类致命缺陷
人工智能优势:软件 可编辑性升级性 更多的可能性和扩展性 集体能力 可以进行升级和修正,容易测试 可以在单一原件上升级和加强、优化 如视觉,听觉等单元 集体能力 人类社群能力,但是智能网络更强
总结
参考资料,图片等来自 Mastering the game of Go with deep neural networks and tree search http://www.nature.com/nature/journal/v529/n75 87/full/nature16961.html Nick Bostrom – Superintelligence: Paths, Dangers, Strategies James Barrat – Our Final Invention Ray Kurzweil – The Singularity is Near
感谢!请提问! 2016/3