机器人学说话: 深度学习和 信息距离理论 李明, 薄言董事长 宁波信息技术应用研究院首席科学家

Slides:



Advertisements
Similar presentations
月經異常的原因及警訊 組員: 陳少康、張康樂、許晉愷、何曄、方泠瑩、張 顓麟、蘇梓喬、溫鵬皓、林雅雯.
Advertisements

說明事項  大陸交換學習近況  大陸姐妹校介紹  申請資格和程序  研究生補助 大陸交換學習近況 2009 年秋首次進行,計有 6 校共 20 位學生來校交換學習。 來校交換生.
年終工作獎金 及考績獎金 法規與實務 苗栗縣政府人事處 副處長 陳 坤 榮 中華民國102年1月25日.
博奥文明之旅团支部 ——师范学院小学教育专业063团支部.
计算机组成原理.
「互联网金融2.0时代」与房地产的融合 广州互联网金融协会会长、广州e贷总裁 方颂.
企业会计学(三) 人大版本 吕 昌.
消失的吸管 隊名:吸管應該消失才隊.
思想道德修养与法律基础 ( 2013修订版) 第一章 追求远大理想 坚定崇高信念.
助學工作說明會 及 教育訓練.
師資生修讀教育學程 重點提醒 師資培育暨就業輔導中心.
文書檔案組Q&A 崇右技術學院 文書檔案組 Q & A 總務處.
公職人員財產信託簡介 第一銀行信託處 編製.
經分表聘用兼任助理流程 完成 新增/修改 經分表 計畫無聘任兼任助理(新增) 紙本送所屬單位審核 計畫聘任兼任助理(新增)
台灣科技之父 李國鼎 先生.
未婚懷孕:你想清楚了嗎 瑞芳國中 林碧欣.
國科會經費報銷說明 報告人:陳秀合 分 機: 年11月 12日(一).
政府採購法規概要 報告人:杜國正 行政院公共工程委員會企劃處.
實用技能學程答客問 Q&A 大明高中附設進修學校 教導處 編製.
畜牧類天然災害查報 及救助作業簡介 臺南市政府農業局畜產科 李東仁 臺南市政府農業局畜產科.
之 魔 析 妖 鬼 解 怪 大 沈家仪小组出品.
財團法人台北市任兆璋修女林美智老師教育基金會
建筑工程项目管理.
用“自言自语法”提高学生 英语口头表达能力 李奉栖.
100學年度719班 親師懇談.
杜甫诗三首 《望岳》 《春望》 《石壕吏》 授课人:姚晓霞.
社團資料製作 亞東技術學院課外組 岳擎天
道路、管線事故緊急應變處理課程.
財團法人台北市任兆璋修女林美智老師教育基金會
大 綱 國有財產之來源 國有財產之範圍 國有財產之種類 國有公用財產管理 使用原則 國有公用財產管理
机器人学说话: 深度学习和 信息距离理论 李明, 薄言董事长 宁波信息技术应用研究院首席科学家
花的構造- (資料參考--鄭元春 植物Q&A一書) 花瓣 花萼 雌蕊 雄蕊.
認識股票 認識股票.
年終工作獎金 及考績獎金 法規與實務 苗栗縣政府人事處 副處長 陳 坤 榮 中華民國100年12月20日.
103年度身心障礙福利機構評鑑 日間及住宿機構指標說明 ~會計及財務管理~
学生培养的过程性评价.
屏東縣政府對民間團體補助經費作業要點 & 簡易計畫書撰寫概要與核銷注意事項
--洲仔尾的鹼菜 與櫻桃鴨的結合-- 鴨賞的故事.
第九章 长期资产及摊销 2017/3/21.
戲水安全.
做最好的自己 ——七(6)班主题班会.
公務人員退休法、撫卹法 法制與實務講習 銓敘部退撫司 中華民國99年8月.
外僑扣繳實務講習 1.
職場性騷擾相關法 律責任-以上司對 下屬性騷擾為例
杜甫诗三首 《望岳》 《春望》 《石壕吏》.
主講人:曲軒 協理 就業情報資訊 日期:2003年5月8日
衛生筷,衛生嗎? 綠的關懷協會 常務理事 董雅坋.
高粱酒香-金門城.
讀報教育 報告者:施子慧 資料來源:徐瑞美、施子慧.
103年度 健康促進學校輔導與網站維護─ 「臺灣健康促進學校之網站特色介紹」 張子超 教授
107年勞動基準法修法重點解析 高雄市政府勞工局.
國立中山大學管理學院 國際人才培育中心 大專人才培訓就業學程.
Yonghui Wu, Mike Schuster, Zhifeng Chen, Quoc V. Le, Mohammad Norouzi
開課單位作業流程及Q&A 開啟衛生署積分系統首頁 畫面如下頁.
精算假設品質的基本要求 精算假設應提出明確的假設數值,同時應提供實際經驗率資料以作為假設訂定之依據,且精算人員應說明實際經驗率與假設數值間的合理關係。 精算假設若由其他單位提供(例如:利率或投資報酬率假設由投資部門提供),精算人員仍應了解其假設的方法,並就其假設合理性及假設方法提出意見。 精算假設若與前一年相較有所變更時,精算人員應說明假設改變的原因,對於有改變的精算假設數值宜列對照表比較並說明。精算人員應評估假設的改變對財務影響是否顯著,若顯著則應提供量化數值以說明其影響程度。
臺南市 107學年度 國中生志願選填試探與輔導知能研習
1.E化系統 之 專案登錄 核銷作業 2.常見退件原因 3.其他注意事項
國中志願選填試探與輔導知能研習 『學校適性輔導實務分享』 2015年12月1日(二) 分享者:蔡幸君.
現代專案管理教材 第一章 專案與專案管理 博碩文化出版發行.
2011年版大學學系探索量表測驗結果說明 輔導室 楊欣翰老師.
中小學教師科博館教學導覽教師研習工作坊 國立自然科學博物館 科學教育組 葉蓉樺博士.
飛行器製作與飛行 講師:劉修建.
101學年度繁星推薦校內甄選學生說明會 海山高中輔導處
培僑小學 成功父母學堂 常識科專題研習工作坊
104年度自我評鑑 學術單位內部評鑑工作研習會.
以碎形正交基底和時間情境圖為基礎進行之視訊檢索 Video retrieval based on fractal orthogonal bases and temporal graph 阿凡達 研究生:張敏倫 指導教授:蔣依吾博士 國立中山大學資訊工程學系.
組長:李儂.組員:溫芷沂.詹文君 桃園市北門國小5年12班
轉換成二進位、八進位及十六進位 = ( ) = ( ) = ( )16.
訪談地點:高雄縣大社鄉便當店 組員:王佩儀 B 王紀璇 B 許乃心 A
教育部彈性薪資說明會 主辦單位:教育部 執行單位:彈性薪資專案辦公室 主 持 人:周麗芳 國立政治大學財政學系教授 101年4月18日.
Presentation transcript:

机器人学说话: 深度学习和 信息距离理论 李明, 薄言董事长 宁波信息技术应用研究院首席科学家 滑铁卢大学, University Professor 微信公众号: 薄言豆豆

?

薄言超脑平台: 知识,对话,聊天

输入层 隐层 隐层 输出层 W1 . b1 W2 . b2 W3 . b3 Z1 Z2 Z3 Z4

“薄言超脑”的卷积神经网络(CNN)可以自动提取一句话中的语义要素,分辨对话的上下文和意图,从而给出更精准、符合语境的回答; “薄言超脑”的深度置信网络(DBN)通过分析对话,进行强化学习,调整对话逻辑,让自己变得更会说话。 如何在考试中得100分呢? 80%努力 +20%运气 你要努力 楼主你好 学习一天后 学习一周后 学习一月后

“薄言超脑”的卷积神经网络(CNN)可以自动提取一句话中的语义要素,分辨对话的上下文和意图,从而给出更精准、符合语境的回答; “薄言超脑”的深度置信网络(DBN)通过分析对话,进行强化学习,调整对话逻辑,让自己变得更会说话。

豆豆 怎么才能拥有幸福? 幸福就在你身边哦~

“薄言超脑”会通过读书、看报,获取新的知识, 并通过和人脑相似的多层神经网络,归纳新的概念以及他们之间的联系。

第三方(中科院计算所)使用第四方独立数据集NLPCC’2015会议的1000个测试问题集。结果 如下: 聊天机器人 问题总数 答错/不会 正确回答 正确回答率 薄言豆豆 1000 391 609 60.9% 图灵机器人 576 424 42.4% 出门问问 855 145 14.5% 小i机器人 906 94 9.4% 微软小冰 936 64 6.4% 百度度秘 972 28 2.8% 说明: 数据来源: Nan Duan, Overview of the NLPCC 2015 Shared Task, Open Domain QA, NLPCC 2015 pp. 562-570 本次测试结果的标注,每个测试对象都由3个人分别标注。 所有测试使用以上服务的微信公众号.

人类智能从语言开始. 人工智能革命也应从语言学习开始, 可是, 怎么学习说话呢? 打个比方: AlphaGo自己和自己下了3000万盘棋来改进 它的价值网络. 但是围棋是有输赢的, 某一步导致输棋反馈给价值网络. 但是说话呢? 哪句对哪句错呢? 人工反馈当然不靠谱.

薄言豆豆也和自己聊天学习. 但是聊天比下围棋要难一百倍 我们就只讲一个小侧面来解释豆豆的学习的理论基础: 即学习类似(相同语义的)问题.

这个是豆豆使用的LSTM来学习一对句子的”相似性”

但是什么是”相似性”或”语义距离” 我们如何反馈给这个RNN神经网络对/错呢? 语义距离根本不可计算 甚至连个正式定义都没有. 怎么办?

信息距离理论 (Bennett, Gacs, Li, Vitanyi, Zurek) 我们从物理学公理出发 经过严格的数学推理 给出一套完整可用的信息距离理论. 这个理论已经广泛为学术界接受使用.

Thermodynamics of Computing Talk at U of Maryland Thermodynamics of Computing Heat Dissipation Input Compute Output Von Neumann, 1950 物理定律: 1kT is needed to (irreversibly) process 1 bit. Landauer

可逆计算不需要能量 A AND B A B A billiard ball computer. Input Output 1 1 A Talk at U of Maryland 可逆计算不需要能量 A billiard ball computer. Input Output A AND B A 1 1 A billiard ball computer B AND NOT A A AND NOT B B A AND B

E(x,y) = smallest number of bits needed to Talk at U of Maryland 转换 x, y 所需的能量: E(x,y) = smallest number of bits needed to convert reversibly between x and y. x p y Fundamental Theorem: E(x,y) = max{ K(x|y), K(y|x) } Bennett, Gacs, Li, Vitanyi, Zurek, STOC’93. IEEE Trans-IT 1998

Talk at U of Maryland Kolmogorov 复杂性 Invented in the 1960’s by Solomonoff, Kolmogorov, and Chaitin. Kolmogorov complexity of a string x condition on y, K(x|y), is the length of shortest program that given y prints x. K(x) = K(x|ε). Similar talk was given in Taiwan AAAC, 2011, April.

信息距离: 定理: 对任何其它距离 D’, 有常数C, 使得对任何 x, y, D(x,y) ≤ D’(x,y) + C D(x,y) = max{K(x|y),K(y|x)} 定理: 对任何其它距离 D’, 有常数C, 使得对任何 x, y, D(x,y) ≤ D’(x,y) + C

用信息距离近似语义距离 信息距离 比这些都好 定义 传统可计算距离 语义距离 语义距离的任何 可计算近似版本

薄言豆豆平台的漂亮理论基础 这样我们从理论上解决了语义距离的不可定义性和不可计算性 对信息距离的近似: 压缩,编码 从理论上解决了聊天机器人加强学习对话的一个关键步骤. 人工智能的进步首先应该是理论的进步.

宁波薄言信息技术有限公司成立于 2013年。但是我们做豆豆平台已经10年. 创始人 李明博士 ,作为 现代信息理论 的奠基人之一,多年来从事生物信息学、自然语言处理、深度神经网络研究 。 10年来, 带领一批来自清华、北大、科学院, 中科大、滑铁卢大学等世界顶级院校的顶尖科学家和工程师,专注于 下一代人工智能技术 的研发。 将现代信息理论,深度神经网络和自然语言处理技术相互结合,并成功应用于 自动问答、语义理解、语句生成等领域 。

www.rsvptech.cn 微信公众号: 薄言豆豆