—— 周小多.

Slides:



Advertisements
Similar presentations
碧桂园集团开启全球人才招募之旅. 这里是社会精英云集的公司 这里是人才施展才华的好地方 这里是学习进步的好学校 这里是和谐的大家庭 这里是诚实守信、合法合规经营的公司 这里是讲道理、勇于自我修正的公司 这里是公平公正、论功行赏的公司 这里是欣欣向荣、不断总结好经验并付诸实践的公司 这里是为全世界建造又好又便宜的房子的公司.
Advertisements

眼鏡 於台南女中. 眼睛的機能 眼球的功能 眼球的功能 - 眼睛為靈魂之窗 - 眼睛為靈魂之窗 - 五感 : 觸覺 聽覺 味覺 嗅覺 視覺 - 五感 : 觸覺 聽覺 味覺 嗅覺 視覺  60% 來自眼睛  60% 來自眼睛 - 功能廣泛 靈敏快速的感測系統 - 功能廣泛 靈敏快速的感測系統.
大學甄選入學第二階段 指定項目甄試之認識與準備 台大財金系 陳明賢教授. 申請入學的主要認知  這是一個客觀公平制度 ( 學測成績 ) ,與主觀選材 ( 審查及口試 ) 並重的考試  大部分跟你進榜的申請學生學測成績接近,決 勝在審查資料與口試  審查資料與口試的老師,是學有專精的大學教 授;你要有十全準備。大學教授如何看學生.
What do you see? What do you recognize? What do you think we are going to learn?
博奥文明之旅团支部 ——师范学院小学教育专业063团支部.
思想道德修养与法律基础 ( 2013修订版) 第一章 追求远大理想 坚定崇高信念.
上海市科技创业中心 (上海市高新技术成果转化服务中心) (上海市火炬高技术产业开发中心)
東風西合一堂 姊妹学校情谊深长 東風西路小學李海鷹副校長 合一堂學校 梁秀芳副校長
TIC 智慧城市与物联网创新创业大赛 齐 技术模式 创新,智慧城市 成真 梦 主办单位: 协办单位: 合作高校:
教育概論 幼一甲 第四小組 1.林瑞敏 2.許曉文 20.張舒婷 21.陳香如.
让机器人和你自由聊天 周明 微软亚洲研究院首席研究员、自然语言组主任 北京服务机器人大会 2016 年 6 月 16 日.
职业生涯规划 ——专业与职业系列.
看故事學管理 出版單位:中國生產力中心 日期:2006年5月2日.
看故事學管理 出版單位:中國生產力中心 日期:2006年5月2日.
Word高级应用——制作毕业论文 Word高级应用——制作毕业论文 6..
个人品牌塑造 主讲:施隆光博士、教授.
建筑工程项目管理.
中学生“学习心理辅导” 教学分析(一) 锦江区教师进修学校 周玫.
大學甄選入學第二階段 指定項目甄試之認識與準備
趣味小故事:马和驴子 在唐太宗贞观年间,有一匹马和一头驴子,它们 是好朋友。贞观3年,这匹马被玄奘大师选中,出 发前往印度取经。17年后,这匹马驮着经书回到长 安,重到磨坊会见驴子朋友。老马谈起这次旅途的 经历,浩瀚无边的沙漠,高耸云霄的山岭,凌云的 冰雪,壮阔的波澜……神话般的一切,让驴子听了 大为惊异、好生羡慕!驴子惊叹到:“你有多么丰.
金都数码城 楼盘宣传推广渠道建议.
彰化縣身心障礙學生鑑定作業 業務承辦:陳漢棻、黃秉琪教師 # 542、543.
認識六大類食物.
彰化縣課程教學輔導團性別平等教育議題輔導小組 運作績優團隊 《有志一同,迎向彩虹》
职业素质训练 ——职业规划 一、授课目的:通过课程的学习,让学生明白职业规划的重要性,学会进行个人的职业规划,并对IT行业的现状有一个基本的了解。 二、授课方法:老师讲授与学生自我练习相结合。 三、授课思路: 1、通过调查分析、提问及案例分析引发学生思考职业规划的重要性; 2、阐述职业规划的含义,引导学生分析职业规划的三个要点,从而对职业规划有一个清晰的认识;
歡 迎 各位視光界精英 蒞 臨 元培視光系 103校外學分班說明會.
我的职业生涯发展图.
閱讀與寫作 設計者:林怜秀.
國立花蓮女中101學年度 開學典禮簡報.
数据库技术及应用 华中科技大学管理学院 课程网址:
学前教育原理 主讲:李德明.
幼兒美勞試教 我想飛~~~~~ 四幼二A D 莊小萱 D 林昀儒 D 劉思妤
外 伤 之 后.
申請土地徵收注意事項 內政部地政司 邱于蓉.
项目六 职业生涯规划的方法与步骤.
Module 1 Automobile Parts Section A
AIS Project hanyu Stage 6 Writing Skills
MovieBot: Booking Tickets Easily
Tea Classification ——Other Categories of Tea
第十五讲 国际市场营销调研与分析.
關聯式資料庫.
組員:蔡惠雅 494D0032 楊雅惠494B0079 蔡騏鴻 葉時宇 余建霖495B0002 陳瑛淑495B0021
Q: Lili在哪儿? A: Lili在__________. Q: 客厅里边有什么? A:客厅里有_______
Unit title: 买东西 - Shopping
Unit title: 嗨!Hi! Introducing yourself in Chinese
北京饭店 Tell them that 我是服务员, 我是北京饭店的服务员, 欢迎,欢迎您们来中国。欢欢迎您们来北京饭店吃饭。
顏色yán sè COLORS 紅色 藍色 綠色 黃色 紫色 白色 黑色 咖啡色 bái sè hēi sè hóng sè lǜ sè
关于“理解名词短语”的 重新思考 丁文韬.
Chinese 101 University of Puget Sound
國立政治大學 資訊科學研究所 知識系統實驗室 研究生: 鄭雍瑋 指導教授: 劉吉軒 博士 中華民國九十五年六月三十日
課程地圖網站建置- 3.職業與課程推薦.
看故事學管理 出版單位:中國生產力中心 日期:2006年5月2日.
客户服务 询盘惯例.
Chinese 101 University of Puget Sound
Towards Emotional Awareness in Software Development Teams
指導老師:葉淳媛老師 組 員:施金翰 廖仁輝 李柏蔚 黃威耀 邱哲偉 張育彬 報告日期:100年12月6日
如何讓孩子成為明日之星 芃芃森林幼稚園 許玉芳 園長.
Answering aggregation question over knowledge base
為何要做好零售 Ways to Increase Retail
偶發事件處理 偶發事件的類型很多,有在校內的,也有在校外的,但是都是我們做為一個班級的經營者所需要注意的事情。 報告組員
遠 流 商 用 英 語 學 程 主講人:陳世宗先生 地 點:清雲科技大學 (清雲館804教室) 日 期:
財團法人中華民國私立學校教職員 退休撫卹離職資遣儲金管理委員會 主講人 財務組 李美華 組長
李宏毅專題 Track A, B, C 的時間、地點開學前通知
我的衣服 By Ms. Liu TCLP Chinese Teacher
服務教育課程 改制說明會 學生事務處 服務教育組
一只猪和一只企鹅被关在-20℃的冷库里,第二天企鹅死了,猪没事,为什么?你知道为什么吗?
如何有效、有趣的閱讀 天下雜誌童書出版總編輯 何琦瑜.
管理學作業2-4 運管 官盛堯 管科 王晨宇.
Center for Deliberative Democracy, Stanford University
Presentation transcript:

—— 周小多

对话系统分类 chat-oriented systems Dialogue System task-oriented systems 聊天型:小冰 Dialogue System task-oriented systems 任务型的对话系统主要是为完成特定任务而定制的比如 找产品、定机票电影票之类 任务型:淘宝客服小蜜

对话系统存在的挑战 对于一个新的领域没有大量对话数据可用来训练模型 中文语义多样性导致自然语言理解模块准确度低 评测难,没有一个较好的标准

本文主要贡献 创建了一个针对海量数据(11M个产品,1080大类)的电商平台导购对话机器人 将任务型对话与闲聊对话系统结合在一起 独特的框架能灵活切换推荐、比较、问答等功能 对运营一段时间的人机对话日志进行分析得到一些发现 传统的基于结构化本体形式的对话系统 在新的领域需要专家来定义有哪些槽和可能的槽值。在电商这种产品种类非常丰富产品数极大的平台中很难实现(冰箱-》体积 手机-》屏幕尺寸) 传统的填槽方式需要用人与人的对话数据,再通过有监督的方式去训练模型来填槽,本文通过无监督的方式来填槽,解决了无对话数据时冷启动问题 应该是应用在淘宝中了

系统总框架 DS = {QU, ST ,DM,PKB} QU(query understanding) 输入为 表示 时刻用户的utterance , 输出为 表示该句的语义 ST (state tracking) 输入句意 和上一刻系统状态 输出为 当前系统状态 DM(dialogue management) 输入当前系统状态 系统输出自然语言回应 ,该模块根据系统状态选择系统行为并将其转化为自然语言的形式 PKB( product knowledge base ) 以三元组的形式存储产品 ,p 表示产品名,n表示属性名,v表示属性值,例如 <Huawei P9, DisplaySize, 5.2 inches > 主要由4部分组成

QU(query understanding) 该模块输入 输出 其中 I 表示句子的意图(如右图) C 表示句子中识别出来的产品的类别 A 表示产品属性,通常用一个集合表示<属性名,属性值> Eg. recommend me a Huawei phone with 5.2 inch screen 这句话可得 M.I = Recommendation , M.C = Cellphone , M.A.Brand = Huawei and M.A.DisplaySize = 5.2 inches

Query Intent Detection 1、 从社区网站(百度知道)上搜集问题组成问题集,搜集的问题至少要包含1个产品名一个品牌名或在知识库中的产品属性名 2、分词 3、使用LDA(Latent Dirichlet Allocation)做主题聚类 4、由众包根据聚类的主题找出与购买相关的主题组成意图集合 5、对于每一个意图,由众包选出意图词 6、返回标好意图词的意图集合 整个数据是在百度知道上爬取的,经过筛选Q问题集中还剩300多万个问题,经过上述处理后仅剩1000多条意图短语

Query Intent Detection Session-aware 意图(这些句子很少出现在单轮问答中,需要联系上下文才能明确用户意图): Add Filter Condition (增加过滤条件) “太贵”、“小点的” See-More (基于当前的过滤条件看更多商品) “其它的”、“换一个”、“下一个” Negation (否定当前推荐商品) “不好”、“我不喜欢”

Product Category Detection Classification task. the total number of products is very large < 11M > based on a CNN-based approach each Chinese word as a count vector of characters concatenating the character vectors of each word , which is set to 3.

Product Attribute Extraction attribute names and values :

Product Attribute Extraction For attribute values that are product names 1、对于属性值是产品名的 q为淘宝中输入的词 URLp为用户点击的产品名p的链接 Link(p|q)为 产品名p和用户输入的词q之间的可替换度 P(p|q)为用户输入的词q中出现产品词条p的概率 2、对于其他 For all the other attribute values and names 通过网络锚文本、知识库别名等资源利用开放的信息检索方法Hearst patterns 得到.

Product Attribute Extraction 通过动态规划的方式检测出 一句话中所有的 属性名和属性值 ,通过计算取最大概率的一项。

State Tracking 系统维护一个对话状态 ,状态转化的工作机制如下: 系统维护一个对话状态 ,状态转化的工作机制如下: 如果 ,且不是session-aware 意图,那就保持 不变 如果 ,是 session-aware 意图, 其它情况则设置 为 Chit-chat 如果当前句子中产品的种类与状态 中的种类一样,则 继承 中所有信息。否则状态 由 更新,包括产品种类( )、意图( )、属性( ) 只要检测到 为 Chit-chat 则不更新状态即 Notice :当Chit-chat句子的数目超过一个阈值时,用来表征任务的对话状态 将会被清空,即为失忆(闲聊太多忘掉主题了)

Dialogue Management State Tracking 已经更新完最新的状态了, DM的任务就是根据系统对话状态( )做出反馈,主要是针对以下几类反馈: Recommendation:如果 是Recommendation,系统将根据存储在 中的产品类别和属性在数据库中进行检索。 Comparison:如果 是Comparison ,系统将根据存储在 中的多个产品类别和属性调用比较程序进行反馈 。(待开发) Opinion Summary:如果 是Ask Opinion ,系统将根据 中的产品/品牌 反馈所有可选项。 Question Answering:如果 中检测到产品名和产品属性名,但相关的属性值未检测到那将根据产品知识库查找返回未填的属性值,一般把这个当做一个单轮的KB-QA问题

Dialogue Management Proactive Questioning:此功能在满足以下几个条件后就会触发 检测到意图为recommendation 检测到类别名 没有其它限制条件 what kind of do you want to buy? Chit-chat : 当检测到非购买意图时此功能被触发,聊天功能是基于信息检索的 ,在数据库中存储一些闲聊的问答对,计算问题与数据库中问答对的问题的相似度 返回最相似问题的回复。

End-to-End Analysis 平均25.3轮(一问一答算一轮) 80%的句子为聊天问题。一个有趣的发现,闲聊功能能减少用户对对话质量的不满 49.9%的句子依赖前面的句子 意图分布列表如下: (Proportion为意图占比,Precision为该意图的检测精度) 在系统运营一段时间后查看系统的对话日志得到如下结论 意图检测中第二项 增加过滤条件 意图的准确率只有百分之50. 主要原因如下: 海量数据下的产品属性检测还是非常困难 多轮对话下增加了检测难度

Evaluation on Product Category Detection Evaluation on Utterance Type Classification

Q&A