Visualizing and Understanding Neural Machine Translation

Slides:



Advertisements
Similar presentations
報告者:曹仁傑 2016/8/291.  簡介  研究方法  遊戲設計  實驗結果與分析  結論 2016/8/292.
Advertisements

高中英语教材分析与教学建议 福建教育学院外语研修部特级教师:周大明. 课程目录  一、理论创新与教材发展  二、现行教材的理论基础和编写体系  三、图式理论与 “ 话题教学 ”  四、课例分析与教学建议.
FREE-TYPE POEM GENERATION QIXIN WANG, TIANYI LUO, DONG WANG, CHAO XING AAAI & IJCAI 2016.
社會福利績效實地考核結果檢討 性侵害加害人處遇業務
Study of the AMS-02 results
(语文).
雷 曼 的 滑 铁 卢 ——雷曼兄弟破产案例分析.
最新消息插播! 意見反應: 我是貴校學生的家長,請問貴校該給工讀生的薪水何時才肯發呢?現在已經是十一月中了,九月十月的薪水還沒入帳我們不知道是卡在哪個環節,但貴校是否知道有多少同學需要這筆錢去過生活、繳納房租? …………………………………………………….? 請各位報帳同仁、專兼任助理們務必養成平時定期清帳的習慣,不要等到年終或結案前才開始緊張。
一、信息加工概述 1、信息技术是指与信息的获取、加工、表达、交流、管理、评价相关的技术。 2、信息加工的重要性: 原始信息 加工的信息
Unsupervised feature learning: autoencoders
泰宁小学 六(2)班 林丹敏 早恋?!.
虚拟心脏建模及其应用 Innovation course.
師資培育中心外埠教育參觀.
山东省水生态文明城市创建工作联席会议办公室
华东师范大学软件学院 王科强 (第一作者), 王晓玲
身心障礙學生之升學與就業 人發 郭峻如 科技 吳心昀
認識食品標示 營養師 李曼瑄 定緁食品有限公司
103年度雙和分區總務實務研討會 經費申撥 與 核銷流程說明 永續環境教育科-馮紹華 103年4月30日.
他是一位叱咤风云的人物,一位毁誉参半的领袖。
-Artificial Neural Network- Hopfield Neural Network(HNN) 朝陽科技大學 資訊管理系 李麗華 教授.
我来到主的圣殿 高举双手 敬拜祢 I come into Your sanctu’ry
抗菌药物临床应用管理 仁爱 和谐 敬业 进取.
好好國際物流股份有限公司 全球運籌物流服務建議 中 華 貨 物 通 關 自 動 化 協 會 理 事 長 劉 陽 柳 二○○二年五月十五日
Adversarial Multi-Criteria Learning for Chinese Word Segmentation
A TIME-FREQUENCY ADAPTIVE SIGNAL MODEL-BASED APPROACH FOR PARAMETRIC ECG COMPRESSION 14th European Signal Processing Conference (EUSIPCO 2006), Florence,
深層學習 暑期訓練 (2017).
-Artificial Neural Network- Adaline & Madaline
PRIMT: A Pick-Revise Framework for Interactive Machine Translation
Some Effective Techniques for Naive Bayes Text Classification
Ⅱ、从方框里选择合适的单词填空,使句子完整通顺。 [ size beef special large yet ]
数字电子技术 Digital Electronics Technology
机器翻译前沿动态 张家俊 中国科学院自动化研究所
Source: IEEE Access, vol. 5, pp , October 2017
宣教的中国 xuan jiao de zhong guo
Unit 7 What’s the highest mountain in the world?
Advanced Artificial Intelligence
Yonghui Wu, Mike Schuster, Zhifeng Chen, Quoc V. Le, Mohammad Norouzi
第三章 基本觀念 電腦繪圖與動畫 (Computer Graphics & Animation) Object Data Image
碳汇资本在旅游融资中的应用研究 阚如良 梅雪 孔婷 经济与管理学院旅游管理系
主啊我们愿意放下自己 全心寻求祢 O Lord we humbly come before You
sequence-to-sequence
Notes appear on slides 9, 11, 15, 21, 33, and 35
心连心.
第三章 基本觀念 電腦繪圖與動畫 (Computer Graphics & Animation) Object Data Image
Machine Translation for Conversational Texts
A high payload data hiding scheme based on modified AMBTC technique
如何增加对欧贸易出口 中国制造展销中心(英国)有限公司 首席执行官 理查德·赛斯
先啟資訊系統股份有限公司 經理 羅德業 Maggie Lo 100/9/29
Answering aggregation question over knowledge base
找人随时随地 完善的控制权限 通讯录信息字段自定义 支持各种组织架构 支持既有人事系统.
Research 裴澍炜 Shuwei Pei Tel:
前向人工神经网络敏感性研究 曾晓勤 河海大学计算机及信息工程学院 2003年10月.
Representation Learning of Knowledge Graphs with Hierarchical Types
科 系:休閒事業管理系. 指導老師:許興家老師. 組 員:游海欽.周書豪.林季蓁.
西南大学计算机系 郭云龙 徐潇 向宇 曾维刚 李莉
Neural Networks: Learning
计算机问题求解 – 论题1-5 - 数据与数据结构 2018年10月16日.
求職防騙面面觀 不累生活文化有限公司 行政總監 賴永洲.
李宏毅專題 Track A, B, C 的時間、地點開學前通知
Introduction of this course
(二)盲信号分离.
An Quick Introduction to R and its Application for Bioinformatics
More About Auto-encoder
醫學美學期末報告 醫學美學之我見---- 談單眼皮變雙眼皮
指導教授:陳正宗 終身特聘教授 指導學長:李應德 老師、高聖凱、李家瑋、 江立傑、簡頡 學生:黃文生 日期:
簡單迴歸分析與相關分析 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2019/8/3.
之前都是分类的蒸馏很简单。然后从分类到分割也是一样,下一篇是检测的蒸馏
陪他走過生命幽谷 林伯聰 諮商心理師.
Presentation transcript:

Visualizing and Understanding Neural Machine Translation ACL 2017 Visualizing and Understanding Neural Machine Translation Yanzhuo Ding, Yang Liu, Huanbo Luan, Maosong Sun

Machine Translation MT: using computer to translate natural languages 布什 与 沙龙 举行 了 会谈 机器翻译是利用计算机翻译自然语言的一种技术。 Bush held a talk with Sharon

Neural Machine Translation Black Box 随着技术的发展,近几年 NMT越来越受到人们关注,目前大多数的神经机器翻译都是基于注意力的encoder-decoder模型,在encoder过程中,模型将输入利用LSTM生成隐状态,通过注意力机制,将encoder的隐状态作为context输入到decoder中,利用LSTM生成目标语言单词。 。目前NMT的翻译效果已经远远超出了传统的统计机器翻译方法,成为了学术界和工业界的主流方法。然而在模型中传递的是浮点数,没有语言学的解释,因此NMT难以理解和调试。因此人们

Previous Work Attention: relevance between input and output 非常好,但是只有encoder和decoder的隐层之间的对齐信息。 (Bahdanau et al., 2015)

Previous Work First-Derivative Saliency: using gradient to measure relevance. 非常好,但是只有encoder和decoder的隐层之间的对齐信息。 (Li et al., 2016)

Previous Work Layer-wise relevance propagation: decomposing outputs into sum of relevance scores 非常好,但是只有encoder和decoder的隐层之间的对齐信息。 (Bach et al., 2015)

Our Work Visualizing and interpreting NMT using LRP method Helping to analyze translation errors

An Example

An Example

Neuron-level relevance The relevance between two neuron.

Vector-level relevance The relevance between two vectors.

Relevance vectors A sequence of vector-level relevance of its contextual words

Weight ratio Matrix multiplication Element-wise multiplication Maximization

LRP Algorithm in NMT Algorithm: Layer-wise relevance propagation for NMT

Visualization of NMT model Source Side 近 两 年 来 , 美国 1 2 3 4 5 6 jin liang nian lai , meiguo 近 两 年 来 , 美国 jin liang nian lai , meiguo 1 2 3 4 5 6

Visualization of NMT model Target Side my visit is to pray 1 2 3 4 5 我 参拜 是 为了 祈求 my wo canbai shi weile qiqiu 1 2 3 4 5 1

Translation error analysis Word Omission vote of confidence in the senate </s> 5 6 7 8 9 10 11 12 参 众 两 院 信任 投票 </s> the senate 4 5 6 7 8 9 10 11 10 11 can zhong liang yuan xinren toupiao </s>

Translation error analysis Word Repetition

Translation error analysis Unrelated Words

Translation error analysis Negation Reversion

Conclusion We propose to use layer-wise relevance propagation to visualize and interpret NMT Our approach can calculate the relevance between arbitrary hidden states and contextual words It helps us to analyze translation errors and debug the model

Thanks