Visualizing and Understanding Neural Machine Translation

Slides:

Advertisements

Similar presentations

報告者：曹仁傑 2016/8/291.  簡介  研究方法  遊戲設計  實驗結果與分析  結論 2016/8/292.

Advertisements

高中英语教材分析与教学建议福建教育学院外语研修部特级教师：周大明. 课程目录  一、理论创新与教材发展  二、现行教材的理论基础和编写体系  三、图式理论与 “ 话题教学 ”  四、课例分析与教学建议.

FREE-TYPE POEM GENERATION QIXIN WANG, TIANYI LUO, DONG WANG, CHAO XING AAAI & IJCAI 2016.

社會福利績效實地考核結果檢討性侵害加害人處遇業務

Study of the AMS-02 results

雷曼的滑铁卢 ——雷曼兄弟破产案例分析.

最新消息插播! 意見反應: 我是貴校學生的家長，請問貴校該給工讀生的薪水何時才肯發呢？現在已經是十一月中了，九月十月的薪水還沒入帳我們不知道是卡在哪個環節，但貴校是否知道有多少同學需要這筆錢去過生活、繳納房租？ …………………………………………………….？請各位報帳同仁、專兼任助理們務必養成平時定期清帳的習慣，不要等到年終或結案前才開始緊張。

一、信息加工概述 1、信息技术是指与信息的获取、加工、表达、交流、管理、评价相关的技术。 2、信息加工的重要性：原始信息加工的信息

Unsupervised feature learning: autoencoders

泰宁小学六(2)班林丹敏早恋?!.

虚拟心脏建模及其应用 Innovation course.

師資培育中心外埠教育參觀.

山东省水生态文明城市创建工作联席会议办公室

华东师范大学软件学院王科强 (第一作者), 王晓玲

身心障礙學生之升學與就業人發郭峻如科技吳心昀

認識食品標示營養師李曼瑄定緁食品有限公司

103年度雙和分區總務實務研討會經費申撥與核銷流程說明永續環境教育科-馮紹華 103年4月30日.

他是一位叱咤风云的人物，一位毁誉参半的领袖。

-Artificial Neural Network- Hopfield Neural Network(HNN) 朝陽科技大學資訊管理系李麗華教授.

我来到主的圣殿高举双手敬拜祢 I come into Your sanctu’ry

抗菌药物临床应用管理仁爱和谐敬业进取.

好好國際物流股份有限公司全球運籌物流服務建議中華貨物通關自動化協會理事長劉陽柳二○○二年五月十五日

Adversarial Multi-Criteria Learning for Chinese Word Segmentation

A TIME-FREQUENCY ADAPTIVE SIGNAL MODEL-BASED APPROACH FOR PARAMETRIC ECG COMPRESSION 14th European Signal Processing Conference (EUSIPCO 2006), Florence,

深層學習暑期訓練 (2017).

-Artificial Neural Network- Adaline & Madaline

PRIMT: A Pick-Revise Framework for Interactive Machine Translation

Some Effective Techniques for Naive Bayes Text Classification

Ⅱ、从方框里选择合适的单词填空，使句子完整通顺。 [ size beef special large yet ]

数字电子技术 Digital Electronics Technology

机器翻译前沿动态张家俊中国科学院自动化研究所

Source: IEEE Access, vol. 5, pp , October 2017

宣教的中国 xuan jiao de zhong guo

Unit 7 What’s the highest mountain in the world?

Advanced Artificial Intelligence

Yonghui Wu, Mike Schuster, Zhifeng Chen, Quoc V. Le, Mohammad Norouzi

第三章基本觀念電腦繪圖與動畫 (Computer Graphics & Animation) Object Data Image

碳汇资本在旅游融资中的应用研究阚如良梅雪孔婷经济与管理学院旅游管理系

主啊我们愿意放下自己全心寻求祢 O Lord we humbly come before You

sequence-to-sequence

Notes appear on slides 9, 11, 15, 21, 33, and 35

第三章基本觀念電腦繪圖與動畫 (Computer Graphics & Animation) Object Data Image

Machine Translation for Conversational Texts

A high payload data hiding scheme based on modified AMBTC technique

如何增加对欧贸易出口中国制造展销中心（英国）有限公司首席执行官理查德·赛斯

先啟資訊系統股份有限公司經理羅德業 Maggie Lo 100/9/29

Answering aggregation question over knowledge base

找人随时随地完善的控制权限通讯录信息字段自定义支持各种组织架构支持既有人事系统.

Research 裴澍炜 Shuwei Pei Tel:

前向人工神经网络敏感性研究曾晓勤河海大学计算机及信息工程学院 2003年10月.

Representation Learning of Knowledge Graphs with Hierarchical Types

科系：休閒事業管理系. 指導老師：許興家老師. 組員：游海欽.周書豪.林季蓁.

西南大学计算机系郭云龙徐潇向宇曾维刚李莉

Neural Networks: Learning

计算机问题求解 – 论题1-5 - 数据与数据结构 2018年10月16日.

求職防騙面面觀不累生活文化有限公司行政總監賴永洲.

李宏毅專題 Track A, B, C 的時間、地點開學前通知

Introduction of this course

(二)盲信号分离.

An Quick Introduction to R and its Application for Bioinformatics

More About Auto-encoder

醫學美學期末報告醫學美學之我見---- 談單眼皮變雙眼皮

指導教授:陳正宗終身特聘教授指導學長:李應德老師、高聖凱、李家瑋、江立傑、簡頡學生:黃文生日期:

簡單迴歸分析與相關分析莊文忠副教授世新大學行政管理學系計量分析一(莊文忠副教授) 2019/8/3.

之前都是分类的蒸馏很简单。然后从分类到分割也是一样，下一篇是检测的蒸馏

陪他走過生命幽谷林伯聰　諮商心理師.

Presentation transcript:

Visualizing and Understanding Neural Machine Translation ACL 2017 Visualizing and Understanding Neural Machine Translation Yanzhuo Ding, Yang Liu, Huanbo Luan, Maosong Sun

Machine Translation MT: using computer to translate natural languages 布什与沙龙举行了会谈机器翻译是利用计算机翻译自然语言的一种技术。 Bush held a talk with Sharon

Neural Machine Translation Black Box 随着技术的发展，近几年 NMT越来越受到人们关注，目前大多数的神经机器翻译都是基于注意力的encoder-decoder模型，在encoder过程中，模型将输入利用LSTM生成隐状态，通过注意力机制，将encoder的隐状态作为context输入到decoder中，利用LSTM生成目标语言单词。。目前NMT的翻译效果已经远远超出了传统的统计机器翻译方法，成为了学术界和工业界的主流方法。然而在模型中传递的是浮点数，没有语言学的解释，因此NMT难以理解和调试。因此人们

Previous Work Attention: relevance between input and output 非常好，但是只有encoder和decoder的隐层之间的对齐信息。 (Bahdanau et al., 2015)

Previous Work First-Derivative Saliency: using gradient to measure relevance. 非常好，但是只有encoder和decoder的隐层之间的对齐信息。 (Li et al., 2016)

Previous Work Layer-wise relevance propagation: decomposing outputs into sum of relevance scores 非常好，但是只有encoder和decoder的隐层之间的对齐信息。 (Bach et al., 2015)

Our Work Visualizing and interpreting NMT using LRP method Helping to analyze translation errors

An Example

An Example

Neuron-level relevance The relevance between two neuron.

Vector-level relevance The relevance between two vectors.

Relevance vectors A sequence of vector-level relevance of its contextual words

Weight ratio Matrix multiplication Element-wise multiplication Maximization

LRP Algorithm in NMT Algorithm: Layer-wise relevance propagation for NMT

Visualization of NMT model Source Side 近两年来，美国 1 2 3 4 5 6 jin liang nian lai , meiguo 近两年来，美国 jin liang nian lai , meiguo 1 2 3 4 5 6

Visualization of NMT model Target Side my visit is to pray 1 2 3 4 5 我参拜是为了祈求 my wo canbai shi weile qiqiu 1 2 3 4 5 1

Translation error analysis Word Omission vote of confidence in the senate </s> 5 6 7 8 9 10 11 12 参众两院信任投票 </s> the senate 4 5 6 7 8 9 10 11 10 11 can zhong liang yuan xinren toupiao </s>

Translation error analysis Word Repetition

Translation error analysis Unrelated Words

Translation error analysis Negation Reversion

Conclusion We propose to use layer-wise relevance propagation to visualize and interpret NMT Our approach can calculate the relevance between arbitrary hidden states and contextual words It helps us to analyze translation errors and debug the model

Thanks