Machine Translation for Conversational Texts

Slides:



Advertisements
Similar presentations
L5-L6 Review Oct. 30, Adj. as predicate 1.She is tall and pretty. 2.His house is pretty but very small. 3.Is your book expensive ? (try different.
Advertisements

語言測驗與評量教學.
See You T o r o m r w o ——BY 胡琼鸯 林岚.
第三章及第四章資產負債表的重點整理 取材自1.課本 2.鄭丁旺中會第九版 3.營業員題庫重點.
東風西合一堂 姊妹学校情谊深长 東風西路小學李海鷹副校長 合一堂學校 梁秀芳副校長
苏炳华 教授 上海第二医科大学 生物统计学教研室
国家自然科学基金项目申请 经验交流与心得体会
高考主题讲座 高考语文 董 腾.
-CHINESE TIME (中文时间): Free Response idea: 你周末做了什么?
最新消息插播! 意見反應: 我是貴校學生的家長,請問貴校該給工讀生的薪水何時才肯發呢?現在已經是十一月中了,九月十月的薪水還沒入帳我們不知道是卡在哪個環節,但貴校是否知道有多少同學需要這筆錢去過生活、繳納房租? …………………………………………………….? 請各位報帳同仁、專兼任助理們務必養成平時定期清帳的習慣,不要等到年終或結案前才開始緊張。
一、信息加工概述 1、信息技术是指与信息的获取、加工、表达、交流、管理、评价相关的技术。 2、信息加工的重要性: 原始信息 加工的信息
中国历史 七年级下册.
MORE THAN HONEY 采 得 百 花 成 蜜 后 吕超逸
性理釋疑(1—30題) 後學 阮章輝 學講.
學校護理專業發展數據說~ 學校護理的數據迷雲
2014年11月12日: 日程 中国学生的采访 Model 考试 复习:怎么提高文章水平? 大学面试:六个问题.
三、教师专业化及其标准 (一)教师专业化运动的兴起 (二)教师专业发展 (三)专业化教师的个人品质.
二十一世紀的知識人 高 希 均 美國威斯康辛大學榮譽教授 財團法人知識經濟與管理研究院董事長 淡江大學「名人講座」 2005年11月21日
华东师范大学软件学院 王科强 (第一作者), 王晓玲
青春期男生女生交往.
代表机构年报操作指南 (代表机构端) 二〇一一年二月.
第四课 我国政府受人民的监督 第二框 权力的行使:需要监督.
欢迎再次走进 思想政治的课堂.
金属学与热处理 主讲: 杨慧.
世界各国的经济支柱产业 09工商一班 收集资料:盛秀秀 09B 李艳君 09B
从2008年度时尚先生看我们的时代精神方向.
Relation Detection And Recognition
學習行為觀察與評估 講 師:陳怡華.
你 今 天 累 吗 ? 坪山高级中学心理教师 张婧乔.
第七單元 大眾運輸好方便 凡事小心才安全.
罗湖区第二届智慧杯中学政治学科小课题研究
对外汉语写作课教学.
3.实行基层民主自治的意义   ①实行基层民主自治,以保证人民群众 依法直接行使民主权利,管理基层公共事务 和公益事业,是人民当家作主最有效的途径。   ②是社会主义民主最为广泛而深刻的实践,也是发展社会主义民主的基础性工作。
Chapter 8 Liner Regression and Correlation 第八章 直线回归和相关
你的潜能是无限的 ——高三心理辅导.
项目六 职业生涯规划的方法与步骤.
AIS Project hanyu Stage 6 Writing Skills
Semantic-Synaptic Web Mining: A Novel Model for Improving the Web Mining 報告者:陳宜樺 報告日期:2015/9/25.
深層學習 暑期訓練 (2017).
MovieBot: Booking Tickets Easily
Visualizing and Understanding Neural Machine Translation
Unit title: 买东西 - Shopping
Calling about an apartment for rent II Objectives
Source: IEEE Access, vol. 5, pp , October 2017
Write a letter in a proper format
Guide to Freshman Life Prepared by Sam Wu.
Decision Support System (靜宜資管楊子青)
Word-Entity Duet Representations for Document Ranking
Yonghui Wu, Mike Schuster, Zhifeng Chen, Quoc V. Le, Mohammad Norouzi
软件测试 第3章 测试用例设计 Kerry Zhu
Decision Support System (靜宜資管楊子青)
“把”字句 by Lin Guo.
解读设题意图,探究阅读策略 年高考试卷题型(阅读理解)分析及对策
—— 周小多.
淑明女子大學 在哪裡?. 淑明女子大學 在哪裡? 學校週遭 第一次 剛到淑大時?
改进教法, 指导学法; 扩大输入, 改革评价. 广州市第43中学 黄小红.
Unit title: 学校 School Area of interaction focus Significant concepts
Unit title: 买东西 - Shopping
Research 裴澍炜 Shuwei Pei Tel:
第八單元 清晨摸黑騎鐵馬 反光配件要加碼.
爬蟲類動物2 Random Slide Show Menu
李宏毅專題 Track A, B, C 的時間、地點開學前通知
九月十七日 Do now-写中文 Who Name also is/are/am friend.
Introduction of this course
More About Auto-encoder
Speaker : YI-CHENG HUNG
课堂变革的核心要素 浙江省教育厅教研室 张 丰.
WiFi is a powerful sensing medium
Gaussian Process Ruohua Shi Meeting
‘人因罪與神隔絕’ 左邊代表每一個人像你和我。 黑暗代表我們的罪。 聖經說: 世人都犯了罪,虧缺了神的榮耀。 (羅3:23)
Presentation transcript:

Machine Translation for Conversational Texts Dr Xiaojun Zhang University of Stirling, UK

Machine Translation

Speech Translation

Statistical Machine Translation

Why? Why Chinese MT is worse than non-Chinese MT? IWSLT2015:

Chinese makes extensive use of different tones. Shishi(“试试/实施/事实/实时/时时/石狮/事事/史诗/适时/时事/湿湿/逝世/世事/石室/十世/誓师/施食/失事/诗史/施事/史实/诗诗/师师/十时/师士/矢石/嗜食/事势/实事/失实/…”) Chinese has no spaces between words. 江南大学 or 江南/大学? Chinese lacks inflection - “吃了没?” - Did you eat? - “吃了.” - Yes, I did. - “还想吃吗?” - Do you want to eat more? – “明天再吃.” - No, I’ll eat it tomorrow.

Dropped Pronoun Test Set Baseline 18.76 Oracle 22.98

How? How to predict the dropped pronouns? How to generate the dropped pronouns? How to translate the dropped pronouns?

Data Sets

DP Annotation 我 DP-annotated Chinese Corpus

DP Generation Detection Prediction DP position detection -> sequence labeling RNN: Prediction Specific DP prediction -> word class classification Feed-forward NN with 4 layers

DP Translation DP-inserted input (DP-ins. TM) Subjective personal pronoun DP-inserted input (DP-ins. TM) Train a translation model based on the parallel corpus which source side is DP-annotated. DP-generated input (DP-gen. Input) Pre-process the input sentence by inserting possible DPs with the DP generation model.

Evaluation

Results Analysis

Thanks xiaojun.zhang@stir.ac.uk