Presentation is loading. Please wait.

Presentation is loading. Please wait.

厦门大学第四届机器翻译研讨会评测系统描述

Similar presentations


Presentation on theme: "厦门大学第四届机器翻译研讨会评测系统描述"— Presentation transcript:

1 厦门大学第四届机器翻译研讨会评测系统描述
陈毅东 史晓东 周昌乐 {ydchen, mandel, 厦门大学信息科学与技术学院智能科学与技术系 2008年11月 北京

2 提纲 概述 机器翻译系统概要 系统融合方法概要 测评数据与结果 小结

3 提纲 概述 机器翻译系统概要 系统融合方法概要 测评数据与结果 小结

4 使用的融合方法和系统融合评测中使用的相同
概述 厦门大学参加了 汉英新闻领域机器翻译(开放) 汉英新闻领域系统融合 英汉新闻领域机器翻译(受限) 英汉科技领域机器翻译(受限) 使用的模型 汉英机器翻译:短语,短语+规则 英汉机器翻译:短语+规则、规则 使用的融合方法和系统融合评测中使用的相同

5 提纲 概述 机器翻译系统概要 系统融合方法概要 测评数据与结果 小结

6 机器翻译系统概要(1) 统计翻译系统 短语模型 对数线性模型 单调解码,动态规划方法
融合特征:短语翻译概率(正向/反向)、词汇化短语翻译概率(正向/反向)、语言模型、长度惩罚因子、短语惩罚因子 单调解码,动态规划方法 汉英机器翻译评测中,我们的短语翻译系统则结合了基于组块的词语调序模型

7 机器翻译系统概要(2) 规则翻译系统 基本模块: 词法分析句法分析词义消歧译文生成 采用依存文法描述英语和汉语,文法由程序来描述
词典条目大约10万 结合了部分TM技术 没有专门针对这次评测进行调整

8 提纲 概述 机器翻译系统概要 系统融合方法概要 测评数据与结果 小结

9 系统融合方法概要(1) 早在1994年就有研究者研究多引擎翻译系统。 多引擎系统的研究可以粗略地分成两类:
简单地在各系统的输出中选出一个最佳的结果。 从各系统的输出中各选取最佳片段并构成新的结果。 由于融合粒度更细,第二类方法常常可以获得更好的融合效果。 第二类系统融合技术需要解决的两个问题: 必须从候选翻译中抽取出与原文相对应的翻译片段。 必须在这些可用的翻译片段中筛选并组合成新的翻译结果。

10 系统融合方法概要(2) 参考文献 Chen Yu, Andreas Eisele, Christian Federmann, Eva Hasler, Michael Jellinghaus, and Silke Theison Multi-Engine Machine Translaiton with an Open-Source Decoder for Statistical Machine Translaiton. In: Proceedings of the Second Workshop on Statistical Machine Translation, Prague, 平行语料库 候选翻译 原文 新句对 短语表 短语模型训练模块 单语语料库 语言模型 语言模型训练模块 短语翻译解码模块 译文

11 提纲 概述 机器翻译系统概要 系统融合方法概要 测评数据与结果 小结

12 评测数据与结果(1) 使用的外部工具 GIZA++工具包对双语语料进行词对齐,训练模式是15H53545
使用SRI语言模型工具包来训练语言模型 使用CRF++工具包来训练组块分析器(汉英测评中)。

13 评测数据与结果(2) 汉英新闻机器翻译评测 数据 结果 来源 量 双语句库
训练数据(common部分), LDC2005T06, LDC2003E07, LDC2006T04, LDC2003T17, LDC2004T07, LDC2002T01, LDC2002E18, LDC2003E14 96万句对 树库 LDC2005T01 1.8万句 英语语料 LDC2007T07 (xinhua part) 275M词 双语句库的英文部分 18M词 系统 BLEU4 NIST5 时间(s) xmu-constrast-memt(统计+规则) 0.2412 7.5082 xmu-primary-pumpkin(统计) 0.2390 7.8401

14 评测数据与结果(3) 汉英新闻系统融合评测 根据诸系统在ssmt2007测试集上的成绩仅挑选了前4名的系统参与融合
采用的数据情况同汉英新闻机器翻译评测 结果 constrast系统使用和汉英新闻机器翻译评测相同的参数,primary系统则将长度惩罚因子参数增加到原来的两倍。 系统 BLEU4 NIST5 时间(s) xmu-primary-memt1 0.2721 7.4408 xmu-constrast-memt2 0.2321 5.1955

15 评测数据与结果(4) 英汉新闻机器翻译评测 数据情况 结果 来源 量 双语句库 所提供的训练数据(common部分) 61万句对 汉语语料
双语句库的中文部分 8M词 系统 BLEU5 NIST6 时间(s) xmu-primary-memt(统计+规则) 0.2369 7.9624 xmu-constrast-neon(规则) 0.2263 8.3199 36.45 pbtm(统计) 0.2020 -

16 评测数据与结果(5) 英汉科技机器翻译评测 数据情况 结果 xmu-constrast-memt2系统仅使用科技语料 来源 数据量 双语句库
所提供的训练数据(common部分) 61万句对 所提供的训练数据(中信所语料) 30万句对 汉语语料 双语句库的中文部分 14M词 系统 BLEU5 NIST6 时间(s) xmu-primary-memt1 (统计+规则) 0.4026 xmu-constrast-memt2 (统计+规则) 0.4004 xmu-constrast-neon (规则) 0.2816 9.1400 58.23

17 提纲 概述 机器翻译系统概要 系统融合方法概要 测评数据与结果 小结

18 小结 本次评测我们参加的系统在技术上没有太多的进步。 本次评测我们所使用的系统融合技术太简陋,是将来努力的重点。

19 陈毅东 史晓东 {ydchen, mandel}@xmu.edu.cn
谢谢大家! 陈毅东 史晓东 {ydchen,


Download ppt "厦门大学第四届机器翻译研讨会评测系统描述"

Similar presentations


Ads by Google