中国科学院计算技术研究所CWMT 2008评测技术报告 刘洋,米海涛,冯洋,夏天,涂兆鹏,吕雅娟,刘群 {yliu, htmi, fengyang, xiatian, tuzhaopeng, lvyajuan, liuqun}@ict.ac.cn 2008年11月27日 CWMT 2008评测研讨会,北京
流程 译文 Silenus 译文 Bruin 源文 译文 系统融合 Mencius 译文 Change 译文 2008年11月27日 CWMT 2008评测研讨会,北京
参评系统 系统 简述 Silenus 基于压缩森林的树到串翻译系统 Bruin 基于最大熵括号转录语法的翻译系统 Mencius 基于双语短语部分匹配策略的翻译系统 Change 基于层次短语的翻译系统 SentComb 句级系统融合系统 WordComb 词级系统融合系统 2008年11月27日 CWMT 2008评测研讨会,北京
Silenus Silenus是基于压缩森林的树到串系统。 压缩森林能够高效地表示大量的句法分析树。 压缩森林是一个超图,超图中的节点是标记,超边是带概率的上下文无关规则。 选自Mi et al 2008(a)的幻灯片 2008年11月27日 CWMT 2008评测研讨会,北京
Silenus:实验效果 实验结果表明,在训练集和测试集中引入压缩森林,能够很好地解决句法分析歧义性大、准确度低对树到串模型的负面影响。 选自Mi et al 2008(b)的幻灯片 实验结果表明,在训练集和测试集中引入压缩森林,能够很好地解决句法分析歧义性大、准确度低对树到串模型的负面影响。 2008年11月27日 CWMT 2008评测研讨会,北京
Bruin 利用最大熵模型解决二元分类问题 顺序拼接 逆序拼接 中国 的 经济 发展 利用最大熵模型解决二元分类问题 中国 的 经济 发展 China ‘s economy the development of 顺序拼接 逆序拼接 China ‘s economy the development of the development of China ‘s economy Bruin使用的是双语短语,将短语间的调序问题视作二元分类问题:顺序拼接或逆序拼接。 利用双语短语的边界词信息,使用最大熵模型解决二元分类问题。 2008年11月27日 CWMT 2008评测研讨会,北京
Mencius 于 昨天 抵达 泰国 于 昨晚 抵达 布拉格 于 X1 抵达 X2 昨天 泰国 arrived in Prague last night 于 X1 抵达 X2 昨天 泰国 arrived in X2 X1 yesterday Thailand arrived in Thailand yesterday Mencius在使用短语表时使用了部分匹配策略,能够更充分地利用短语表,在一定程度上缓解了数据稀疏的问题。 2008年11月27日 CWMT 2008评测研讨会,北京
X -> <在 X1 的 X2, the X2 in the X1> Change 加强 在 经济 领域 的 合作 。 strengthen the cooperation in the economy field . X -> <在 X1 的 X2, the X2 in the X1> Change是基于层次短语的系统 2008年11月27日 CWMT 2008评测研讨会,北京
SentComb cat sat the mat 不会产生新的译文! 站 在 垫子 上 的 猫 cat sitting on the mat hat on a mat 句级系统融合从各系统输出的译文中挑选出一个“最好”的译文,实际上等价于Reranking。 我们使用的是线性模型,主要特征是语言模型。 2008年11月27日 CWMT 2008评测研讨会,北京
WordComb:重复Rosti的工作 cat sat $e the mat sitting on hat a cat(2) sat(1) 3 4 5 mat(3) 6 hat(1) sitting(1) $e(1) a(1) cat sat on the mat 会产生新的译文! 2008年11月27日 CWMT 2008评测研讨会,北京
参加项目 我们参加了全部的评测项目 评测项目 领域 参评系统 机器翻译 汉英新闻 Bruin、Change、Mencius和WordComb 英汉新闻 Bruin、Change、Mencius、Silenus和SentComb 英汉科技 Bruin、Change、Mencius和SentComb 系统融合 SentComb 2008年11月27日 CWMT 2008评测研讨会,北京
数据处理 我们只使用了评测组织方提供的数据。 所采用的主要数据处理工具: ICTCLAS,汉语词语切分 Charniak’s parser,英语句法分析 GIZA++,词语对齐 SRILM,语言模型 2008年11月27日 CWMT 2008评测研讨会,北京
评测前的实验结果 项目 系统 BLEU 汉英新闻 Bruin 0.2071 Change 0.1985 Mencius 0.1976 WordComb 0.2085 英汉新闻 0.2756 0.2770 0.2711 Silenus 0.2939 SentComb 0.2951 英汉科技 0.2503 0.2489 0.2457 0.2551 2008年11月27日 CWMT 2008评测研讨会,北京
正式评测成绩 项目 领域 参评系统 类别 BLEU 机器翻译 汉英新闻 WordComb primary 0.2264 Bruin contrast 0.2158 Change 0.2060 英汉新闻 Silenus 0.2622 SentComb 0.2562 0.2419 英汉科技 0.4618 0.4530 0.4503 系统融合 0.2873 2008年11月27日 CWMT 2008评测研讨会,北京
总结 我们参加了CWMT 2008的全部评测项目,使用了4个机器翻译系统和2两个系统融合系统,取得了比较好的成绩。 我们将进一步完善现有系统,着重对系统融合技术进行改进。 2008年11月27日 CWMT 2008评测研讨会,北京
谢谢! 2008年11月27日 CWMT 2008评测研讨会,北京