孙加东 梁华参 赵铁军 机器智能与翻译实验室 哈尔滨工业大学

Slides:



Advertisements
Similar presentations
“ 啤牌 ” 中的概率. 五張牌組合的牌型 所有五張牌的組合, 按以下秩序, 由大至小排 行分為不同牌型 : 同花順 > 四條 > 夫佬 > 花 > 蛇 > 三條 >2 pairs >1 pair 在不同的撲克牌遊戲中,例如 show hand, 鋤大 D, 十三張, 等等都會以哪 些組合來決定勝負.
Advertisements

我的未来不是梦 攀枝花市经贸旅游学校. 1. 文中案例王萍苦恼的原因是 什么? 2. 你有哪些办法可以帮助王萍? 导入 思考  谁来帮帮她?
電腦與問題解決 5-1 電腦解題概論 5-2 電腦解題程序 5-3 演算法概論.
学号: 姓名:戴哲河 信息科学与技术学院 交通信息工程及控制2班
基本概論 Basic concepts.
Ch.16 運輸科技 16-1 運輸工具 16-2 智慧型運輸系統 16-3 物流系統.
高瞻計畫(第二期) 永續環境相關新興科技融入 高中課程及教學之研究
中医养生康复学绪论 任课教师:刘 婕 单 位:郑州工业应用技术学院 联系电话: ;
中国职教学会质量保障与评估研究会2016年学术年会
毛峰教授 北京师范大学教授,博士生导师 国家社科基金项目专家 北京华文教育顾问
一、信息加工概述 1、信息技术是指与信息的获取、加工、表达、交流、管理、评价相关的技术。 2、信息加工的重要性: 原始信息 加工的信息
幼儿园一日活动的 规范和优化 浙江省教育厅教研室 虞莉莉 二O一二年四月.
CWMT’08统计机器翻译研讨会自动化所技术报告
全国“三新”作文研讨会成果交流 罗外初中部 曾祎闱.
動畫與遊戲設計 Data structure and artificial intelligent
電影裡的生命教育 主講人:李偉文 (牙醫師.作家.環保志工).
机器翻译原理与方法 第五讲 基于句法的统计机器翻译方法
Ch10 人力資源管理 管理學:整合觀點與創新思維3/e.中山大學企管系 著.前程文化 出版.
“携手灭烟,拥抱晴天”无烟环境倡导活动 媒体倡导模式及发动要点 新探健康发展研究中心 范彩虹
用“自言自语法”提高学生 英语口头表达能力 李奉栖.
教師晨會經驗分享 小學雙語實驗教育實施現況之研究 計畫主持人:陳金粧校長、馮思義副校長 指導顧問:陳惠邦教授、鄧奮忠主任、呂慧芬組長
渤海商品交易所 丹东玉米交易中心 全国统一客服电话:
班級:行流四甲 組員:497D0004何筱瑩 497D0016鄧宜欣 497D0044呂亭儀 497D0056黃 琪 497D0063賴依淩
揭秘 庄家 股市中的 为什么你的股票一买就跌,一卖就涨? 为什么出了利好,股价反而下跌? 为什么有的股票一直涨停?
102學年度預算編製說明會 主辦單位:會計室 102/02/22.
基于改进的依存树到串的汉语纳西翻译模板抽取方法
网络信息资源的开发与设计 主讲教师 罗双兰 广西师范大学教育科学学院.
关于英语教学中课外阅读的教学反思 上海市中职英语中心组 沈毅.
乳猪断奶后拉稀,掉膘与教槽料.
好好國際物流股份有限公司 全球運籌物流服務建議 中 華 貨 物 通 關 自 動 化 協 會 理 事 長 劉 陽 柳 二○○二年五月十五日
大纲 汉英新闻领域翻译评测 概述 系统流程 预处理和后处理 测试结果 系统融合评测. 张大鲲 孙乐 中国科学院软件研究所
Minimum Spanning Trees
2017 IOS系列商务报告通用模版.
PRIMT: A Pick-Revise Framework for Interactive Machine Translation
第9课 北美大陆上的新体制 导入新课 新课教学 课堂小结 知识结构 巩固练习
第8章 列舉器與集合 注意: 本投影片僅供本書上課教師使用,非經同意請勿上網轉載或供拷貝.
强连通分量 无向图 1、任意两顶点连通称该图为连通图 2、否则将其中的极大连通子图称为连通分量 A D C B E 有向图
第4章 网络互联与广域网 4.1 网络互联概述 4.2 网络互联设备 4.3 广域网 4.4 ISDN 4.5 DDN
1 Introduction Prof. Lin-Shan Lee.
计算机问题求解 – 论题 堆与堆排序 2018年05月14日 数据的组织(逻辑的,物理的)均可以影响到算法的设计和性能.
汇编语言程序设计课程设计 第二次实验 DEBUG基本命令与算术运算指令
SPARQL若干问题的解释 刘颖颖
中科院自动化所评测技术报告(SYSTEM II)
学习报告 —语音转换(voice conversion)
数据挖掘工具性能比较.
基于规则抽取的 时间表达式识别.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
$9 泛型基础.
第五章 介面/集合/泛型 注意: 本投影片僅供本書上課教師使用,非經同意請勿上網轉載或供拷貝.
软件工程 第四章 软件设计 软件过程设计技术与工具.
2016 IOS系列商务报告通用模版.
张大鲲 孙乐 李文波 中国科学院软件研究所 利用压平的双语句法树进行短语重排序 张大鲲 孙乐 李文波 中国科学院软件研究所
一种处理未登录词翻译的新视角 张家俊 翟飞飞 宗成庆
Chapter 11 使用者資料包通訊協定.
政黨政治.
資料結構簡介 綠園.
数据集的抽取式摘要 程龚, 徐丹云.
作业3、4、6、7 俞天灿.
分工 赵屹东: 网站构架与各元素的修改、嵌入与布局,网站页面的制作,组内任务分配和安排,论文中网站结构部分与各部分的整合
LOGO 2018 企业公司年会庆典PPT模板 SOME ENTERPRISE COMPANY ANNUAL MEETING PPT TEMPLATE.
基于规则抽取的时间表达式识别 -英文Ⅲ 高冠吉.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
工业机器人技术基础及应用 主讲人:顾老师
基于列存储的RDF数据管理 朱敏
基因信息的传递.
所得稅法第14條、第126條修正條文 薪資所得計算方式二擇一 定額減除 特定費用減除 維持現行薪資所得特別扣除額20萬元減除方式
Non-Projective Parsing for Statistical Machine Translation
Simulink National Tsing Hua University
13-1 電腦可以協助解決哪些問題 13-2 電腦解題簡介 13-3 電腦解題規劃-演算法 13-4 認識資料結構
Presentation transcript:

孙加东 梁华参 赵铁军 机器智能与翻译实验室 哈尔滨工业大学 2008.11.28 一种面向统计机器翻译的同步文法 孙加东 梁华参 赵铁军 机器智能与翻译实验室 哈尔滨工业大学 2008.11.28

提纲 多文本文法(MTG) 基于子图的MTG 模型训练 解码 实验及结果

多文本文法

MTG推导举例

多文本文法(MTG) 基于子图的MTG 模型训练 解码 实验及结果

机器翻译与同步文法 机器翻译的任务 同步文法模型 (1) (2)

MTG模型的表达能力 不同语言间存在异构性 构造同步文法模型需要什么? 短语模型上的方法可以延用吗?

语言的异构 L: L’:

子图定义 对于一棵句法树,它的子图必须满足以下两个条件: 定义1: 子图 1.它是一个单根的树状图 2.当遍历这棵树时,子图中的任意结点和边的对应关系与原句法树一致。 子图是一个三元组< g, R, L >

子图举例

子图对的定义 子图对的定义 一个子图对是一个三元组: 其中,g是源语言的一个子图;G是与g对应的目标语言的子图,~表示两个子图叶节点的对齐关系。

双语句法树

子图对

子图对相加

子图对相加

基于子图MTG的机器翻译 (1) (2)

子图MTG系统框架 input source language sentence Bilingual parse tress Language model Decoding system Training system Sub-graph pair table output: bilingual “parse tree”

多文本文法(MTG) 基于子图的MTG 模型训练 解码 实验及结果

模型的特征(1) 用对数线性模型融合特征 特征函数:

模型的特征(2)

子图MTG模型的规则过滤 面对的问题 基于同步文法的模型通常过于庞大 子图频繁度挖掘 是否保留所有的子图对

子图频繁度 子图频繁度定义:

子图过滤

多文本文法(MTG) 基于子图的MTG 模型训练 解码 实验及结果

解码算法 1 Vector<rule> XRules; 2 for l=1 to SentLength 3 for i=0 to SentLength-l 4 j=l+i; 5 guessrule(i,j, XRules); 6 foreach rule in XRules 7 if rule exists in Graph table 8 add new rule to [X,i,j]; 9 Get k-best derivations of [X,i,j];

每个结点的k-best计算 Make a heap as a priority queue For every rule push its 1st best translation into the heap While(candi.size()<k && heap.size() != 0) candi.push back(heap.top()) pop heap push neighbors of heap.top() into heap

多文本文法(MTG) 基于子图的MTG 模型训练 解码 实验及结果

IWSLT2004测试 System BLEU-4 Pharaoh 0.3548±0.0082 Sub-graph pairs 0.3714±0.0085

一些翻译结果 Pharaoh They must compensate our losses Subgraph They will be compensation for our losses They will compensate our losses According to regulations, they will be our loss compensation According to regulations, they will compensate our losses

未来的工作 更丰富的子图信息 规则削减 -依据频繁度过滤 -合并规则 更高效搜索算法及剪枝策略

谢 谢 !