Non-Projective Parsing for Statistical Machine Translation

Slides:



Advertisements
Similar presentations
办公室保健指南. 减少辐射篇 ❤显示器散发出的辐射多数不是来自它的正面,而是侧面和后面。因此,不要 把自己显示器的后面对着同事的后脑或者身体的侧面。 ❤常喝绿茶。茶叶中含有的茶多酚等活性物质,有助吸收放射性物质。 ❤尽量使用液晶显示器。
Advertisements

集团公司火力发电厂热工自动控 制系统的投入情况和问题分析 东北所热自室. 自动控制系统是机组热工专业管理水 平和设备状态的集中体现,一台机组 的自动投入率和自动调节品质体现了 机组的整体水平。同时,自动控制效 果的优劣,也是机组节能降耗目标的 实现手段和基础。
1 教師敘薪 Q & A 教師敘薪 Q & A 新竹縣立新湖國中 陳淑芬 新竹縣立自強國中 楊美娟
103 學年度縣內介聘申請說明會 南郭國小 教務主任張妙芬.  重要作業日程 : 1 、 5/1( 四 ) 前超額學校 ( 含移撥超額 ) 備文函報縣府教 育處輔導介聘教師名單 2 、 5/7( 三 ) 超額教師積分審查( 9 : : 00 、 13 : : 00 )。 3.
大學甄選申請入學 〃備審資料 〃面試. 確認你的追求對象 學校環境概況 系別特質 有無交換學生 未來出路 性質相似的科系要清楚之間的差別 ex: 社會福利學系,社會工作學系, 社會學系.
人文行動考察 羅東聖母醫院 老人醫療大樓 吳采凌 黃玨宸 劉映姍 陳嫚萱.
焦點 1 陸域生態系. 臺灣的陸域生態系 臺灣四面環海 黑潮通過  高溫, 雨量充沛 熱帶, 亞熱帶氣候.
資源問題與環境保育 第 6 章. 學完本章我能 ……  知道中國土地資源的問題與保育  了解中國水資源的問題與保育  知道中國森林資源的問題與保育  能分析自然環境和人文環境如何影響人類 的生活型態  說舉出全球面臨與關心的課題.
魏 饴. 处级干部培训班讲座 一、卓越干部的德行素质  常修为政之德、常思贪欲之害、常怀律己之心!  孔老夫子有个观点 “ 为政以德,譬如北辰居其所而众星拱之。 ”  司马光《资治通鉴》 “ 才者,德之资也;德者,才之帅也。 ” “ 德 ” 胜 “ 才 ” 谓之 “ 君子 ” , “ 才 ”
景美樣品房工程變更 / 追加請款 / 說明 102/08/09 樣品房停工 102/10/10 樣品房完工 102/09/26 向工務部提出 追加工程估價單 102/10/25 經工務部審核 轉送採發部門 102/09/03 工地會議 確認後續施工方式 102/11/ /11/ /12/09.
統計之迷思問題 保險 4B 張君翌. 迷思問題及教學者之對策 常見迷思概念教學者之對策 解題的過程重於答案 例 : 全班有 50 位同學,英文不及格的有 15 人,數學不及格的有 19 人,英文與 數學都及格的有 21 人。請問英文與數 學都不及格的有幾人? 老師常使用畫圖來解決這樣的問題,英文和.
一、真愛密碼 二、尋求真愛 三、有自尊的愛. 。如果雙方對愛情產生 質疑、困惑時,則表示 彼此之間的愛情關係仍 有 待加強或釐清,千萬別 急著為自己的人生大事 下決定。 我是一個 16 歲的未婚媽媽,發現自 己懷孕時,已經五個月大了,我知 道自己沒能力照顧孩子,在驚訝之 於,大人們只好坦然接受,幫我找.
大地遊戲王 課程實錄.
社團法人台南市癲癇之友協會 講師:王乃央老師
寓言 何謂寓言? 寓言中的主角選擇 以動物為主角,形象分析—以成語及諺語中來歸納動物形象 以人為主角,形象分析
第七章 外營力作用 第一節 風化 第二節 崩壞 第三節 侵蝕與堆積.
第一冊第二課 師 說 韓愈.
物理治療師之僱傭關係 九十二年四月十二日.
勿讓權利睡著- 談車禍之損害賠償與消滅時效.
二、開港前的經濟發展 (一)土地開墾和農業發展 1.漢人移民的遷徙與拓墾 (1)遷徙 A.居住區 a.泉州人最多:沿海
設計新銳能量輔導 實習期中感想 實習生:賴美廷 部落格:TO13004.
加強水銀體溫計稽查管制及回收 回收作業須知及緊急應變措施
日本的〈地獄劇〉 與 中國的〈目連戲〉.
授課教師:羅雅柔 博士 學員:吳沛臻/邱美如/張維庭/黃茹巧
九、更上一層 林黛玉葬花詞(節錄) 五美吟 黛玉 回目次.
第4章 分錄及日記簿 4-1 借貸法則 4-2 日記簿的格式及記錄方法 4-3 分錄的意義及記錄方法 4-4 常見分錄題型分析
國小教師檢定經驗分享 分享者:胡瑋婷 現職:國語日報語文中心寫作班教師 閱讀寫作營教材編輯及任課講師 榮獲「教育部教育實習績優獎」全國第三名.
一、信息加工概述 1、信息技术是指与信息的获取、加工、表达、交流、管理、评价相关的技术。 2、信息加工的重要性: 原始信息 加工的信息
民主政治的運作
教育與學習科技學系 103學年度課程說明 103年9月2日.
國有不動產撥、借用法令與實務 財政部國有財產局 接收保管組撥用科 蔡芳宜.
公務人員 育嬰留職停薪權益.
欢迎使用本课件 教材简介: 名 称:人工智能原理与应用 作 者:张仰森 出版社:高等教育出版社 章 节:共十章 主讲教师: 宗春梅.
大學教、職員之法義務規範與法律效果 台南地檢署林仲斌.
第三課 政府的組織、功能與權限 一、內閣制 壹、民主國家的政府體制 二、總統制 三、混合制 四、小結 一、前言 貳、我國的中央政府體制
明代開國謀臣 劉伯溫 組員:吳政儒 林天財 王鈴秀 陳冠呈 施典均 李孟儒.
中央與地方教育權限 第八組 王湘婷 邱淑婷 全 彥 洪英博
第十三屆 Step.1 我們的目標 Step.2 我們的角色 Step.4 權利與義務 義務 權利 年繳會費五百元整
卓越校長的前瞻與新思維教育 謝傳崇 國立新竹教育大學教育學系.
散文選及習作 [墨池記] 曾鞏 國二甲 S 洪國勛 指導教授:胡翰平 老師.
中國宦官 鄭永富 鄭雅之 莊尉慈.
避開鳥事、走好運! 懂卜卦的人,一輩子不吃虧!
财务管理.
盧世欽 律師 鼎禾律師聯合事務所 民國 一○四 年 九 月 十八 日
行政作用法 行政命令.
第 五 課 愛蓮說 1.課文導讀 2.作者介紹 3.課文 4.注釋 5.應用練習 6.習作.
植物保护 课程整体设计 汇报 申报省级精品资源共享课建设 植物保护课程组.
嘉義市100學年度特色學校計畫審查- 樂活地球村
教學意見調查 線上填答說明 (104學年度第2學期).
提升機密文書處理能力以貫徹執行個人資料保護 臺北市政府政風處 股長 呂佩毓
双创工作从娃娃抓起——信息通信科普深入校园
政府扶持资金通览 技术改造篇.
雕塑你我他.
最後,是什麼決定一個領導者的成敗 這是一步思考與行動指南
本科生医保资料的提交.
ZZX_MT系统评测报告 巢文涵 李舟军 北航计算机学院
統計圖表的製作.
CWMT 2008 评测技术报告 机器智能与翻译实验室 哈尔滨工业大学
形式句法理论 乔姆斯基生成转换句法 的发展与现状.
《结构力学认知实验》(授课形式)的上课时间改为: 5月5日(周二)晚上18:00~19:30和19:30~21:00,
《结构力学认知实验》(授课形式)的上课时间改为: 5月7日(周四)晚上18:30~20:00和20:00~21:30,
畢業資格審查系統 操作步驟說明.
國民年金 np97006.
新制退休實務計算說明- 現職人員退休範例說明
孔融《与曹操论盛孝章书》.
106 學年度新生入學說明會 國立臺灣海洋大學 教務處簡介
批次請(休)假單 功能路徑:[請假作業專區]→[批次請(休)假單] 功能說明:提供使用者線上申請/維護 多天、不連續請(休)假
學士學位畢業論文說明 逢 學 大 甲 土 理 管 地 2009/10/05.
高雄市97年度國民小學閱讀計畫創新教學-教案達人創新教學方案
Presentation transcript:

Non-Projective Parsing for Statistical Machine Translation Xavier Carreras and Michael Collins MIT CSAIL EMNLP2009 报告人:肖欣延

大纲 背景 TAG简单介绍 本文的工作 总结 2019/8/28 ICT讨论版

背景 非句法短语在翻译中是有用的,但在句法模型中,通常无法使用这部分短语 本论文是基于TAG的模型,允许灵活的拼接操作。即能使用句法信息,又能使用非句法短语 作者之前单语上做了TAG (CoNNL 2008, best paper) 的工作,本文是该文章的工作在机器翻译上的使用 2019/8/28 ICT讨论版

Ordinary TAG initial tree auxiliary tree 操作 a2 a1 b1 b2 substitution adjunction NP a2 a1 D D ↓ N the girl b1 ADJ b2 N ADV ADJ * ADJ N * very pretty 2019/8/28 ICT讨论版

Ordinary TAG a2 a1 b1 b2 NP NP D D ↓ N D ↓ N the girl the girl ADJ N ADV ADJ * ADJ N * 操作:Substitution a1 -> a2 very pretty 2019/8/28 ICT讨论版

Ordinary TAG a2 a1 b1 b2 NP N NP D girl D ↓ N D the girl the ADJ N ADV * ADJ N * 操作:adjunction b2 (1)移开n节点 very pretty 2019/8/28 ICT 09 讨论班

Ordinary TAG a2 a1 b1 b2 NP N NP D girl D ↓ N D N the girl ADJ N * the pretty ADJ b2 N ADV ADJ * ADJ N * 操作:adjunction b2 (1)移开n节点 (2)粘贴b2 very pretty 2019/8/28 ICT讨论版

Ordinary TAG a2 a1 b1 b2 NP NP D D ↓ N D N the girl ADJ the N pretty ADV ADJ * ADJ N * 操作:adjunction b2 (1)移开n节点 (2)粘贴b2 (3)将n节点粘贴回来 very pretty 2019/8/28 ICT讨论版

Ordinary TAG a2 a1 b1 b2 NP NP D D ↓ N D N the girl the ADJ N girl ADV very pretty ADV ADJ * ADJ N * 操作:adjunction b1 very pretty 2019/8/28 ICT讨论版

TAG (Carreras et.al, 2008) 基本单元是spine,叶节点不含非终结符 Spine的连接通过粘贴操作 S NP VP EX V NP NPB there is DT N no hierarchy 基本单元是spine,叶节点不含非终结符 Spine的连接通过粘贴操作 2019/8/28 ICT讨论版

本文的贡献 TAG-based 翻译模型 重排序模型采用十分灵活的非投射性的连接操作 不对短语表的条目进行限制 目标端使用基于句法的语言模型 控制连接操作 高效解码 2019/8/28 ICT讨论版

S-phrase 语法结构 NP PP NPB IN N 源语言 hierarchy of 对齐信息 hierarchy der 目标语言 2019/8/28 ICT讨论版

S-phrase extraction 训练语料:源端串+目标端+目标端树 S-phrase:源语言+目标语言+对齐信息+语法结构 S S NP NP VP PP NP VP NPB NP NPB EX V DT EX V DT N IN N there is no there is no hierarchy of discrimination es gibt keine hierarchy der diskriminierung es gibt keine 训练语料:源端串+目标端+目标端树 S-phrase:源语言+目标语言+对齐信息+语法结构 2019/8/28 ICT讨论版

推导 Step1 :首先获得短语切分 Step2: 使用adjunction操作连接 S VP NP VP ADVP NP ADVP we must also these criticisms seriously take wir mussen auch diese kritik ernst nehmen Step1 :首先获得短语切分 Step2: 使用adjunction操作连接 2019/8/28 ICT讨论版

模型 score(d) = scoreLM(d) + scoreP (d) + scoreSYN(d) + scoreR(d) scoreSYN 依存语言模型分数[Charniak 2001] scoreR adjunction操作分数 2019/8/28 ICT讨论版

挑战 所有的调序都是允许的 两个挑战 限制调序 搜索 2019/8/28 ICT讨论版

ScoreR 判别式依存模型 采用判别模型[McDonald et al. 05],判别连接的时候,是调序还是不调序 VP NP V DT we must also these criticisms take wir mussen auch diese kritik ernst nehmen PRP V RB DT N RB V 采用判别模型[McDonald et al. 05],判别连接的时候,是调序还是不调序 2019/8/28 ICT讨论版

Π-constituent 限制 Π-constituent :头节点及所有后代节点 NP PP NP VP NPB NP NPB EX V DT N IN N there is no hierarchy of discrimination es gibt keine hierarchy der diskriminierung 2019/8/28 ICT讨论版

解码 projective 采用span non-projective 采用bit-string 表示覆盖情况 [wir mussen auch] [diese kritik] [ernst] [nehmen] NP/0001100 VP/0000001 VP/0001101 these criticisms V V NP take take these criticisms projective 采用span non-projective 采用bit-string 表示覆盖情况 传统解码同一个stack(Si)存放覆盖长度(i)一样的翻译。这里进行细分,Sij(j表示第j个词被覆盖) 2019/8/28 ICT讨论版

实验结果 方向:German to English 语料:Europarl data (750K training sentences) Development System Bleu score Syntax-based 25.2 Syntax (no disc. model) 23.7(-1.5) Syntax (no Π-c constraint) 24.4(-0.8) Test System Bleu score (Pharaoh) 24.58 Syntax-based system 25.04(+0.46) 2019/8/28 ICT讨论版

总结 TAG-based 句法模型 允许非投射性的连接操作 判别式依存模型 可惜的是翻译效果提高并不显著 2019/8/28 ICT讨论版