黃居仁 中央研究院語言學研究所 92年9月10日 「語言座標」研習營

Slides:



Advertisements
Similar presentations
1 南郭國小 翁正雄 95/06/09 教育部健康醫學學習網傳統醫 學學習館交流研習 資料來源:教育部六大學習網及簡介 健康醫學學習網及簡介.
Advertisements

1 門市服務丙級技術士 技能檢定介紹 門市服務丙級技術士報告注意事項 證照名稱:門市服務丙級技術士 發照單位:行政院勞工委員會 有效期限:終生有效 考照時間:每年一次,皆為第一梯次 1. 簡章與報名書表發售時間:每年 1 月 2. 報名時間:每年 1 月。 3. 學科考試時間:每年 3.
(一)辦桌文化起始略說: 1. 祭祀宗教 2. 生命禮儀 3. 外燴 --- 老師、師公、師傅、總鋪師 4. 搬桌搬椅時代 (二) 食物食材 1. 靠山考海 2. 基本:炒米粉、糍、檳榔 3. 小吃搬上桌 (三) 變變變 1. 調味不同 2. 師承不同 3. 地點也變.
1 論文原創性比對系統 日本報導 小保方晴子 Nature 發 表兩篇 STAP 多能性 細胞研究論文, 經日 理化學研究所 ( RIKEN )調查後, 證實兩篇論文內容涉 有複製、偽造圖片及 抄襲,但部分指控被 認為僅是無心之過。 導師一個辭職 一個.
智泉國際事業有限公司. 為什麼要做原創性比對 ?  Plagiarism Spectrum project 研究中, 問卷調查 900 位老師 #1. Clone 翻版複製之前 Submitting another’s work, word-for-word, as one’s own #2.
生源地助学贷款系统还款功能优化说明 评审三局 2015年5月.
第4章 交易性金融资产与可供出售金融资产 学习目标
人體試驗的研究倫理與法規範 Academia Sinica IRB 教育訓練 邱文聰 中研院法律所籌備處 May 2, 2007.
国际数据标准发展趋势及典型案例分析 东北石油大学 袁满 2015年7月23日.
(4F01) 陳可兒 (4F03) 張令宜 (4F05) 何秀欣 (4F14) 潘美玲
性平三法及兒少相關保護法令之介紹與宣導 華誠聯合律師事務所 蔡其龍律師.
KFLC 一个完整的翻译及BPO服务.
二、信用工具和外汇.
劳动关系法务-实操篇 规章制度修审与员工手册撰写.
第四章 心理健康.
为您扬帆,助您远航! 徽商银行特色新产品介绍. 为您扬帆,助您远航! 徽商银行特色新产品介绍.
如何让EBSCO数据库成为 您的家庭健康小医生?
硝酸盐.
长进之路 (8课) 海外校园 目 录 中国学人培训材料 信仰系列 王国显 牧师编著 第一课 重生得救 (3/6/2016)
从阿拉法特的脑死亡说开去.
論文原創性比對系統 How Research Now Works
高一年级过渡性学习 活动汇报 高一年级组 教科研室 汉滨高中.
第10章 領域、概念與分析模型 10-1 再談物件導向分析 10-2 找出類別建立領域模型 10-3 指定責任建立概念模型
公务卡使用说明.
图书馆直属党总支 党风廉政建设专题党课.
小学《人•自然•社会》 五年级教材解读 浙江省教育厅教研室 李 荆 -
财务知识培训 杨 秀 玲 2014年10月.
輕歌妙舞送黃昏 組員名單 組長:程鵬飛 組員:黎達華 劉展鵬 邱迦欣.
期考議題 單元一:資訊科技(eg上網活動)與人際關係 單元二:青少年社政參與(80後) 單元二:郊野公園與房屋政策/問題
大學多元入學方案 財務金融二 王詩茹.
第一章会计技能的内容 1.1会计技能的重要性.
国家“十一五”规划教材 数据库原理与应用教程(第3版).
『優秀是教出來的』 讀後心得報告 報告人:總務處 蔡基城.
电子支付与安全 主讲教师:梁娟娟.
教學意見調查 線上填答說明 (104學年度第2學期).
何从饮食的角度如预防感冒 印 虹.
心靈補給站 你可以「活」的「更好」 輔導主任 陳正馨老師.
授課教師: 李麗華 資訊管理系一年級B班 資料來源:資管系
伯裘書院 環保廣告能否有效 地推動環保意識.
Useful sentences 尽管他们说不同种英语,英语本族人可以理解对方.
論文原創性比對系統 為寫作與學習帶來革命性的體驗….
语义网若干基本问题的讨论 申思 2003年5月.
本体方法及其时空推理应用 胡鹤
智泉國際事業有限公司 (iGroup Taiwan)
Chinese Link Level I Part I September 2012 – June 2013
Revolutionizing the Experience of Writing to Learn
AskDBP中的实体连接方法.
論文原創性比對系統 How Research Now Works
Princeton WordNet Ontology
Omid Bakhshandeh and James F. Allen IWCS 2015
第九單元 Classes and data abstraction I
國立中興大學電機工程學系/通訊工程研究所/光電工程研究所 IEET工程及科技教育認證
第五章 古籍数字化操作 课后作业. 第五章 古籍数字化操作 课后作业 课后作业 书上 实践作业 1.阅读 第六章、第九章第1节 2.超文本(150) 3.常见流媒体文件格式(156) 4.列举图形文件格式(159-) 5.多媒体数据库的关键技术(239) 实践作业 1.简介台湾国家图书馆数位典藏计划?
Introduction to Sociolinguistics
論文原創性比對系統 1.最早是Nature Journal的比對需求而來,世界上最早的科學期刊之一,也是全世界最權威及最有名望的學術雜誌,在《自然》上發表文章是非常光榮的,《自然》上的文章經常被引用,這有助於晉陞、獲得資助和獲得主流媒體的關注。在《自然》上發表的文章需要經過嚴格的同行評審。
論文原創性比對系統 1.最早是Nature Journal的比對需求而來,世界上最早的科學期刊之一,也是全世界最權威及最有名望的學術雜誌,在《自然》上發表文章是非常光榮的,《自然》上的文章經常被引用,這有助於晉陞、獲得資助和獲得主流媒體的關注。在《自然》上發表的文章需要經過嚴格的同行評審。
論文原創性比對系統 1.最早是Nature Journal的比對需求而來,世界上最早的科學期刊之一,也是全世界最權威及最有名望的學術雜誌,在《自然》上發表文章是非常光榮的,《自然》上的文章經常被引用,這有助於晉陞、獲得資助和獲得主流媒體的關注。在《自然》上發表的文章需要經過嚴格的同行評審。
Java Libraries for Accessing the Princeton Wordnet
Princeton WordNet Ontology
第七章 网络营销.
Adj + Noun到知识库中的Special Classes
Thinking of WordNet 瞿裕忠
Semantic Relations between Words
——向刑事案件被告人家属调查取证的伦理性讨论
《知网》与意义的计算 董振东 董强 董振东 董强
論文原創性比對系統 為寫作與學習帶來革命性的體驗….
Adj + Noun映射到知识库中的classes
~建構有創意的教學策略~ 培養學生創意思考與創造力
因為賜生命聖靈的律,在基督耶穌裏釋放了我,使我脫離罪和死的律了。 (羅8:2)
園區多元智能教育中心 一年級課表 科園、龍山、實小
Presentation transcript:

黃居仁 中央研究院語言學研究所 92年9月10日 「語言座標」研習營 中 英 雙 語 知 識 本 體 與 領 域 檢 索 簡 介 Academia Sinica Bilingual Ontological WordNet 黃居仁 中央研究院語言學研究所 92年9月10日 「語言座標」研習營

中英雙語知識本體與領域檢索介面雛型. http://ckip. iis. sinica. edu 中英雙語知識本體與領域檢索介面雛型 http://ckip.iis.sinica.edu.tw/CKIP/ontology/(舊) http://bow.sinica.edu.tw/(新) 資料來源 1.中研院遠見中英對譯資料庫 2.WordNet 1.7 http://www.cogsci.princeton.edu/~wn/ 3.中研院詞庫小組 http://ckip.iis.sinica.edu.tw/CKIP/ 4. SUMO ontology http://ontology.teknowledge.com

2. 檢索 ‘Fish’ (英查中功能)

英查中 English-Chinese Lookup 檢索詞(Keyword):fish 與其他資源比對情況 知識本體(Ontology) 詞類(POS) 參考詞彙(Reference word) 詞義(Sense) 1: 釣魚遊戲 詞義(Sense) 2: 釣魚 詞義(Sense) 3: 沽名釣譽 詞義(Sense) 4: 魚兒 詞義(Sense) 5: 魚肉 詞義(Sense) 6: 蠢貨

3. 查看詞義 4

4. 查看詞義 4的 「下位詞」 詞義(Sense) 4: 魚兒 領域(Domain)一般(General) 詞類(POS)名詞(Noun) 解釋(Explanation) 翻譯(Translation) 同義詞集(Synset) (整體)部件詞(Part meronym) 上位詞(Hypernym) 下位詞(Hyponym) (成員)群體詞(Member holonym) SUMO:魚類(fish)

檢索結果:魚類分類和名稱 下位詞(Hyponym) food_fish game_fish rough_fish 下位詞(Hyponym) snapper sole panfish shad sardine trout tuna sea_bass groundfish herring salmon whitefish game_fish rough_fish chondrichthian bony_fish mouthbreeder

4.查看詞義 4的 「(整體)部件詞」 詞義(Sense) 4: 魚兒 領域(Domain)一般(General) 詞類(POS)名詞(Noun) 解釋(Explanation) 翻譯(Translation) 同義詞集(Synset) (整體)部件詞(Part meronym) 上位詞(Hypernym) 下位詞(Hyponym) (成員)群體詞(Member holonym) SUMO魚類(fish)

檢索結果:魚類部分和器官名稱 (整體)部件詞(Hyponym) milt tail_fin fishbone fish_scale fin roe lateral_line_organ

5.查看詞義 5的 「下位詞」 詞義(Sense) 5: 魚肉 領域(Domain)一般(General) 詞類(POS)名詞(Noun) 解釋(Explanation) the flesh of fish used asfood 翻譯(Translation) 同義詞集(Synset) 上位詞(Hypernym) 下位詞(Hyponym) SUMO:肉類(meat)

檢索結果:食用魚名稱 下位詞(Hyponym) anchovy panfish haddock shad trout hake stockfish eel salmon

6.檢索’seafood’

查看’seafood’的「下位詞」 詞義(Sense) 1: 海產食品 領域(Domain)一般(General) 詞類(POS)名詞(Noun) 解釋(Explanation) 翻譯(Translation) 同義詞集(Synset) 上位詞(Hypernym) 下位詞(Hyponym) SUMO肉類(meat)

檢索結果:海鮮名稱 下位詞(Hyponym) shellfish octopus roe squid shrimp saltwater_fish freshwater_fish whitefish

「語言座標」提供 -語言資訊與概念架構(知識本體)的連結 連結到SUMO這個上層共用知識本體。 SUMO: Suggested Upper Merged Ontology 可以由每個詞查到該詞在概念架構上的歸屬。 利用知識本體架構作知識內容分類,與簡單推理 如哺乳動物為溫血

知識本體(Ontology) 對任一網頁/資源知識內容及資訊架構的描述與定義 以RDF(或類似語言)寫成的文件,清楚定義概念間的關係和推理的邏輯規則 ─請注意資訊學中把ONTOLOGY當成知識/訊息的基底架構;與哲學中本體論的原定義大不相同

SUMO: Suggested Upper Merged Ontology An Upper Ontology created under IEEE Standard Upper Ontology Working Group. Maintained and Accessible on web at http://ontology.teknowledge.com Provides interface to English words through WordNet, as well as inference in 5 languages

Upper Ontology vs. Domain Ontology (Upper) Ontology: 各領域,各典藏通用的知識架構,是跨領域/跨典藏知識內容交換與處理的基礎 E.g. SUMO Domain Ontology: 個別領域特有的知識結構,E.g. SUMO virus domain ontology

知識本體Ontology與典藏的知識架構 我們從魚類ontology上的鰓(gill)來舉例說明知識的延伸... 「器官」「內部器官」「呼吸器官」「鰓」。 對此我們可利用以下兩種資源來進行知識的延伸: SUMO( Suggested Upper Merged Ontology) WordNet

A SUMO Perspective 由於SUMO是最上層的概念集合,因此前頁的例子中的四個節點,都是屬於SUMO 內的「器官」概念

知識本體中的知識分類訊息 另外,我們也能得到「器官」在SUMO上的子節點(Subclass)以及兄弟節點(Coordinate terms) 等資訊

如何呈現語言的知識本體? 詞彙網路的構成元素: 詞彙網路WordNet是最直接的語言本體表徵 ─某個語言內所有的詞彙(任一個詞形lemma與詞義sense的獨特配對定義為一個詞彙) ─該語言表達的所有概念(即所有詞義sense) ─一組基本的詞彙語意關係

詞彙網路的架構 以詞義為基準,把有相同詞義的所有詞彙放在一個同義詞集(SynSet) 同義詞集即是表達相同概念的所有詞的集合 以定義過的詞彙語意關係,連結所有的同義詞集 即是建立所有概念間的語意關係 除同義,反義,近義外,更重要的有上位,下位,及功能等關係

Synset:詞彙驅動的概念(知識)單位 Semantic Relation: 概念連結與知識衍生的基本關係 詞彙網路提供的知識基本架構 Synset:詞彙驅動的概念(知識)單位 Semantic Relation: 概念連結與知識衍生的基本關係 專家(such as reference librarian)用什麼方法找keyword找不到的資料?

詞彙網路與知識運籌 知識運籌的兩個挑戰 知識如何計量 (How to Itemize Knowledge?) 知識如何編目 (How to Catalogue Knowledge?)

「索引典」建立在 equivalence class 的概念上,原則上只標記同義關係(synonymy) 詞彙網路與 (圖書館學中的)索引典 「索引典」建立在 equivalence class 的概念上,原則上只標記同義關係(synonymy) 可以很快找到預先設定的固定類別

問題: 分類定義 因 時/地置宜 「蕃薯,本地」 「芋頭,外來」 <響尾蛇,飯匙倩> <桌子,table/desk>

Equivalence Classes vs. Relational Classes --下載, 拷貝,錄製 --數位檔案, 電子檔,機讀檔, 程式 --音樂…. --相片… --小說… --貝多芬,李玟,Stephen King, Steve Martin, Harry Potter (How about 閱讀,欣賞,買…)

詞義關係 antonymy 反義關係 hypernymy 上位關係 hyponymy 下位關係 holonymy  整體-部份關係 meronymy  部份-整體關係 metonymy  轉指關係 near-synonymy 近義關係 synonymy 同義關係 troponymy  方式關係

antonym /antonymy 【反義詞】 /反義關係 man- N ANTONYM woman-N ‘to sell’ and ‘to buy’ 例一:「胖」與「瘦」 例二:「買」與「賣」

hypernym /hypernymy 【上位詞】泛稱詞 / 上位關係 car N HAS_HYPERONYM vehicle N 佛教 宗教 禪宗 佛教

holonym /holonymy 整體詞 /整體-部份關係 ‘door’ and ‘room’ ‘finger’ and ‘hand’ 「筆劃」與「字」

meronym /meronymy 部份詞 /部份-整體關係 09 部件_整體詞_為 HAS_HOLO_PART 10 部件_部份詞_為 HAS_MERO_PART 整體及其組成單元,例如,「桌腳」與「桌子」: 11 成員_整體詞_為 HAS_HOLO_MEMBER 12 成員_部份詞_為 HAS_MERO_MEMBER 集合及成員,例如,「球員」與「球隊」, 「內政部」與「內閣」

meronym /meronymy 部份詞 /部份-整體關係 13 單位_整體詞_為 HAS_HOLO_PORTION 14 單位_部份詞_為 HAS_MERO_PORTION 「飯」與「飯粒」 15 成份_整體詞_為 HAS_HOLO_MADEOF 16 成份_部份詞_為 HAS_MERO_MADEOF 實體及其構成材料,例如,「紙張」與「書籍」 17 區域_整體詞_為 HAS_HOLO_LOCATION 18 區域_部份詞_為 HAS_MERO_LOCATION 綠洲是沙漠的一部份

metonym /metonymy 轉指詞 /轉指關係 思科(宣布裁員) 台北(主辦COLING2002)

troponym/troponymy: 方式詞/方式關係 move  walk, run, jog 煮 煎,炒,炸,燉

Involved 涉入 19 導致 CAUSES 20 肇因於 IS_CAUSED_BY Example (1): ‘to kill’ and ‘to die’ Example (2): ‘murder’ and ‘death’ 例一:「筆誤」(N)與「錯字」(N) 21 (角色)涉入 ROLE 22 涉入角色_有 INVOLVED 23 施事者_角色 ROLE_AGENT 24 涉入_施事者 INVOLVED_AGENT 25 經歷者_角色 ROLE_PATIENT 26 涉入_經歷者 INVOLVED_PATIENT

(Princeton的原始英文詞網)Since 1990 www.cogsci.princeton.edu/~wn/ WordNet 1.5. 詞彙網路 (Princeton的原始英文詞網)Since 1990 www.cogsci.princeton.edu/~wn/ Monolingual: English

EuroWorNet (EWN) 歐語詞網 Since 1996 http://www.hum.uva.nl/~ewn/ Multilingual: Basque, Catalan, Czech, Dutch, French, English, Estonian, French, German, Italian, Spanish, (Swedish, Norway, Danish, Greek, Portuguese, Romanian, Lithuan, Russian, Bulgarian, Slovenic)

知網(董振東的中文語意網路) Since 1995(?) http://www.keenage.com Bilingual: EC, CE HowNet 知網(董振東的中文語意網路) Since 1995(?) http://www.keenage.com Bilingual: EC, CE (pre-set ontology)