Relation Detection And Recognition

Slides:



Advertisements
Similar presentations
1 認識創業之財務 ( 資金 ) 及稅務問題 講師 : 蘇炳章 日期 : 92 年 8 月 12 日.
Advertisements

1 門市服務丙級技術士 技能檢定介紹 門市服務丙級技術士報告注意事項 證照名稱:門市服務丙級技術士 發照單位:行政院勞工委員會 有效期限:終生有效 考照時間:每年一次,皆為第一梯次 1. 簡章與報名書表發售時間:每年 1 月 2. 報名時間:每年 1 月。 3. 學科考試時間:每年 3.
昆明机场. 目录  机场历史 机场历史  建设状况 建设状况  运行状况 运行状况  航线 航线.
第十四章 人口(二) 高中地理(一). 第一節 人口成長 第二節 人口組成 第三節 人口問題 第十四章 人口(二)
中國歷史 社會主義文化大革命 我們的報告是關於中國著名的革命 —— 文化大革命。你可會立即想到它何時發 生、怎麼會發生等等。我們將會介紹文 化大革命,希望你細心欣賞。
易腐性商品三階段最佳補貨策略之研究 黃嘉彥 教授 勤益科技大學 研發科技與資訊管理研究所.
生源地助学贷款系统还款功能优化说明 评审三局 2015年5月.
党课讲座 入党的条件与程序.
第二章 中药药性理论的现代研究 掌握中药四性的现代研究 掌握中药五味的现代研究 掌握中药毒性的现代研究 了解中药归经的现代研究.
中國大陸教育 督導制度探究 凌林煌教授/博士 講授 國立中山大學共同科歷史學程
少年儿童营养配餐与饮食安全 科学饮食为孩子的未来积攒本钱.
肺癌放疗新概念: 瘤根靶向放疗 北京大学临床肿瘤学院 北京肿瘤医院放疗科.
窦娥冤 关汉卿 感天动地 元·关汉卿.
專利基礎知識培訓内容大綱 專利基本概念 專利類型 授予專利的條件 專利説明書的寫作要求 專利保護期限 專利權人權利和義務
國立嘉義大學 資訊工程研究所 指導教授:柯建全 博士 研究生:林俊志
从永磁体谈起.
温故知新 犬 戎 公元前 770年 周平王 公元前771年 东周 洛邑 西周 镐京.
第五章 主张超尘绝俗的 佛家.
Svm基本知识与原理 张立新.
让我们走进秋天.
高齡自主學習團體終身學習試辦計畫經費核銷
二、信用工具和外汇.
少阳病和柴胡剂 郝万山(北京中医药大学).
为您扬帆,助您远航! 徽商银行特色新产品介绍. 为您扬帆,助您远航! 徽商银行特色新产品介绍.
歷史建築清水國小宿舍群修復工程 施工說明會
知其不可而为之.
台北縣98年三鶯區語文研習 --建國國小 修辭與標點符號 福和國中廖惠貞
新课程中的教与学 让学生在自主· 合作· 探究 学习中成长 肖 川 北 京 师 范 大 学.
中国画家协会理事、安徽省美术家协会会员、 工艺美术师、黄山市邮协常务理事余承平主讲
第二课 扬起自信的风帆 我能“行”.
公务卡使用说明.
电磁铁.
请说出牛顿第一定律的内容。.
有三件事我很確定: 第一、愛德華是吸血鬼 第二、出於天性,他渴望喝我的血 第三、我無可救藥地愛上他了……
财务知识培训 杨 秀 玲 2014年10月.
第二章 语音 第六节 音变 轻 声1.
第一章会计技能的内容 1.1会计技能的重要性.
資料探勘(Data Mining)及其應用之介紹
第十一章 真理与价值 主讲人:阎华荣.
汉字的构造.
诵读欣赏 古代诗词三首.
第七章 固 定 资 产.
企業(委任經理人)留才 退休規劃與稅賦利基.
中文命名实体识别及关系提取 *** *** ***.
第六章 技术创新与经济增长 本章主要问题 ---技术创新过程 ---技术创新分类 ---技术创新动力源 ---技术创新影响因素
金錢信託 業務簡介(一).
公務員廉政倫理規範.
贴近教学 服务师生 方便老师.
六年级 语文 下册 第四单元 指尖的世界.
組 員: 王 新 惠 吳 映 暄 李 盈 慧 廖 香 涵 盧 姵 華 訪談日期:
(浙教版)四年级品德与社会下册 共同生活的世界 第四单元 世界之窗 第二课时.
行政院國軍退除役官兵輔導委員會 嘉義榮民醫院.
可靠性技术 同济大学经济与管理学院.
第八章 第一节 日本 邹旭丹 滨河中学初中部 湘教版地理初一年级.
紀律、專業、服務 - 國泰產險 前言 承保機構、要保單位及保險期間 保險內容 公司簡介 理賠服務 其他服務 Q&A 內容大綱.
Bounding Box Accuracy in Pedestrian Detection for Intelligent Transportation Systems David Fern´andez, Ignacio Parra, Miguel ´Angel Sotelo, Pedro A.
國立政治大學 資訊科學研究所 知識系統實驗室 研究生: 鄭雍瑋 指導教授: 劉吉軒 博士 中華民國九十五年六月三十日
Source: IEEE Transactions on Image Processing, Vol. 25, pp ,
Support Vector Machines
公立學校教職員退休資遣撫卹條例重點說明 苗栗縣政府人事處編製 主講人:陳處長坤榮 107年5月2日.
汇报人:周学广 教授 基于依存分析的 中文微博情感分析 汇报人:周学广 教授
現代專案管理教材 第一章 專案與專案管理 博碩文化出版發行.
第 四 章 迴歸分析應注意之事項.
Xián 伯 牙 绝 弦 安徽淮南市八公山区第二小学 陈燕朵.
105學年度第2學期 會計室業務重點宣導 106年3月8日.
組員:.
知识点4---向量的线性相关性 1. 线性相关与线性无关 线性相关性的性质 2..
数据挖掘导论 福建医科大学 郑伟成.
 主講人:楊文明主任委員   106/06/30 中華電信職工福利委員會台北分會業務簡介.
Presentation transcript:

Relation Detection And Recognition *** *** ***

Schema General Description Name Entity Recognition RDR Training Corpus Generate Relation Detection and Recognition Performance Analysis

General Description-Algorithm EDR: CRF Character based RDR: SVM Pos is needed

General Description-Workflow

Schema General Description Name Entity Recognition RDR Training Corpus Generate Relation Detection and Recognition Performance Analysis

Name Entity Recognition-Algorithm CRF++ Character based Most naive 发 non

Name Entity Recognition-Accuracy nr precious:100% right:88 error:0 nt precious:100% right:36 error:0 ns precious:100% right:56 error:0 180/181 海湾战争 nz 9 22

Schema General Description Name Entity Recognition RDR Training Corpus Generate Relation Detection and Recognition Performance Analysis

RDR Training Corpus Generate The vector SVM need: e1.type, e2.type,order, dist, w-2,w-1,w0,w1,w2,t-2,t-1,t0,t1,t2, relation Exp: 国家环保局局长解振华庄重宣布 国家环保局,2,解振华,1,3,11,NULL,NULL,国家环保局,局,长,局,长,解振华,庄,重,null,null,null,NN,NR,NN,NN,null,VA,DEC,E

RDR Training Corpus Generate 1、NLP Pos tag: 国家/NN 环保局/NN 局长/NN 解振华/NR 庄重/VA 宣布:/DEC 2、Compare with Entity: 国家环保局/nt,解振华/nr 3、Find the type front and back null,null,null,NN,NR NN,NN,null,VA,DEC

RDR Training Corpus Generate 4、Tag the train corpus by hands 国家环保局,2,解振华,1,3,11,NULL,NULL,国家环保局,局,长,局,长,解振华,庄,重,null,null,null,NN,NR,NN,NN,null,VA,DEC,E

RDR Training Corpus Generate Use Assit Program: Tagged Corpus: 602 sentence 3000+relations

Schema General Description Name Entity Recognition RDR Training Corpus Generate Relation Detection and Recognition Performance Analysis

概述 将关系识别问题看作多分类问题 输入:实体对向量集X(x1,x2,……xn) 其中 xi (f1, f2, ……fn ) 表示实体对(E1,E2) 输出: xi 所属的类型yi 使用SVM的方法构造分类器 选取合适的特征集来描述实体对,并映射 到高维实数空间,进行分类

SVM 支持向量机( Support Vector Machine, SVM) 其主要思想是针对两类分类问题, 在高维空间中寻找一个超平面作为两类的分割, 以保证最小的分类错误率。通过学习, 可以自动寻找那些对分类有较好区分能力的支持向量, 由此构造出的分类器可以最大化类之间的间隔。 工具LIBSVM (http://www.csie.ntu.edu.tw/~cjlin/libsvm/) 有可执行的程序来构造多分类器以及训练和预测功能。

实体对过滤模块 关系定义 C:chief(nr-nt) E:employee(nr-nt) L:located in(nt-ns) N:no relation 实体对过滤模块 将除(nr-nt),(nt-ns)外的实体对过滤,过滤后的实体对作为candidate进行标注(train)或分类(test)

特征选取和向量化模块 选取以下特征构造特征集 e1.type,e2.type,contain,order,dist, w-2,w-1,w1,w2,t-2,t-1,t1,t2, Relation 在实际模型训练中有调整 映射到向量形式

向量化模块和scale模块 向量形式 Label index1:value1 …… 1 1:2 2:3 3:4…… Scale(libsvm: svm-scale.exe) 对数据集进行缩放([-1,1]) 便于计算,统一训练集和测试集

训练模块 人工对candidate进行关系标注 Libsvm: svm-train.exe 特征集和参数的选择(交叉验证法) 构造模型

测试 SampleTestData P=76%

Schema General Description Name Entity Recognition RDR Training Corpus Generate Relation Detection and Recognition Performance Analysis

分析与改进 前序工作引入的误差 训练语料不够大 人工标注的语料引入误差 特征集的选取(提取语义特征) 训练参数的选取(网络搜索)