药物和疾病啥关系 ? 李智恒.

Slides:



Advertisements
Similar presentations
计算机辅助医学 医学知识库 李作峰 上海生物信息技术研究中心. 提纲 基本概念 1 关键技术 2 应用实例 3.
Advertisements

现代化医院建设中 ——医院信息建设软环境的探寻
计算机检索的原理与 步骤 主讲人:董宁.
Basic concepts of structural equation modeling
药学与化学专业英语 学习指南 SciFinder
林森國小一年8班班親會 葉宛婷老師 103年9月19日 晚上7:00-8:30 地點:108教室.
Classification of Web Query Intent Using Encyclopedia 基于百科知识的查询意图获取
CEM vs Receptor-binding effects
參考資料: 吳美美,Chap. 2-3 蔡明月,Chap. 2 卜小蝶,Chap. 2 Walker and Janes, Chap. 2
第四章 海洋面面觀 ■ 4-1 海洋觀測工具 ■ 4-2 海水的性質與水團 ■ 4-3 海水的運動.
第一章 管理文秘概述.
Web of Distributed Ontologies
Relation Detection And Recognition
ClinicalKey Elsevier 全医学平台 图书∙期刊∙视频∙影像∙ 循证…
锁定化学结构相关的药物并查看其综合信息 ——Thomson Reuters Integrity数据库培训
手外伤与断指再植 上海第二医科大学 附属第九人民医院骨科.
A Question Answering Approach to Emotion Cause Extraction
Introduction to incoPat 4.0
Large-Scale Malware Indexing Using Function-Call Graphs
NLP Group, Dept. of CS&T, Tsinghua University
文本分类综述 王 斌 中国科学院计算技术研究所 2002年12月.
資料庫結構與組織.
OVID Medline vs. PubMed 邱子恒
词汇语义资源在中文关系抽取中的应用 报告人:钱龙华 刘丹丹 胡亚楠 钱龙华 周国栋
Data Mining 工具介紹 (Weka+JDBC)
2018/11/22 Developing a Visualization Tool for Spider Web-Building Algorithms 模擬蜘蛛結網之演算法設計及視覺化工具開發 指導教授:尹邦嚴 陳怡孜 陳瑩哲 沈扇綸 郭怡君 老師 各位來賓大家好,我們是國立暨南國際大學資訊管理學系,今天很榮幸能夠來這裡跟大家一起分享.
第4章 關聯式資料庫模型 4-1 關聯式資料庫模型的基礎 4-2 關聯式資料庫模型的資料結構 4-3 關聯式資料庫模型的完整性限制條件
CCF-ADL 58 大媒体与大数据分析 北京·清华大学
EBSCO数据库使用说明 大连职业技术学院图书馆信息咨询部.
InterSpeech 2013 Investigation of Recurrent-Neural-Network Architectures and Learning Methods for Spoken Language Understanding University of Rouen(France)
Word-Entity Duet Representations for Document Ranking
使用Reaxys精準搜尋關鍵數據, 節省查找時間
Data Mining 資料探勘 Introduction to Data Mining Min-Yuh Day 戴敏育
Omid Bakhshandeh and James F. Allen IWCS 2015
實證醫學常用資源及檢索 策略介紹 林愉珊 典藏閱覽組 國立陽明大學圖書館 民國98年5月11日.
关键技术 数据库构建 文本处理 声学建模 最优搜索 波形处理.
OVID Medline vs. PubMed 邱子恒
BEd(Special Education)
从百科类网站抽取infobox 报告人:徐波.
PubMed整合显示图书馆电子资源 医科院图书馆电子资源培训讲座.
21st Century Teaching & Learning
—— 周小多.
谈模式识别方法在林业管理问题中的应用 报告人:管理工程系 马宁 报告地点:学研B107
数据摘要现状调研报告 上下文摘要初步思考 徐丹云.
Answering aggregation question over knowledge base
Version Control System Based DSNs
ClinicalKey Elsevier 全医学平台 图书∙期刊∙视频∙影像∙ 循证…
OVID Medline vs. PubMed 邱子恒 臺北醫學大學通識教育中心
檢索與資訊組織 --掌握資訊的贏家 師大圖資所 碩一 陳映后、張榕容.
Learn Question Focus and Dependency Relations from Web Search Results for Question Classification 各位老師大家好,這是我今天要報告的論文題目,…… 那在題目上的括號是因為,前陣子我們有投airs的paper,那有reviewer對model的名稱產生意見.
Representation Learning of Knowledge Graphs with Hierarchical Types
從 ER 到 Logical Schema ──兼談Schema Integration
主講人:陳鴻文 副教授 銘傳大學資訊傳播工程系所 日期:3/13/2010
牛津期刊 操作手冊 Oxford Journals Aug update.
西南大学计算机系 郭云龙 徐潇 向宇 曾维刚 李莉
知識管理 第二章 本體論為基礎的知識.
Embase.com 特點與搜索技巧分享 張家瑋 Elsevier 生命科學產品經理
參考資料: 黃慕萱,Chap. 2-3 Harter, Chap. 3
OVID Medline vs. PubMed 邱子恒
侯筱蓉,讲师 重庆医科大学信息管理系 文献检索教研室
LOGO 2018 企业公司年会庆典PPT模板 SOME ENTERPRISE COMPANY ANNUAL MEETING PPT TEMPLATE.
More About Auto-encoder
钱炘祺 一种面向实体浏览中属性融合的人机交互的设计与实现 Designing Human-Computer Interaction of Property Consolidation for Entity Browsing 钱炘祺
OVID Medline vs. PubMed 邱子恒
圖資處數位資源組 王瑋婷 分機:2133轉65 PubMed生物醫學文獻資料庫 圖資處數位資源組 王瑋婷 分機:2133轉65
OVID Medline vs. PubMed 邱子恒
地点识别调研 施林锋.
適用於數位典藏多媒體內容之 複合式多媒體檢索技術
《神经网络与深度学习》 第10章 模型独立的学习方式
Some discussions on Entity Identification
Presentation transcript:

药物和疾病啥关系 ? 李智恒

任务: BioCreative V Chemical-induced diseases relation extraction (CID) 1. UTH-CCB@BioCreative V CDR Task: Identifying Chemical-induced Disease Relations in Biomedical Text 2. RELigator: Chemical-disease relation extraction using prior knowledge and textual information

任务介绍 BioCreative V Chemical-induced diseases relation extraction (CID)

UTH-CCB@BioCreative V CDR Task sentence level Cs CID pair located in the same sentence CID abstract level  CD all candidate CID pairs Cs classifier : Context words with position Knowledgebase features Others

Cs features 1 Context words with position: eg: C_D010634-induced D_D004409 in a D_D009422 child. target entities: C_D010634 , D_D009422 unigram and bigram words before, between and after target entities other entities between  entity type C_D010634-induced D_disease in a D_D009422 child.

Cs features 2 Knowledgebase features: all relations of the chemical and disease pair in the CTD, MEDI, SIDER MeSH® tree structures of entities

CTD Comparative Toxicgenomics Database( http://ctdbase.org/ ) 研究环境化学对人体健康的影响

CTD 研究实体: chemical/drugs genes/proteins disease taxa(分类群) phenotypes(基因型和环境相互作用下的有机体的样子,显型) 人工标注: chemical–gene/protein interactions chemical–disease relationships gene–disease relationships chemical–phenotype relationships

CTD 数据分类: Chemical , Disease , Genes Chemical–Gene/Protein Interactions Gene–Disease Associations Chemical–Disease Associations Gene–Gene Interactions References Organisms Gene Ontology Pathways Exposures

CTD Chemical–Disease Associations 下载文件: CTD chemical disease.xml.gz therapeutic(治疗剂)或marker/mechanism(机制原理) 或 缺省

Cs features 2 Knowledgebase features: all relations of the chemical and disease pair in the CTD, MEDI, SIDER MeSH® tree structures of entities

MEDI MEDI--an Ensemble MEDication Indication Resource ( https://medschool.vanderbilt.edu/cpm/center-precision-medicine-blog/medi-ensemble-medication-indication-resource ) 电子病历中提取得到的药物指示资源

Cs features 2 Knowledgebase features: all relations of the chemical and disease pair in the CTD, MEDI, SIDER MeSH® tree structures of entities

SIDER Side Effect Resource(http://sideeffects.embl.de/) 销售药品和其他记录中的不良反应 从公开文档和包装说明书中抽取的信息 可用信息:副作用频率、药物副作用分类、 更多的信息链接(eg: drug-target relations)

SIDER

Cs features 2 Knowledgebase features: all relations of the chemical and disease pair in the CTD, MEDI, SIDER MeSH® tree structures of entities

MeSH® tree structures 可以根据参考是找到比给定标题更具体、更广泛的标题 四肢 截肢残端 下肢 臀部 脚 脚踝 前脚掌,人类 跖骨 脚趾 大拇趾

Cs features 3 Others Mentions and normalized values of entities Core chemicals: highest frequency or occurred in the title +1: 所有包含CID 关系对的句子 CID-SA —— -1 : 不包含CID 关系对的句子 +1 : 人工标注,确实含有关系的句子 CID-SM—— -1 : 人工标注,不含关系,但包含CID对的句子

CD classifier (2),(3) of Cs ( Knowledge features & core chemical ) Number of sentences between entities Trigger words For all CID pairs Cs+CD  predictions 若抽取结果为空,则核心化合物连接的CID对加入最终结果集

Results Training set + development set final models 自动标注优于人工标注结果

References CTD: The Comparative Toxicogenomics Database's 10th year anniversary: update 2015. MEDI: Development and evaluation of an ensemble resource linking medications to their indications. (2013) SIDER: A side effect resource to capture phenotypic effects of drugs.(2010)

RELigator RELigator: Chemical-disease relation extraction using prior knowledge and textual information Relation extraction: All co-occurrence pairs Cross the title-abstract border Features: Knowledge-based features Statistical features NLP features

Knowledge-based features BRAIN : a graph database UMLS 中几乎所有的实体的相关关系 (来自结构化数据库&Medline文章) Entity1 connection Entity2 (每个connection标有来源,不同来源标有不同权重) (每个connection关联一系列 关系或预测) BRAIN提供用户编程接口,可用于查询两个给定实体的关系路径(path) 关系路径:直接/间接,每个path有志新分数, 用于衡量2个实体之间的连接紧密程度

Statistical features chemical , disease , chemical-disease pair 文档中出现频次 chemical 和 disease间的:1. 最少句子间隔 2.最少单词间隔 chemical 和 disease是否出现在title中,或者二者均出现在title中

NLP features Stanford CoreNLP parser 产生句子的依存树 Governing verb:分析树中某节点上升到根的过程中遇到的第一个动词 Semantic role:实体的语义角色由分析树中的governing verb 反映 对于最近的chemical和disease: Relating word (担任) Governing verb of Relating word (宣布) Chemical是否在disease前 是否有chemical-disease pair在低一级的分析树中 所有governing verb & 出现频次

Machine learning SVM分类 Radial basis function Grid search Ten-fold cross-validation

References BRAIN: Bio-IT World. Big BRAIN: Finding Connections in the Literature Flood with Euretos BRAIN[ Internet]. Available from: http://www.bio-itworld.com/2014/7/1/big-brain-finding-gems-literature-flood-euretos-brain.html Euretos[Internet]. Available from: http://www.euretos.com.

Sequence Modeling: Recurrent and Recursive Nets 张建海