计算机医学信息检索 一、 基 本 原 理 下一页.

Slides:



Advertisements
Similar presentations
Lib.ujs.edu.cn 信息检索与利用 叙词语言 张壬 lib.ujs.edu.cn 信息检索与利用 主要内容 叙词语言的概念 叙词语言的应用 中国中医药学主题词表及其应用 叙词语言的优缺点.
Advertisements

2016/9/11 ECNU 检索策略的制定与调整. 2016/9/11 检索策略的制定与调整  什么是检索策略  选择信息源  提炼关键词  编制检索式  调整检索策略 缩小检索范围 扩大检索范围 ECNU.
网络科技信息 检索方法与技巧 武汉大学信息服务中心 李云华.
文献检索基本知识.
维普中文科技期刊数据库 河南科技学院图书馆.
英文数据库的检索与原文的获取 吴 贤 奇.
China Biology Medicine (CBM)
第六 章数据库访问页 6.1 数据访问页视图 6.2 创建数据访问页 6.3 编辑数据访问页 6.4 查看数据访问页 退出.
图书馆电子资源.
龙星课程—肿瘤生物信息学上机课程 曹莎
大连医科大学图书馆 刘薇薇 Tel: OvidSP数据库 ——检索系统 大连医科大学图书馆 刘薇薇 Tel:
文献检索(信息检索) 第四章 计算机信息检索技术 G252.7/160=2.
人大复印资料全文数据库 人大复印资料全文数据库选辑1995年至今公开发表的人文科学和社会科学中各学科、专业的重要论文和重要动态资料的全部原文。其信息资源覆盖了人文科学和社会科学领域国内公开出版的3000多种核心期刊、专业期刊和报纸,分4大类100多个专题。
计算机检索技术 及中文数据库使用方法 职工专题培训 主讲 段晓玲.
知识模块一: 期刊文献及检索基础知识.
中国生物医学文献数据库 (CBM) 李 梅 Tel:
网络信息检索与采集 ——检索方法 主讲人:许珍 王国硕.
姓 名 出生年月 所在学科 最高学历/位 专业 毕业学校 成果内容 本人业绩 (一)教学内容
专题一 图书馆电子资源、信息服务介绍及信息检索基础知识
北京协和医学院 博硕学位论文库
机检形式与发展 50年代――单机检索(脱机检索) 70年代初――联机检索 80年代――光盘检索 90年代――网络检索.
EBSCO数据库检索 信息检索与利用 杨国立 lib.ujs.edu.cn
计算机基础知识 丁家营镇九年制学校 徐中先.
1.关键词组合 深圳 深圳 志愿者 深圳 大运会 志愿者.
有机所文献利用快速指南 平台入口: 图书馆网站 文献、数据检索:
如何使用CiteSpace分析Derwent专利数据
WEB OF SCIENCE引文数据库检索平台
ScienceDirect最新界面介绍及使用
第二讲 检索技术与检索技巧.
Medline数据库 使用方法与技巧.
“搜索——从这里起步” ——信息检索基础知识解析 龚芙蓉 武汉大学图书馆 龚芙蓉 武汉大学图书馆.
第二节 校内其它数字资源利用.
EBSCO数据库检索 信息检索与利用 杨国立 lib.ujs.edu.cn
第十章 IDL访问数据库 10.1 数据库与数据库访问 1、数据库 数据库中数据的组织由低到高分为四级:字段、记录、表、数据库四种。
医学信息资源培训 PubMed
用户如不能得到原始文献或原文复印件,通过先进手段迅速检索到的医学信息就毫无价值!
以ISI平台为例,为您演示一下如何在Endnote文献中查看该文献的References
数据库检索指南 ACM数据库.
第二章 Java语言基础.
信息检索与利用 江苏大学图书馆 lib.ujs.edu.cn MeSH主题词表及应用 张壬
免费资源PubMed介绍 南方医科大学 顾萍 May 25, 2005.
CPU结构和功能.
ScienceDirect高级检索功能及使用视频、说明发现路径
搜 刘智 iLife信息素养协会 索.
美国数学学会 MathSciNet 电子资源的检索和使用
NoteExpress进阶 宋敏 电子资源部
ScienceDirect高级检索功能及使用视频、说明发现路径
网络信息检索的基本方法.
万方学位论文检索.
学习目标 1、什么是字符集 2、字符集四个级别 3、如何选择字符集.
微机系统的组成.
ASP New and other UIs: Medical Videos Searchasaurus
医 知 网 国内最专业的外文医学引文数据库 主讲人 王相东
VB与Access数据库的连接.
中国国家标准文献 共享服务平台检索 信息检索与利用 2019/4/29 王婧怡 图书馆615室 科技信息研究所
2019/4/ /4/25 学习科研好助手 NoteExpress文献管理与检索系统 北京爱琴海乐之技术有限公司.
普通高等教育”十一五”国家级规划教材 信 息 检 索 教 程 王立清 主编.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第4章 Excel电子表格制作软件 4.4 函数(一).
第九节 赋值运算符和赋值表达式.
中文社会科学引文索引数据库(CSSCI)
目次 第1章 绪 论 第2章 信息检索基础 第3章 搜索引擎 第4章 事实和数值型信息检索 第5章 图书信息检索 第6章 期刊信息检索
SCI收录号查询方法介绍 上海大学情报研究所
深 圳 职 业 技 术 学 院 SHENZHEN POLYTECHNIC
SpringerLink数据库使用说明 上海师范大学图书馆
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
VB与Access数据库的连接.
数据表示 第 2 讲.
用户指南.
学习目标 1、什么是列类型 2、列类型之数值类型.
Presentation transcript:

计算机医学信息检索 一、 基 本 原 理 下一页

1、计算机检索发展简史 1951年人们首次利用计算机进行信息检索实验。从1954年美国海军兵器中心使用IBM701型电子管计算机建立了世界上第一个计算机检索系统以来,计算机信息检索共经历了五个阶段: 上一页 下一页

脱机检索阶段(20世纪50年代中至 60年代中) 联机检索阶段(20世纪60年代中至70年代) 光盘检索阶段(20世纪80年代中期) 网络检索阶段(20世纪90年代) 上一页 下一页

2、计算机信息检索系统的构成 硬件(主机、外围设备、数据处理、数据传送有关的其他设备。) 软件(系统软件、应用软件) 数据库(是衡量检索系统规模大小的重要标志) 通讯线路(电话、数据、卫星通讯网) 检索终端 上一页 下一页

3、数据库的类型与结构 上一页 下一页 (1)类型 书目数据库:存储文摘、题录、目录等书目数据的一类数据库,又称为二次文献数据库。 数值数据库:为用户提供能够直接使用的数值类信息,无需再追查原文。 事实数据库:存储描述人物、机构、事物的等非文献信息源的数据库。 全文数据库:存储文献全文或节选其中主要部分的数据库。可以直接获取原始资料。 上一页 下一页

记录是构成数据库的完整的信息单元,每条记录描述了原始信息的外部特征和内部特征。 (2)结构 数据库 文档 记录 字段 组成记录的数据项目 若干个记录构成的信息集合称为文档。大型的数据库分割成若干文档。 记录是构成数据库的完整的信息单元,每条记录描述了原始信息的外部特征和内部特征。 上一页 下一页

上一页 下一页 (3)我国常见的生物医学数据库 MEDLINE数据库 荷兰《医学文摘》数据库(EM) 《生物学文摘》数据库(BA) 化学文摘数据库(CA) 《科学引文索引》数据库(SCI) 上一页 下一页

中国生物医学文献数据库(CBMdisc) 中文生物医学期刊数据库(CMCC) 中国学术期刊数据库 万方数据库 中医药文献数据库 上一页 下一页

4、计算机信息检索的检索过程 检索需求的分析和表达 检索方法的制定 检索式的编制 检索结果的反馈调整 检索结果的输出 上一页 下一页

检索需求的分析和表达 用户的检索需求大致分为3类: 新:及时获得最新的内容,对查全没有过高要求。 准:要解决研究中的具体问题,要求检出的文献有针对性,对查准要求较高。 全:要全面了解某一特定领域的发生、发展和现状,是一种回溯性检索,对查全有较高要求。 上一页 下一页

检索方法的制定 根据课题的学科专业范围、主题内容,选择合适的数据库,确定检索途径。 对检索需求进行概念分析,根据数据库的词表,把主题内容转换成检索系统采用的检索标识和检索词,并准备若干自由词。 上一页 下一页

计算机检索系统的检索词分为两种: 主题词:主要来自于主题词表、叙词表等,是经过规范化的。 自由词:来自于文献的篇名、文摘或正文,是一种没有规范化的自然语言。 原则上首选主题词检索。 上一页 下一页

检索式的编制 常用的运算符: 布尔逻辑运算符 逻辑“与” 文字表示为“and”,符号表示为“*”。检索词A与检索词B用and组配,提问式可写为: A and B 或者 A * B 上一页 下一页

A B 表示检索结果中每条记录必须同时含有A和B检索词,增强检索的专指性,缩小检索范围,提高了查全率。 上一页 下一页

Insulin(胰岛素)and diabetes(糖尿病) 上一页 下一页

A or B 或者 A + B 逻辑“或” 文字表示为“or”,用符号表示为“+”。检索词A与B用or组配,提问式可写为: 表示包含检索词A的文献或包含检索词B的文献或同时包含检索词A和检索词B 的文献均为命中文献,逻辑“或”扩大了检索范围,提高查全率。 上一页 下一页

Cancer(癌)or tumor(瘤) A B 上一页 下一页

A not B 或者 A - B 逻辑“非” 用文字表示为“not”,用符号表示为“-”。检索词A与检索词B用not组配,提问式可写为: 上一页 下一页

Hepatitis B virus not human (乙肝病毒) (人类) 上一页 下一页

在一个检索式中,如果含有两个或两个以上的布尔逻辑运算符,运算符的优先次序是: NOT﹥AND﹥OR 上一页 下一页

查找有关肿瘤引起的贫血的非英文文献 neoplasms/complications(并发症) anemia/etiology(病因学) English #1 1687 NEOPLASMS/complications #2 179 ANEMIA/etiology #3 23867 English in LA(LA=English) #4 20 (#1 and #2) not #3 上一页 下一页

上一页 下一页 截词符 后截断,将截词符号放在一个字符串的右方,以表示其右的有限或无限个字符不影响该字符串的检索。例如: hyperthyr*可查到hyperthyre、hyperthyreosis、hyperthyroid、hyperthyroidosis、hyperthyroidism等。 hypertensi??可查到hypertension、hypertensive。 涉及到词的单复数、作者、年代、同根词等方面的检索时,选用后截断技术。 上一页 下一页

前截断,将截词符号放在一个字符串的左方,以表示其左的有限或无限个字符不影响该字符串的检索。例如: *sighted,可查到farsighted 与nearsighted。 前截断只检索后缀相同的一类词,常用于检索化学化工文献与复合词较多的文献。 上一页 下一页

中截断,将截词符号放在一个检索词的中间的一种截词方式。只允许有限截断,用于检索词的单复数或英美式不同拚法。例如: wom?n,可查到Woman,Women。 defen?e ,可查到defense,defence。 上一页 下一页

上一页 下一页 限制符 检索系统中,缩小或约束检索结果的方法成为限制检索。常用的有特定字段的限制检索,限制符为“in”和“=”。例如: Hypertension in TI,表示高血压一词在题名字段Title中出现。 限制符还有其他形式: py<2000表示检索2000年前发表的文献记录。 上一页 下一页

上一页 下一页 位置算符 要求原始记录中检索词之间的相互位置满足某些条件时要使用位置算符,常用的位置算符有with、near等。 表示此算符两侧的检索词在命中记录中必须出现在同一字段中,即同时出现于篇名或文摘中等,但前后位置可以颠倒。 上一页 下一页

near算符 表示此算符两侧的检索词的距离最近。A near B 的检索结果是A与B必须同时出现在一句话中,无论语序,二者之间最多可相隔n-1个单词。 A near B表示命中记录中左右两个检索词出现在同一句子中。 上一页 下一页

检索结果的反馈调整 检索结果主要通过查全率、查准率两个指标来进行评价。 查全率:系统进行检索时,检出的相关文献量与系统文献库中相关文献总量的比率。 查准率:系统中检出的相关文献量与检出的文献总量的比率。 上一页 下一页

上一页 下一页 提高查全率的方法: 降低检索词的专指度,选出一些上位词和相关词补充到检索式中。 调节检索式的网罗度,减少逻辑“与”的组配面。 进行族性检索,可采用分类检索,或用一组同义词、近义词和相关词,用“或”连接在检索式中。 采用截词技术,取消某些限制过严的限制符。 上一页 下一页

上一页 下一页 提高查准率的方法: 提高检索词的专指度,换用专指度较强的规范词或自由词。 增加“与”连接,进一步限定主题概念。 限定检索词所在的可检字段,用位置算符控制检索词的词间顺序与位置。 限制输出文献的外部特征,如限制年限、语种、文献类型等。 用逻辑“非”限制与提问不相关的文献的输出。 用主题词检索,不用或少用自由词检索。 上一页 下一页

检索结果的输出 检索结果的输出是整个检索过程的最后一步,用户可以要求检索系统按照一定的格式输出检索结果。输出格式通常有题录、全文或整个网页。 返回 上一页