文献检索基本知识
一、文献检索基本知识
(一)基本概念 1.信息 information 信息是事物运动的状态与方式的反映 2.知识 knowledge 人们在改造世界的实践中所获得的认识和经验的总和
三要素:载体、知识或信息、文字 图象声音符号 5.医学文献 medical literature 3.情报 information 三要素:知识性、传递性、效用性 4.文献 literature 就是记录着知识的一切载体, 三要素:载体、知识或信息、文字 图象声音符号 5.医学文献 medical literature
文献分类 一次文献 primary literature 即原始文献 二次文献 secondary literature 如:目录、索引 三次文献 tertiary literature
6.文献检索 literature retrieve 就是查找文献,即以科学的方法利用专门的工具,从大量的文献资料中迅速、准确、完整地查找到文献资料的过程
7.检索工具 retrieve tools 是指用于存贮、报道和查找文献线索的工具
检索工具的分类 目录 catalogue 索引 index 文摘 abstract 全文 full-text
(二)检索的途径 外部特征 1.题名 2.著者 3.序号 4.引文 内部特征 5 关键词途径 6 分类途径 7 主题途径 8 其他
(三)检索语言 检索语言是一种专门的人工语言,是在文献存贮与检索过程中共用的语言。分规范化语言和非规范化语言两种
(四)检索的基本原理 1.存贮过程 2.检索过程
2.存储、检索过程 主题分析 主题概念 情报检索语言的语词或标识 文献检索工具或系统
一、计算机检索的特点 检索速度快 检索途径多 更新快 资源共享 检索更方便灵活 检索结果可以直接输出
二、计算机信息检索系统的构成 从物理构成来说,包括计算机硬件、软件和数据库、通讯线路和检索终端五部分
三、数据库的结构 文档--记录--字段 文档(file):数据库中一部分记录的有序集合 记录(record):数据库的信息单元,每条记录描述了一个原始信息的外部特征和内部特征。 字段(field):比记录更小的单位,是组成记录的数据项目
数据库类型 书目数据库 bibliographic database 全文数据库 full text database 事实数据库 fact database 超文本型数据库 hypertext database
四、其他信息资源
参考数据库(Reference database) 指包含各种数据、信息或知识的原始来源和属性的数据库 主要包括书目数据库、文摘数据库、索引数据库 例如:中国社会科学文献数据库、中国国家书目文献数据库
全文数据库(Full text database) 收录有原始文献全文的数据库 以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息为主 例如:中国期刊全文数据库、维普中国科技期刊数据库
事实数据库(Factual database) 指包含大量数据、事实,直接提供原始资料的数据库 又分为数值数据库(Numeric database)、指南数据库(directory database)、术语数据库(terminological database)等
电子图书(electronic books) 指供在电脑上阅读的一种新型的数字化书籍 是多媒体技术和超文本技术发展的产物 一般有专用电子图书阅读器
国内的电子图书系统 超星数字图书馆 中国数字图书馆有限公司的网上图书馆 书生之家“中华图书网” 方正Apabi电子图书
电子期刊(electronic journals) 简称e-journal 指以数字或电子形式出版发行的期刊
电子期刊的类型 一、印刷型期刊的电子版 Electronic version 例如:《科学》杂志的电子版 《科学在线》 http://china.sciencemag.org/
原生(born-digital)数字资源 只在互联网上发行的纯电子期刊 Electronic –only 《新物理学杂志》 New journal of physics
电子报纸(electronic newspaper) 将电子技术应用到涉及报刊出版、发行、利用的全过程
重要电子报纸举例 纽约时报(Http://www.nytimes.com) 华盛顿邮报(http://www.washingtonpost.com 泰晤士报(Http://www.thetimes.co.uk) 人民日报(Http://www.people.com.cn) 光明日报(Http://www.gmdaily.com.cn) 中国日报(Http://www.chinadaily.com.cn)
搜索引擎、分类指南 搜索引擎主要是使用一种计算机自动检索软件,在互联网上检索,将检索到的网页编入到数据库中,并进行一定程度的自动标引,用户使用时输入检索词,搜索引擎将其与数据库中的信息匹配,产生检索结果 例如:Yahoo、Hotbot、Google等
分类指南是将搜索到的网页按主题内容组织成等级结构(主题树),用户按照这个目录逐层深入,直到找到所需文献。 通常搜索引擎与分类指南结合在一起,例如Yahoo、Google等
网络学术资源学科导航 将互联网上的信息进行科学整理,按学科组织起来,构成完整的学科导航系统,为教学、科研、技术人员提供各类学术信息. 我校的重点学科导航
FTP资源 FTP: File Transfer Protocol 天网(http://e.pku.edu.cn),可以专门检索网上的FTP站点
其他 如网站、BBS、新闻组等 也可以给用户提供一些有用的知识或动态
五、计算机信息检索的基本技术
1、布尔逻辑运算符 (Boolean searching) AND:A AND B 检出记录中同时含有检索词A和检索词B
OR:A OR B 检出记录中含有检索词A或检索词B的文献
NOT:A NOT B 在含检索词A的记录中,去掉含检索词B的记录
()>NOT>AND>OR 优先级运算 ()>NOT>AND>OR (Child or children) and lung cancer
2、位置算符检索 位置算符(position operator) 表示两个检索词间的位置临近关系,又叫邻接检索(proximity) 布尔逻辑运算符表示两个概念之间的逻辑关系,位置算符表示的是两个概念在信息中的实际物理位置关系 如:lung near cancer
2.截词检索与通配检索 截词符 truncation symbol 如 child* 通配符 wildcard symbol 如 tumo?r
3、限定检索 Limit searching 是缩小或约束检索结果的方法,最常用的是对特定字段的限定检索 限制符多为:in、=、[ ] 例如:Chinese in LA
4、加权检索 是一种定量检索的技术 缩小检索范围提高检索准确率的有效方法
5、聚类检索 根据不同的聚类水平的要求,可以形成不同聚类层次的类目体系 主题相近、内容相关的文献聚在一起,相异的被区分开来
6、全文检索 Full text searching 直接对全文进行检索,从而更加深入到语言细节中,四个级别的运算符: 记录级 and or not 字段级 in 子字段或自然句级字段 near 词位置检索 with
7、扩展检索与缩检 扩展检索 缩小检索:二次检索
计算机检索的效果评价 评价的目的、范围 评价标准:查全率 查准率 影响检索检索效果的因素
六、计算机检索的类型
联机数据库检索 Online retrieval 用户通过计算机终端设备,通过通讯线路或网络,在联机检索中心的数据库中进行检索并获得信息的过程 最大的缺点是检索费用高 现在用户量少
光盘数据库检索 CD-ROM数据库 最初是单机检索,后来逐渐发展出了联机光盘检索 联机光盘检索指把单用户系统发展成多用户的局域网系统,通过网络(如校园网)连接多个用户终端,用服务器管理多组光盘数据库及其检索系统
网络数据库检索 Web-database 用户在自己的客户端上,通过互联网和浏览器界面对数据库进行检索