第 7 章 信息检索与利用基础 1.5 学时
内容提要 掌握一个概念 信息检索 了解一个过程 了解信息检索过程 掌握其中用到的检索方法 和检索途径 常用信息检索工具 传统的 现代的 身边的
“Internet 与其说把人们带入了信息 世界,不如说是把他们领进了茫茫 无际的大海 ” -美国《时代周刊》
信息过载 (Information overload) Tom Landauer 认为人的大脑只能存储 200M 信息量, 一辈子只能接触 6G 的信息量。 “… 全世界每年产生 1 到 2 EB(1 EB≈10 9 GB) 信息,相 当于地球上每个人大概产生 250MB 信息。 其中纸质信息仅占所有信息的 0.03%...”(Lyman & Hal 03) 静态网页有上百亿个,动态及隐藏网页至少是静态网 页的 500 倍。
今天,信息的来源非常广泛。 掌握快速、准确、全面地获取信息的方法尤为重要
信息检索的意义 利用已有信息,避免重复劳动 快速获取信息,提高工作效率 占有信息,方便决策
信息检索的实质 什么是信息检索?
信息检索的概念 信息检索就是根 据用户对信息的需求, 利用检索工具查找有关 信息资料的过程。 分析用户信息需求 选择检索系统和工具 确定检索方法和途径 实施检索策略 评价检索结果 进行后续分析
信息检索的实质 信息检索系统包含存储与检索两个部分。 存储是对有关信息进行选择、并对信息特征进行 记录、表示和组织,建立信息数据库 检索则是根据提问制定策略和表达式,利用信息 数据库找出用户所需要的信息。 信息检索的实质是将描述用户所需信息的提问特 征与已存储信息的特征标识进行比较,从中找出 与双方一致或基本一致的应用过程。
信息检索系统框架 利用工具研制工具 information retrieval systems
对信息检索问题的不同视角 情报科学领域:利用工具 如何使用文献检索工具查找资料 探讨检索方法 和 如何利用好一个检索工具问题 计算机科学领域:研制工具 信息检索算法 检索系统和工具的研究和开发
利用工具 VS. 研制工具 设计检索工具,帮助用户快速准确的获取所需信息 (计算机科学领域) 你要获得的文档从哪里来? 如何获得文档的检索标识? 如何存储这些检索标识? 如何描述你所需的信息?(提问特征) 如何比较提问特征和检索标识? 如何鉴别比较方法的好坏? 选择工具并利用工具快速获取所需信息(情报科学领 域) 选择什么检索工具? 如何实施检索?
如何利用好检索工具 ?
用户信息需求 数据 2010 年我国 GDP 是: 亿元人民币 事实 “ 三聚氰胺 ” 奶粉、瘦肉精、日本地震、网上订票 文献 [1] 金福海. 论建立我国的惩罚性赔偿制度 [J]. 中国法 学,1994,(3). 物联网十二五规划
信息检索工具 信息检索工具是人们为了充分、准确、有效地利用 已有的信息资源而加工编制的用来提示、存储和查 找信息资源的卡片、表册、特定出版物和计算机系 统。 是检索过程得以实施的平台 卡片出版物计算机
信息检索工具的类型 按照处理信息资源的手段 传统检索工具(或手工检索工具) 面向计算机与网络的检索工具 按照载体形式 书本式检索工具 卡片式检索工具 缩微式检索工具 胶卷式检索工具 磁带式检索工具 按照记录格式 目录型检索工具 题录型检索工具 索引型检索工具 文摘型检索工具 全文型检索工具
传统检索工具 传统检索工具主要是各种类型的工具书。 工具书是根据一定的需要、比较完备地汇集某一方 面的资料,并按特定的方法加以编排,专供读者检 索查考有关知识、资料或事实的书籍。 主要工具书 检索性工具书、参考性工具书、词语性工具书、表谱性 工具书、图录性工具书等。
面向计算机与网络的检索工具 面向计算机与网络的检索工具主要包括 联机检索工具、 光盘检索工具 和因特网检索工具等三种工具。
面向计算机与网络的检索工具 联机检索 需远程登录访问并通 过专业命令语句的专 用数据库系统。 电信专线 Internet
面向计算机与网络的检索工具 光盘检索 载体:光盘、磁带等外存 检索途径完善,检索功能强大,能提供题名、 著者、主题词、关键词、号码、年代、出处等 多种检索途径。
面向计算机与网络的检索工具 因特网检索 。 基于 Web 的检索工具 :搜索引擎、网络资源指南、元搜索 引擎和检索代理、书目检索系统、全文检索系统、多媒体 检索系统等。 Internet
常用的检索方法(论) 常规检索法又称常用检索法、工具检索法。它是以主题、 分类、作者等为检索点,利用检索工具获得信息资源的方 法。 回溯检索法又称追溯法、引文法、引证法,是 — 种跟踪查 找的方式,即以文献后面所附的参考文献为线索,逐一追 溯查找相关文献的方法。 循环检索法又称交替法、综合法、分段法,即交替使用回 溯法和常规法来进行文献检索的综合检索方法。
信息检索的途径 基于文献外部特征的检索途径 文献的外部特征,是文献检索载体的外表上标记的 可见特征,如题名(书名、刊名、篇名 ) 、责任者 (作者、编者、译者、专利权人、出版机构等)、 号码(专利号、报告号、索取号等)。 基于文献内容特征的检索途径 文献的内容特征是文献所载的知识信息中隐含的、 潜在的特征,如分类、主题等,以文献的内容特征 作为检索途径更适用于检索未知线索的文献。
我们身边的检索工具和资源 搜索引擎 搜索引擎通过采集、记录众多的因特网资源来提供全局性 网络资源的控制与检索,目标是将因特网所有信息资源进 行整合,方便用户查找所需的信息。 通用搜索引擎 :大、全, 以网页为组织对象 垂直搜索引擎 : 专、精、深 酷讯网 车票、机票、酒店、旅游 搜房网 房产 去哪儿网网 旅行相关 …
百度 百度创建于 2000 年,是目前全球最大的中文搜索引擎,它由蜘蛛程序、 监控程序、索引数据库和检索程序等四部分组成。 百度提供新闻搜索、网页快照、视频搜索、 MP3 搜索、 WAP 搜索、图片 搜索等服务。
百度 检索方式 初级检索:包括新闻、网页、 MP3 、图片、视频 与地图等多种检索 高级检索:可以对搜索结果进行时间、语言、地 区和显示条数的限制 基本检索技术(基于逻辑运算) 与、或、非、精确检索
百度 特色搜索 百科、贴吧、知道、 百度翻译等 老年搜索
Google Google 是 1998 年由美国斯坦福大学的两位博士生 Larry Page 和 Sergey Brin 创建的,提供图像、网站、新 闻组等多种资源的查询,目前收录了多种语言的约 1 万亿 个网页,采用全文标引的方式,提供多种语言的检索界 面,数据每日更新。
Google 检索方式 初级检索:需输入查询内容并按下回车键,或单击 “Google 搜索 ” 。 高级检索:将搜索范围限制在某个特定的网站中,排除某个 特定网站的网页,将搜索限制于某种指定的语言,查找链接 到某个指定网页的所有网页,查找与指定网页相关的网页等 Google 的特殊功能 提供查找 Flash 文件、网页快照、货币转换、计算器、相关 搜索、类似网页、按链接搜索等特殊功能 搜索图书资料: 搜索学术文献:
其他搜索引擎 全文索引型搜索引擎 AltaVist 、 OpenText 、 Infoseek 以文摘为主的搜索引擎 Excite 、 Lycos 、 Webcrawler 专业 ( 垂直 ) 搜索引擎 CSTR 、 DejaNews 、 PointSearch 、 MedSite 、 HealthWeb 、 HealthAtoZ 元搜索引擎 实现对多个独立搜索引擎数据库进行查询,并统 — 显示结果,如 MetaCrawler
数据资源
中文数据库 中国知网( CNKI ) 维普中文科技期刊数据库 高校财经数据库( China INFOBANK ) 超星数字图书馆
中国知网( CNKI ) 数据库简介 国家知识基础设施的概念,是由世界银行于 1998 年 提出。 CNKI 工程是以实现全社会知识资源传播共 享与增值利用为目标的信息化建设项目,由清华大 学、清华同方发起,始建于 1999 年 6 月。 中国知网的产品分为十大专辑:理工 A 、理工 B 、 理工 C 、农业、医药卫生、文史哲、政治军事与法 律、教育与社会科学综合、电子技术与信息科学、 经济与管理。十大专辑下分为 168 个专题和近 3600 个子栏目。
中国知网( CNKI ) 中国知网主要包括的数据库: 中国期刊全文数据库 中国博士学位论文全文数据库 中国优秀硕士学位论文全文数据库 中国重要会议论文全文数据库 中国重要报纸全文数据库 中国年鉴全文数据库
中国知网( CNKI ) 登录及检索方法 经过学校图书馆主页上的中国知网栏目链接到中国 知网 在校园网内可以直接输入 (或者 ) 中国知网提供初级检索、高级检索、专业检索、数 据库导航等多种方式。
维普中文科技期刊数据库 数据库简介 中文科技期刊数据库(全文版)是重庆维普资讯有 限公司开发研制的中文电子期刊数据库。 收录我国自然科学、工程技术、农业科学、医药卫 生、经济管理、教育科学和图书情报等学科 8000 余种期刊的 2000 余万篇文章的全文,每年增加约 250 万篇。 该数据库中的期刊文献最早回溯到 1955 年,但有 部分期刊收录不完整。该数据库检索入口较多、辅 助手段较为丰富。
维普中文科技期刊数据库 登录及检索方法 登录方式 经过各图书馆主页上的维普资讯栏目链接到维普资讯网 站 直接输入 检索方式 快速检索 传统检索 高级检索 分类检索 期刊导航
高校财经数据库( China INFOBANK ) 数据库简介 INFOBANK 于 1995 年在香港成立,是一家专门收集、处理 及传播中国商业、经济信息的香港高科技企业。 高校财经数据库主要内容 中国经济新闻库 中国统计数据库 中国商业报告库 中国法律法规库 中国上市公司文献库 中国人物库 中国医疗健康库 中国企业产品库 名词解释 中国中央及地方政府机构库
高校财经数据库( China INFOBANK ) 登录及检索 登录 经过图书馆主页上的链接找到网站 直接输入 ,进入数据库主 页。 检索方式 一般检索 专业检索
超星数字图书馆 简介 超星数字图书馆成立于 1993 年,是国内专业的数 字图书馆解决方案提供商和数字图书资源供应商。 超星数字图书馆是国家 “863” 计划中国数字图书馆 示范工程项目, 2000 年 1 月,在互联网上正式开通。 由北京世纪超星信息技术发展有限责任公司投资兴 建,设文学、历史、法律、军事、经济、科学、医 药、工程、建筑、交通、计算机和环保等几十个分 馆。
超星数字图书馆 检索方式 关键词检索 分类检索 高级检索 注:检索到的电子图书需在线阅读或下载后使用超星阅 读器阅读。
内容提要 掌握一个概念 信息检索 了解一个过程 了解信息检索过程 掌握检索方法 掌握检索途径 常用信息检索工具 传统的 现代的 身边的