大学计算机基础 第五章 信息检索
主要内容 个人计算机信息检索 基于搜索引擎的网络信息检索 网络数据库信息检索
桌面搜索 桌面搜索也称为个人桌面引擎或个人硬盘搜索引擎,是一套运用网络搜索引擎的方法帮助用户快速从个人计算机上搜寻信息的检索工具。 桌面搜索采用全文检索技术,预先对个人计算机信息进行索引,建立索引数据库。当用户调用桌面搜索时,是在索引数据库中进行搜索,而不是直接在硬盘所有文件中搜索,这既是桌面搜索工作的原理,也是其能快速反馈搜索结果的原因所在。
Windows 7桌面搜索 创建索引 “开始”→“搜索程序和文件”框中输入“索引选项”,→“索引选项”,→“修改(M)”按钮→在“更改所选位置”列表中勾选需要进行索引的硬盘或文件(选中硬盘/文件同时显示在“所选位置的摘要”列表中)→“确定”
Windows 7桌面搜索使用 “开始”按钮→“搜索程序和文件”框中输入搜索词(中英文均可)→弹出搜索结果→单击其中一条即可打开查看→单击“查看更多结果”→Windows 7资源管理器中显示所有搜索结果
桌面搜索技巧 通配符搜索 布尔逻辑搜索 星号*,代替任意的字符串 问号?,代替一个字符 “AND”、“OR”、“NOT” 例如:搜索歌手Akon的所有Rap风格的音乐,输入“Akon AND RAP”。注意,逻辑运算符需要大写。
搜索举例 搜索计算机文档库中修改日期为2011年6月4日,名称为“学习”的文档文件。
搜索引擎 搜索引擎(Search Engine)泛指网络上以一定的策略搜集信息,并对信息进行组织和处理,为用户提供信息检索服务的工具或系统,是网络信息检索工具的总称。
搜索引擎工作机制 爬行蜘蛛(Spider)预先收集Internet上的信息 对收集的信息进行组织、整理和索引,建立索引数据库。 当用户搜索某项内容的时候,所有在索引数据库中保存的相关的网络信息都将被搜索出来 再按照某种算法进行排序后,将相关链接作为搜索结果呈现给用户
搜索引擎分类 垂直搜索引擎 目录型搜索引擎 全文型搜索引擎 元搜索引擎 应用于某一个行业、专业的搜索引擎 Yahoo! 分类目录 Google、AltaVista、Excite、Lycos、Teoma、百度 元搜索引擎 调用其他搜索引起结果 垂直搜索引擎 应用于某一个行业、专业的搜索引擎
目录型搜索引擎 Yahoo! 的分类目录是最早的网络资源目录,也是目录型搜索引擎的典型代表。 美国斯坦福大学电子工程系的Jerry Yang和David Filo于1994年创办。 主要采用人工方式采集和处理网络信息,由信息专家编制主题目录,按主题目录对网络信息进行筛选、归类和组织,并编制索引数据库。
目录型搜索引擎
目录型搜索引擎 主题分类目录浏览 选择主题分类目录中的一个大类,单击进入其下一级类目,再逐层选择类目单击,直至最后的链接出现。 类目旁边括号里的数字代表在该主题下被收录文件的数量 “@”符号代表该主题在Yahoo! 等级式目录中多次出现 “NEW!”表明这一款目是上星期才提供给用户的 “ ”标明该主题在内容和版面设计上都优于其他文件。
目录型搜索引擎 关键词搜索 在分类目录主页首先确认搜索范围为“the Directory” 搜索词输入框中输入关键词 单击“Search”按钮实施搜索 搜索结果显示
全文型搜索引擎 “百度”二字源于中国宋朝词人辛弃疾的《青玉案》诗句:“众里寻他千百度”
全文型搜索引擎 简单搜索 输入框输入搜索词,单击“百度一下”按钮或按回车键即可 系统默认在网页中搜索,如需在新闻、贴吧、知道、MP3、图片等其他信息中搜索,则需先单击输入框上方相应的类别,再输入搜索词搜索 百度忽略英文字母大小写,有拼音提示、错别字提示等功能
全文型搜索引擎 百度支持各类搜索语法 支持用双引号、书名号实现精确搜索,如输入“市场研究报告”则“市场研究报告”作为一个整体搜索,不可拆分 支持布尔逻辑搜索
全文型搜索引擎 支持高级搜索语法
全文型搜索引擎 高级搜索
全文型搜索引擎 百度搜索举例:搜索教育与科研类网站(edu.cn)上发布的有关“会计学”方面的中文PPT文档。 方法一 登录百度搜索主页:www.baidu.com; 在搜索框中输入检索式“intitle:会计学 site:edu.cn filetype:ppt”,然后单击“百度一下”按钮即可获得搜索结果; 本次搜索共获得21个相关结果,单击任意一条即可对其进行打开、下载等操作。
全文型搜索引擎 方法二 登录百度搜索主页:www.baidu.com,在搜索框中输入“会计学”,单击“百度一下”按钮进入搜索结果页面,在搜索结果页面底部单击“高级搜索”按钮,进入百度高级搜索页面 在高级搜索页面中的“包含以下全部的关键词”输入框中输入“会计学”,在“搜索网页语言是”中选择“仅在简体中文中”,在“搜索网页格式是”下拉列表中选择“微软Powerpoint(.ppt)”,在“查询关键词位于”中选择“仅网页的标题中”,在“限定要搜索指定的网站是”输入框中输入“edu.cn” 设置完后,单击“百度一下”按钮,即可获得搜索结果,与方法一一样,本次搜索共获得21条相关结果。
全文型搜索引擎 百度特色产品和服务 百度文库:http://wenku.baidu.com/,百度为网民提供的信息存储空间,是供网民在线分享文档的开放平台。 百度数据研究中心:http://data.baidu.com/,提供多个行业的数据分析报告。 百度指数:http://index.baidu.com/,以百度网页搜索和百度新闻搜索为基础的免费海量数据分析服务,用以反映不同关键词在过去一段时间里的“用户关注度”和“媒体关注度”。 百度百科:http://baike.baidu.com/, 是一部内容开放、自由的中文网络知识性百科全书。 百度大学搜索:http://daxue.baidu.com/,查询国内大学的具体信息,如录取情况、课程安排或校友信息等。 更多特色产品和服务见网址:http://www.baidu.com/more/。
全文型搜索引擎 元搜索引擎 调用其他搜索引擎的引擎,当用户提交查询请求时,元搜索引擎调用其他多个搜索引擎来完成查询,并将结果返回给用户。 Ixquick、百Google度
全文型搜索引擎 垂直搜索引擎 视频搜索引擎 职位搜索引擎 百度视频搜索:http://video.baidu.com/ 土豆网:http://www.tudou.com/ 搜狗视频搜索:http://v.sogou.com/ 职位搜索引擎 百度百伯: http://www.baijob.com/ 前程无忧求职搜索引擎:http://www.51job.com/ 数字英才网:http://www.01hr.com 职友集:http://www.jobui.com/ 招聘搜:http://china.recruit.net 职趣: http://www.jobcu.com/ /
网络数据库信息检索 网络数据库存储的都是经过人工严格收集、整理、加工和组织的具有较高学术价值、科研价值的信息。 参考数据库:是书目、索引、文摘等二次文献检索工具的电子版 事实、数据数据库:主要报道事实和数据信息,包括字典、词典、百科全书、年鉴、手册等 全文数据库:存储和报道各种文献的全文 多媒体数据库:存储多种媒体资料(如图片、音频、视频)的数据库
网络数据库信息检索 网络数据库按内容可分为: 按照语种划分 参考数据库:是书目、索引、文摘等二次文献检索工具的电子版; 事实、数据数据库:主要报道事实和数据信息,包括字典、词典、百科全书、年鉴、手册等; 全文数据库:存储和报道各种文献的全文; 多媒体数据库:存储多种媒体资料(如图片、音频、视频)的数据库。 按照语种划分 中文数据库 外文数据库
网络数据库信息检索 中国知识基础设施工程(Chinese National Knowledge Infrastructure,网址: http://www.cnki.net),又称CNKI中国知网
网络数据库信息检索 标准检索 选择学科范围→选择要检索的数据库→在“检索范围控制条件输入区”输入时间、文献来源、作者等控制条件→在“目标文献内容特征输入区”先选取检索字段(在“主题”框下拉列表框中选取),再在检索词输入框中输入检索词,如“信息检索”→单击“检索文献”按钮→完成检索。 引文检索 以被引文献的特征信息和文献引用关系为出发点,检索文献。其检索方法与标准检索一致。 学者检索 通过学者姓名、单位、研究方向关键词等信息,查找学者发表的全部文献及被引下载等情况,通过学者知网节可以全方位的了解学者主要研究领域、研究成果等情况。 工具书及知识元搜索 输入关键词在工具书中查找解释、或查找概念、数字、中英文例句、图形、表格等知识元信息。 文献出版来源 按来源检索文献。其检索原理是先选取来源期刊,再在来源期刊中检索文献。
网络数据库信息检索 检索举例 利用CNKI中国知网,查找课题《宋、元、明、清的政治文化制度》的相关文献资料,检索时间要求:2000年至今;检索字段:题名。
网络数据库信息检索 常用中文网络数据库 图书馆联机书目检索系统(Online Public Access Catalog,简称OPAC) 超星电子图书(http://book.chaoxing.com/) 读秀学术搜索(http://www.duxiu.com/) 万方数据知识服务平台(www.wanfangdata.com.cn) 维普资讯网(http://www.cqvip.com/) 方正Apabi电子图书(http://apabi.nstl.gov.cn/) 国研网(http://www.drcnet.com.cn/) 万律中国法律法规双语数据库(http://edu.westlawchina.com)
网络数据库信息检索 常用英文网络数据库 Springer-Link全文数据库 ProQuest全文数据库 Elsevier Science Direct全文数据库 ISI Web of Science 数据库 工程索引(EI)
网络数据库信息检索 常用多媒体学习库 新东方多媒体学习库(http://library.koolearn.com) 银符考试模拟题库B12(http://www.yfzxmn.cn/newyfB12/) 超星学术视频(http://video.chaoxing.com)