网络信息资源搜索
一、网络信息资源含义 所有以电子数据形式把文字、图像、 声音、动画等多种形式的信息存储在光、 磁等非纸介质的载体中,并通过网络通信、 计算机或终端等方式再现出来的资源。 即通过计算机网络可以利用各种信 息资源的总和。
二、构成 信息内容 信息内容的记录符号 信息内容的记录方式 信息表述所依附载体
二、网络信息资源特性 离散性 海量信息、内容丰富 动态性 时效性强,无序且不稳定 不均衡性 地区、学科、行业 ……
不规范性 质量良莠不齐、难于管理 开放性 节点多、链接多
三、网络信息资源检索方法 浏览 ; 直接访问法 ; 通过网络资源指南查找信息 ; 利用网络信息检索工具查找信息。
四、 网络信息搜索引擎 广义:在 Web 中主动搜索信息并将其自动标引 以及将标引的内容存储在可供检索的大型数据 库中,建立相应的索引和目录服务,从而对用 户提出的各种检索做出响应,提供用户所需的 信息或相关的链接。 狭义:对 WWW 站点资源和其他网络资源进行 标引和检索的一类检索系统机制
基于文档内容的搜索引擎 上个世纪 90 年代 yahoo 目录思想 匹配和排序 提问词出现频率 基于链接分析的搜索引擎 世纪初 百度 引文分析思想 网页之间链接 基于自然语言搜索 引擎 2003 年 中搜 自然语言 语义 发展历程
搜索引擎的工作原理 从互联网上抓取网页 建立索引数据库 在索引数据库中搜索排序
搜索器 搜索引擎派出网页搜索工具如 spider( 蜘蛛 ) 在 Internet 上搜索信息,并把 信息带回搜索引擎 ; 索引器 将信息进行分类索引,建立网页 数据库 ; 检索器 通过 Web 服务器端软件,为用户 提供浏览器界面下的信息查询。 用户接口 接纳用户查询、显示查询结果、 提供个性化查询项。
搜索器 索引器 检索器 用户接口
网络搜索引擎的类型 索引型搜索引擎(全文 网页级) 目录型搜索引擎(网站级) 元搜索引擎
百度 谷歌 搜狗 雅 虎 必应 …….. “ 元搜索引擎 ” 实例
搜索引擎的查询方式 简单检索( Simple Search) 直接输入一个字或词,提 交搜索引擎 查询,最基本的搜索方式。
输入 “ 搜索引擎 ”
“ 搜索引擎 ” 方面信息
词组搜索( Phrase Search ) 输入两个单词以上的词组(短语), 当做一个独立运算单元提交搜索引擎 查询,叫词组搜索。
词组搜索实例 ——“ 中草药 栽培 ”
词组搜索实例 ——“ 中草药︱栽培 ”
词组搜索实例 ——“ 中草药 – 栽培 ”
2224 百度 — 书名号特殊用处
23 百度 — 双引号特殊用处
语句搜索 (Sentence Search) 直接采用自然语言句子,作提问 式进行检索。也叫任意查询。
例如: 中国有哪些农业大学 中国的农业大学 中国农业大学
“ 现代爱情故事歌词 ” “ 新文化报在长春发行情况 ” “ 新文化报 长春 发行 ” “ 奥迪车的各种图案 ” “ 奥迪 图案 ” “ 长春到上海列车时刻表 ” “ 长春 上海列车 时刻表 ”
限制搜索范围 按链接和网域等进行搜索范 围的限制。
百度的检索技术 —— 文献类型限定 百度支持对 Office 文档(包括 Word 、 Excel 、 PowerPoint )、 Adobe PDF 文 档、 RTF 文档的全文搜索。 基本输入格式为: 检索词(空格) filetype: 文献类型 注意:空格问题,在英文半角状态下 输入 “:” 。
2927 信息检索 filetype: 文献类型 PPT
常用文件格式 文件格式文件类型相应软件 rar压缩文件winrar zip压缩文件winrar,winzip exe可执行程序一般双击打开 xls表格文件excel ppt幻灯片powerpoint htm网页IE
常用文档格式 文件格式文件类型相应软件 txt纯文字文档记事本 doc文档word wps文档wps pdf文档 Acrobat reader caj文档cajviewer
常用图像格式 文件格式文件类型相应软件 bmp图像 Acdsee 、 ie 等 jpg,jpeg图像 gif图像,动画 swf动画 flashplayer 、 ie 等 psd图像photoshop
常用多媒体格式 文件格式文件类型相应软件 mp3音频 winamp 等 wma音频 avi视音频 realplayer,windows media player 等 rm同上同上 rmvb同上同上 mpeg同上同上
百度文档文件格式限定界面
百度的检索技术 —— 字段限定 intitle:把搜索范围限定在网页标题中 inurl: 查找 url (统一资源定位器 )中包 含检索词的页面 site:限定在某个特定站点中进行检索
新闻 intitle: 吉林农业大学
3730 乔丹经典 inurl:photo
3831 检索示例 ——inurl 用法
3932 微博 site:sina.com.cn
就业 site:edu.cn
高级搜索( Advance Search ) 用布尔逻辑组配方式查询,也叫定 制搜索。
高级搜索 百度高级检索界面
谷歌高级检索界面
分类目录搜索 按搜索引擎提供的分类目录逐级查 询,用户一般不需要输人查询,而是按 照查询系统所提供的几种分类项目,选 择类别进行搜索,也叫分类搜索。
360 目录 —— 网址导航
搜狐分类检索
特色查询功能 手气不错 网页快照 类似网页 集成化工具条 多元化服务 相关搜索
英汉互译 百度百科 百度文库 天气查询 计算器和度量衡转换 …………………
更多
搜索设置 手写
搜索引擎的检索技巧 选择合适的搜索引擎; 信息量、速度、准确性、舒适度、功能等 选择合适的字、词; 大小写区分、错别字等 使用逻辑符号、限定功能; 特殊功能; 求助于搜索引擎帮助系统 ; 积累经验,向高手学习。
常用搜索引擎 谷歌 搜狐 新浪 网易 雅虎 百度 中国搜索
万维搜索 爱问 有道 搜狗 一搜 天网搜索 …………………
五、 专题网络信息资源 检索与利用
图书 图书出版信息网站 中国出版信息网 中国图书出版网 各图书出版社网站 ……………………..
馆藏图书目录 馆藏目录主要有两大类,包括单一馆藏目录 与联合目录,他们的共同特点是均有提示性良 好的人机对话界面,按照这些目录查询系统的 规定提供需要的检索条目即可获得相应的馆藏 内容。
单一馆藏目录可到各个图书馆或文献收 藏机构的公共书目查询系统( OPAC) 中检 索。 OPAC 全称 Online Public Access Catalogue
联合目录一般是某个较大的机构,与某 一类相近或有共性的图书馆结合形成统一 界面的检索目录。 如 CALIS 公共目录检索系统 (
电子图书 电子图书 (e Book) 指采用二进 制的数字化形式将纸质图书文献的 文本存储在磁盘或光盘载体上,在 计算机软件的支持下形成电子图书 数据库,并把图书内容再现出来供 人们阅读利用。 目前只在网上发表的图书不包 括在此。
免费电子图书 免费读书网站,动态性较强,类别有 限。 收费电子图书 超星数字图书馆、书生数字图书馆、北 大方正数字图书馆等
收费电子图书 超星数字图书馆、书生数字图书馆、 北大方正 ( Apabi ) 数字图书馆等。
中国数字图书馆(国家图书馆)
网上书店 亚逊网上书店 ( www. amazon. com) 当当网上书店 ( com) 中国图书网 (http: //www. bookschina. com) ………………………….
读书网站
文献传递 —— 读秀学术搜索系统
期刊 印刷型期刊数字化电子期刊 纯网络电子期刊
期刊查询方法 期刊数据库(中国知网、万方数据、重 庆维普、 EBSCO 、 Elsevier 、 Springer 等 数据库) 电子期刊网站 期刊出版社 馆藏期刊目录 文献传递 免费资源 . …………………
龙源期刊网 (
中国高校人文社会科学文献中心( CASHL ) ( p )( 中国高校人文社会科学文献中心( CASHL China Academic Humanities and Social Sciences Library )是全国性人文科学外文期 刊保障体系,为用户提供文献传递服务。主 要资源有: 高校人文社科外文期刊目次数据库 高校人文社科核心期刊总览
开放存取期刊 期刊, 又称 OA 期刊,同行评议过的科学 论文或学术文献放到互联网上。使用户 可以免费获得,而不需考虑版权或注册 的限制。开放获取运动旨在打破学术研 究的人为壁垒。 开放存取 OA _ Open Access
开放存取数字资源(国内): 中国科技论文在线 中国预印本服务系统 奇迹文库
专利文献 中华人民共和国国家知识产权局网站 中国知识产权网 中国专利信息网
中国知识产权网
标准文献 — 中国标准服务网
人参
学位论文 数据库 授予学位的机构及其网站
学科信息门户 学科信息门户是利用网络集成技术, 将分散的网络学科信息资源通过科学的知 识组织体系进行有机集成,而后向用户提 供特定学科领域的各种类型网上信息资源, 同时提供对这一学科信息资源的 “ 一站式 ” 检索入口的 “ 信息资源超市 ” 。
中草药数据库
专业相关单位、科研院所等网站 利用搜索引擎搜索专业相关网站 日积月累 — 与专业相关的网站