Download presentation
Presentation is loading. Please wait.
1
隐性网站资源的开发与利用 中南民族大学图书馆 信息开发与咨询部
隐性网站资源的开发与利用 中南民族大学图书馆 信息开发与咨询部 2017/3/8
2
什么是隐性网站资源(Invisible Web)
1994年 首次在互联网使用,意指那些常用搜索引擎难以发现原信息内容。国外又有Deep Web,Dark Web, Hidden Web或Dark Matter等。 现在通常指:通过万维网获得的文本网页、文件或其他高质量的权威性信息,但由于技术限制,或是由于网站设计者的不同偏好而不能或未被纳入通用搜索引擎的网页索引。 简言之,隐性网站资源就是通用搜索引擎如Google,Yahoo!及网站掼所无法涵盖的内容。 中南民族大学图书馆 2017/3/8
3
Invisible Web产生的原因 几个数据:2000年,互联网上未被搜索引擎收录的网页是被收录网页的500倍。被收录的有10亿,但未被收录的达5500亿。 原因: 1如果某一网页在网络上未与其他任何网页建立链接,网页的主人又没有把网址提交给搜索引擎,搜索引擎就不能找到它。 2 普通搜索引擎对非ASCII文本格式的内容,如Postscript、Flash、执行文件(程序)、压缩文件、offfice文档等进行索引时存在困难。 3 某些网页只有注册用户才能浏览,而数据库入口处设置的账号、口令等提问是机械式搜索引擎难以跨越的障碍。 4 如果一个网页是新网页或某个网站内容更新,它也很难被及进索引。 5 用户在“输入内容”或者进行“选择”时生成的动态网页也无法被搜索引擎索引。 中南民族大学图书馆 2017/3/8
4
Invisible Web的特点 1 资源内容往往限定于特定的主题领域,政府机关和学术机构提供的许多数据库尤其如此。
2 提供专业检索界面,并对检索结果格式实施控制,搜索精确度高。 3 具有更高的查准率与查全率。 4 提供最高水平的权威性信息资源。 5 提供在别的地方不易获得的信息。 中南民族大学图书馆 2017/3/8
5
Invisible Web的类型 1、模糊网站 是指搜索引擎可以检索标引但又没有收录的文档 2、个人网站
从技术上讲,个人网站能够被标引,却被有意排除在搜索引擎之外,比如,网站管理员采用密码保护,使用 robots.txt 文件或“ 不得标引”的元图标等阻止搜索引擎spider 访问、阅读和标引。一般来说,个人网站不经许可是无法访问的。 3、专有网站:专用网站只对那些同意出交换条件才能浏览内容的用户开放。只有愿意注册浏览用户才能访问专有网站。 4、真正的隐性网站:搜索引擎不能检索或标引它们必须提供的资料 (1)Spider不能处理的文档格式的网页 (2)动态网页 (3)存储在关系数据库中的信息 中南民族大学图书馆 2017/3/8
6
如何查找隐性网站信息资源 1 利用高质量的主题学科/通道 2 利用特定的检索工具 3 使用隐性网站导航器 4 挖掘个人收藏夹
5 尝试离线查找帮助 中南民族大学图书馆 2017/3/8
7
四种搜索Invisible Web的工作 1、目录指南(Directories)
2、搜索Invisible Web的网站(Searchable Sites) 3、免费数据库(Free Web Databases) 4、专用搜索引擎(Specialized Search Engines) 中南民族大学图书馆 2017/3/8
8
1、目录指南 (1)Librarians’ Index to the Internet图书馆员筛选和维护的,包括14000多个网站的主题目录,在查询框输入一个宽泛的主题词加上“and database”就可以进入相关的Invisible Web资源。 (2)FindLaw 世界著名的法律网站 ,可链接许多免费数据库。 (3)InfoMine由图书馆员编制,有 多个学术网站的分类目录。 (4)About.com内容广泛,查询主题数以万计。 (5)Academicinfo学术资源主题指南,提供一个适合大学生利用的学术网络资源检索入口。 (6)Find Articles最著名的免费数据库之一。 中南民族大学图书馆 2017/3/8
9
2、搜索Invisible Web的网站 (1)Direct Search 最权威的用于检索“看不见的网页”的网站,拥有数量庞大的Invisible Web资源链接。 (2)The Invisible Web Directory专门用于指导检索Invisible Web资源的网站,其宗旨是“寻找搜索引擎无法找到的隐藏的网络资源”。 (3)Profusion一个智能型并行元搜索引擎,其搜索对像包括万维网、新闻、职业信息、Mp3、下载文件等21个大类。 (4)CompletePlanet 包括70000多个可以检索的数据库及搜索引擎,用于从数据库查找不能够被普通搜索引擎索引的文件。 中南民族大学图书馆 2017/3/8
10
3、Invisible Web 数据库 (1)AnimalSearch一个适合家庭使用的有关动物的网站数据库
(2)Educator’s Reference Desk链接着AskERIC网站上的2000多个教学计划、3000多种在线教育信息和200多件咨询档案。 (3)NatureServe Explorer网上百科全书,提供美国和加拿大60 000多种植物、动物、生态系统的权威资料。 (4)Nuclear Explosions Database澳大利亚地球科学数据库,提供1945年以来世界范围内核爆炸的地点、时间、规模等数据 (5)PubMed提供对美国国家医学图书馆的文献数据库1400多万全文和相关资源的检索。 (6)LookSmart’s FindArticles可提供900多种出版物的5 500万篇文章的全文免费检索和打印。 (7)Directory of Open Access Journals瑞典的一个开放式目录检索系统,免费提供期刊的篇目检索和自然科学、人文科学及社会科学期刊的全文检索。 中南民族大学图书馆 2017/3/8
11
4、搜索引擎 (1)Incywincy只抓取看不见的网页。
(2)Google ScholarGoogle学术搜索实际上是Google索引的一个子集,涉及医药、物理、经济以及计算机科学等多个领域,可以搜索到一些与输入关键词相关的学术性刊物的文章、研究机构论文、书籍、摘要及技术报告等。 (3)Singingfish一个优秀的声/视频搜索引擎,只索引window Media、Real、 QuickTime、 Mp3等多媒体文档,其搜索结果可以免费使用。 (4)Google News颇受好评的新闻搜索,拥有4 500多新闻源,每15分钟自动更新。 (5)Scirus一个覆盖16 700多万网页的著名的科学搜索引擎,它的高搜索 功能尤其令人称道,可以从科学 学科、信息源、文件格式、信息类型等途径检索1920年至今的期刊和网络科学文献。 中南民族大学图书馆 2017/3/8
12
Thank You ! 2017/3/8
Similar presentations