第五章 互联网信息综合查询 第一节 互联网基础知识
一、互联网技术举要 二、互联网信息的特点 三、互联网信息的的评价与鉴别
一、互联网技术举要 (一)IP地址及域名 (二)万维网 (World Wide Web, WWW, Web) (三)Web 2.0 (四)局域网代理服务器设置
(一)IP地址及域名 IP地址 互联网标识上网主机地址的编号 IPv4协议规定的IP地址长度为32位,由四组小于256的十进制构成 例: 202.38.185.67 该IP是北京邮电大学图书馆技术部的一台主机
(一)IP地址及域名 域名(Domain) 为了便于记忆而产生的与数字IP地址对应的字符型IP地址。(需申请注册) 典型的域名由4个部分组成 例:www.fudan.edu.cn 从左至右四段依次为:主机名、三级域名、二级域名和顶级域名,其顶级域名为国别顶级域名。 有的域名只有3个部分 例:www.nih.gov 此类域名的顶级域名是网络类别代码。
常用网络类型代码 com 商业机构 org 非营利组织 edu 教育机构 gov 政府部门 net 网管组织 int 国际组织 mil 军事部门 info 信息机构 其他:.museum .coop .aero .pro……
(二)万维网 (World Wide Web, WWW, Web) 万维网:基于超文本传输协议(http协议),通过含有超级链接的超文本(Hypertext)方式来进行网上信息浏览的工具。 统一资源定位器(URL):即网址 网站与网页 网页:万维网的上网主机中提供访问的一个网页文件 网站:是网页的集成,一般来说,网站是机构或个人用于介绍自己或提供服务的站点,即一个网站一般代表一个机构(或个人)
(三)Web 2.0 以Blog、TAG、SNS、RSS、Wiki百科等应用为核心,依据六度分隔、xml、ajax等新理论和技术实现的互联网新一代模式 可以读写的互联网, Web1.0我们网上冲浪,Web2.0我们是波浪制造者。 让互联网找回Internet的真正含义:平等、交互、去中心化。
(四)局域网代理服务器设置 IE浏览器的“工具”下拉菜单→选择“Internet 选项”→点击“连接”选项卡→单击对话框右下方的“局域网(LAN)设置”按钮。
二、互联网信息的特点 无序性:信息杂乱无序,网页的变化、更迭、新生、消亡等随时发生 多样性:文件格式多样,内容包罗万象 新颖性:网上实时播报、网络新媒体中信息在第一时间被披露 对话性:更多直接交流的机会,零次信息多 开放性:大量灰色文献、边缘文献反映了原始数据和第一手资料
三、互联网信息的评价与鉴别 范围:网页性质、主题领域、目标用户层次、信息深度、时间范围、类型等 准确性:有明确的来源出处、标注网页责任者、信息客观性等 权威性:主办者资质、核实信息的方式、版权保护 新颖性:信息是否动态更新
三、互联网信息的评价与鉴别 独特性:信息提供的优势、特别的服务功能等 稳定性:网站连接及检索的速度、链接清楚且维护良好 费用:上网连通费用、全文等信息及服务是否要付费
第二节 搜索引擎
一、搜索引擎概述 二、通用搜索引擎 三、学术资源搜索引擎 四、其他搜索引擎
一、搜索引擎概述 (一)搜索引擎的概念 (二)搜索引擎的种类 检索因特网信息最常用的检索工具,它是提供万维网上信息资源检索和导航服务的专门站点或服务器。 (二)搜索引擎的种类 独立搜索引擎 元搜索引擎
(二)搜索引擎的种类 独立搜索引擎 元搜索引擎 通过搜集万维网的网页信息,建立自己独立的网络信息数据库供用户检索。 如: Google、Yahoo!、AltaVista、搜狐等 元搜索引擎 又称集成搜索引擎,自身不采集信息,没有自建的数据库。它将用户搜索请求预处理后,提交给多个选定的独立搜索引擎同时检索,并对返回结果进行整合,以统一的格式输出。 如:Clusty、Ixquick、Mama、MetaCrawler等
二、通用搜索引擎 Google(www.g.cn) Yahoo! Search(http://search.yahoo.com) 目录查询与网页检索途径比较
(一)Google(www.g.cn)
Google的搜索模块
Google的检索规则 Google简单检索规则: 默认检索:必须检索,两词间空格默认and匹配 或者检索:OR必须大写 排除检索:-表示,减号之前须空格,其后不空格(不能用NOT) 短语检索:双引号扩起词组或短语 对大小写不敏感 截词符:* 自动拼写检查
Google的检索规则 Google简单检索规则: 检索词出现位置限定: 文件类型限定:filetype:文件名后缀 标题:allintitle 网址:allinurl 内文:allintext 链接:allinanchor 例:allinurl:acm搜索网址内含单词acm的网页 文件类型限定:filetype:文件名后缀 支持13种非HTML文件搜索:pdf, doc, ppt, xls, swf, ps等 禁用词(Stop Words): 最常用的字符以及数字等高频词( of, is,的,为, http等),在检索时系统自动忽略不作检索。如果必须检索禁用词时可用+,或“ ”
Google的检索规则 Gooogle高级搜索 :
Google的检索规则 Gooogle高级搜索 : 搜索结果区域 查询设置区域 搜索特定网页区域 四个检索框内只能输入检索词,不能输入逻辑检索式 查询设置区域 可设置每页显示结果数,网页语言、更新日期,检索词出现位置、文件类型 “网域”限定等 搜索特定网页区域 可搜索“类似网页”和包含指定“链接”的网页
Google搜索实例 例:利用网页搜索查找网页标题中出现chronic low back pain surgery的网页。
Google搜索实例 例:利用网页高级搜索查找我国2005年艾滋病的发病率。
Google搜索实例 例:利用学术搜索查找有关腰脊柱(lumbar spine)介入(interventional)的英文文献,要求检索词出现在标题中。
Google网页检索结果显示 检出网页总数 检索式 网页标题 文件类型 网页摘录 网址
(二)Yahoo!Search(http://search.yahoo.com)
Yahoo!Search:Directory 网页目录检索 网站目录检索 高级网站目录检索 网站目录浏览
例:利用Directory的Advanced Search功能查找癌症临床试验的相关网站。 相关分类 检出相关网站数量 相关网站名称 网站简介 网址
例:利用Directory的目录浏览功能查找有关子宫内膜异位症的专业网站。
(三)关键词检索、目录比较 关键词检索:适用于目标明确、主题较狭窄、知识点、事实数据、文献等网页查找。 目录检索:适用于目标模糊、主题较宽泛、或是查某专业重要网站。
三、学术资源搜索引擎 (一)Scirus – for scientific information only (www.scirus.com) (二)Oaister(www.oaister.org)
(一)Scirus Elsevier公司推出的科学搜索引擎,可查询因特网信息、期刊文献、Beilstein文摘、美国专利、NASA技术报告、预印本数据库等。
Scirus的检索规则 逻辑运算符:AND、OR、ANDNOT 截词符:用于单词中的任意位置 字段检索:au:smith(冒号前后不空格) ? 代替一个字符 * 代替零个或任意个字符 字段检索:au:smith(冒号前后不空格) 可用字段缩写:au(作者),ti(标题), jo(刊名),ke(关键词),url(网址),dom(域名),af(作者单位) 精确短语匹配:“ ”
Scirus的检索方式 Basic Search 基本检索 Advanced Search 高级检索 输入框:可输入单个或多个检索词,也可输入带运算符的检索式 Advanced Search 高级检索 输入框:两个输入框,可输入检索词或检索式,选择逻辑关系。输入多个不带运算符的检索词时,可选择匹配方式 检索限定区域:在该区域可以限定Date(出版时间)、Information type(信息类型)、File formats(文件格式)、Content sources(期刊或网页的出处)、Subject areas(主题领域)
Scirus:Advanced Search 高级检索
Scirus的结果处理 筛选检索结果 按主题提炼检索结果
例:用Basic Search检索手指损伤手术的期刊文献,并从中筛选出截肢手术的文献。 共15个检索结果 点击浏览期刊文献
(二)Oaister 美国密执安大学数字图书馆制作服务部主办 提供全球900多家机构的开放存档资源 信息类型包括电子书、电子期刊、录音、图片及电影等数字化资料 可以按协作机构浏览资源,也可以对所有资源进行检索
四、其他搜索引擎 (一)通用搜索引擎 Clusty(clusty.com) Vivisimo推出的元搜索引擎 AlltheWeb(www.alltheweb.com) 独立搜索引擎 AltaVista(www.altavista.com) Open Directory Project(www.dmoz.org) 主题目录型搜索引擎,提供网站分类浏览和检索 百度(www.baidu.com)
四、其他搜索引擎 (二)医学搜索引擎 Medical Matrix(www.medmatrix.org) 目录型医学搜索引擎 Healthlinks(www.healthlinks.net) 由专家人工编辑的医学网络资源目录 BIOME(biome.ac.uk) 生物医学教育与研究网络资源目录 DIRLINE(dirline.nlm.nih.gov) 美国国立医学图书馆建立的生物医学机构目录
第三节 免费学术资源的检索
一、开放获取学术文献检索 二、政府出版物检索 三、公共版权资源检索 四、其他免费学术资源检索
一、开放获取学术文献检索 (一)开放获取期刊检索 (二)电子印本检索 (三)开放获取机构库检索 (四)开放获取课件检索
(一)开放获取期刊检索 Directory of Open Access Journal (DOAJ,www.doaj.org) 瑞典隆德大学(Lund Univ.)开发维护的开放获取期刊目录 截至2008年7月9日共提供各学科3487种OA期刊的简介和网站链接,其中生物学期刊317种,生命科学期刊55种,医学期刊978种 收录期刊全部有同行评审或编辑质量控制
(一)开放获取期刊检索 PubMed Central (简称PMC,www.pubmedcentral.nih.gov) 截至2008年2月14日共收录期刊约469种。
(一)开放获取期刊检索 BioMed Central (简称BMC,www.biomedcentral.com) 非营利性学术出版机构,致力于提供生物医学文献的开放获取 共出版202种生物医学OA期刊,并在不断出版新的期刊,所有期刊都经同行评审 除期刊外,还提供生物医学类开放获取机构库(Open Repository)、著名学者个人开放存档(PeoplesArchive)、生物学图库(Biology Image Library)的查询
(一)开放获取期刊检索 PLoS Journal (www.plos.org) PLoS(The Public Library of Science) 成立于2000年,致力于推动全球科技和医学领域文献的免费获取。2002年成立期刊编辑部,成为非营利性组织出版商 目前该组织共出版了7种期刊,所有期刊都是OA期刊,且均由同行专家严格评审,拒稿率达90%
(二)电子印本检索 E-print Network(www.osti.gov/eprints) 由美国能源部科技信息局建立的电子印本搜索引擎 可检索存放在学术机构、政府研究实验室、私人研究组织以及研究人员个人网站上的电子印本资源
(二)电子印本检索 中国科技论文在线(www.paper.edu.cn) 由教育部科技发展中心建立的电子印本系统 在该网站首页的“首发论文”栏目中包含了39个学科的预印本文献,其中生物学首发论文691篇,医学首发论文936篇 在该网站上发布文献的电子印本必须先进行免费注册
(二)电子印本检索 奇迹文库(www.qiji.cn) 中国预印本服务系统(prep.nstl.gov.cn) 国内最早的中文预印本服务器,由一群年轻的中国科学、教育与技术工作者于2003年创建 主要收录中文科研文章、综述、学位论文、讲义及专著的预印本 中国预印本服务系统(prep.nstl.gov.cn) 由中国科学技术信息研究所与国家科学技术图书馆文献中心(NSTL)联合主办 提供中国预印本文献发布、浏览、检索的平台
(三)开放获取机构库检索 MIT机构库(dspace.mit.edu) 剑桥大学机构库(www.dspace.cam.ac.uk) 收录麻省理工学院教学科研人员和研究生提交学术资料全文。 剑桥大学机构库(www.dspace.cam.ac.uk) 收录该校各机构的研究资料全文。 香港科技大学图书馆机构库(repository.ust.hk/dspace) 收录该校研究人员和研究生提交的各类研究资料全文。
(四)开放获取课件检索 Supercourses(www.supercourse.cn) 是基于互联网的,有关流行病学、公共卫生及全球卫生信息的学术平台 近年来,各国会员在互联网上共享了涉及26种语言载体的ppt讲稿3232篇 2004年,Supercourse China(SCC)团队成立,并建设了Supercourse中国镜像站
(四)开放获取课件检索 World Lecture Hall (www.utexas.edu/world/lecture) 收录各学科课程进度表、视频、注释、作业、参考书目等教学资料 中国开放教育资源协会(www.core.org.cn) 提供国外开放课程、中国国家级、省市级和学校级精品课程的导航 国外课程包括约翰霍普金斯大学、麻省理工学院、东京大学等知名高校。中国精品课程中医学课程100多门
二、政府出版物检索 (一)统计数据查询 (二)科技报告查询
(一)统计数据查询 National Center for Health Statistics (www.cdc.gov/nchs) 美国卫生部疾病预防和控制中心(CDC)的卫生统计数据官方网站 提供出生、死亡、疾病等多种卫生数据查询 WHO Statistical Information System(www.who.int/whosis) 世界卫生组织统计信息网站 提供193个会员国的卫生统计数据,并有World Health Statisics年度报告全文
(一)统计数据查询 中华人民共和国国家统计局 中华人民共和国卫生部 (www.stats.gov.cn/index.htm) 可浏览、检索我国月/季/年度统计数据、全国年度统计公报、地方年度统计公报 可浏览每年度的《中国统计年鉴》 中华人民共和国卫生部 (www.moh.gov.cn) 在网站主页的“统计信息”栏目中,可浏览卫生部公布的统计公报、统计提要和中国卫生统计年鉴全文
(一)统计数据查询 CNKI数字搜索(number.cnki.net) 百度统计数据搜索(tjsj.baidu.com) 提供以数值知识元、统计图片/表格和统计文献作为基本的搜索单元 数据来源于CNKI的五大全文数据库,中央和各地统计网站、中央各部委网站的统计数据 百度统计数据搜索(tjsj.baidu.com) 对我国各种统计年鉴、统计报表等统计数据进行汇总并提供搜索的平台 目前有建国以来我国所有公开的政府统计年鉴和报表数据数十万条
(二)科技报告查询 Search NTIS 虚拟技术报告中心 (www.ntis.gov/search/index.aspx) 涉及数、理、化、生、农、医、工程、环境等350多个主题领域的300多万篇科技报告 虚拟技术报告中心 (Virtual Technical Reports Center) (www.lib.umd.edu/ENGIN TechReports/Virtual-TechReports.html)
(二)科技报告查询 国家科技成果网 (www.nast.org.cn) 国家科技部创建的国家级科技成果创新服务平台,其中“成果”栏目以国家科技成果库为核心,提供科技成果、技术项目等信息查询 现收录全国各地区、各行业经省、市、部委认定的权威性科技成果20万余项,其中收录医药卫生类成果超过2.4万项
三、公共版权资源检索 (一)Google Book Searc (books.google.com) (二)Google图书搜索 (books.google.cn) (三)Project Gutenberg (promo.net/pg)
四、其他免费学术资源检索 (一)过刊免费电子期刊的检索 (二)会议日程检索 (三)博客(Blog)检索
(一)过刊免费电子期刊的检索 HighWire Press http://www.highwire.org 截至2008年7月9日,收录1157种期刊的100多万篇免费全文,其中免费期刊约297种(42种全刊免费,11种免费试用期刊,253种过刊免费) http://highwire.stanford.edu/lists/freeart.dtl 同时提供Medline检索与全文收费获取服务。 凡有FREE标记的文献,点击Full Text或PDF链接可在线获取免费全文。
(一)过刊免费电子期刊的检索 免费注册个人账户 关键词高级检索入口 关键词快速检索区 按主题浏览论文 按字顺浏览刊名 浏览免费期刊列表
HighWire —Search Articles 检索结果 全文下载 免费全文标记
(一)过刊免费电子期刊的检索 FreeMedicalJournals http://www.freemedicaljournals.com 提供医学免费电子期刊浏览的专业网站 提供430种(2008.7.9)医学免费电子期刊,其中约300种期刊被Medline收录 只提供按刊名和学科浏览,无检索文献的功能 刊名后标有期刊的免费范围,未标注范围的期刊表示全刊免费 粗体刊名表示该刊被Medline所收录
(一)过刊免费电子期刊的检索 美国微生物协会 http://www.asm.org (ASM, American Society of Microbiology) 提供12种协会免费电子期刊浏览 进入步骤: 点击主页Publications>Journals栏目 可免费浏览Clinical Microbiology Reviews, Microbiology and Molecular Biology Reviews一年前的过刊 其余10种期刊可免费浏览4个月前的过刊 Search ASM Journals 检索会刊中的文献
美国微生物协会会刊
(一)过刊免费电子期刊的检索 美国心脏病协会 http://www.americanheart.org (AHA, American Heart Association,) 提供5种协会免费电子期刊浏览 进入步骤: 点击主页Science & Professional > Library > Journals 栏目 或直接输入网址 http://www.ahajournals.org/ 一年前过刊全部免费,一年内部分论文免费
美国心脏病协会会刊 按主题类别浏览协会全部期刊论文
(二)会议日程检索 Doctor’s Guide:Congress Resource Center Medical-events.com (www.docguide.com/crc.nsf) 美国Doctor’s Guide网站的医学会议预告中心 可浏览和检索全球即将召开的会议信息 Medical-events.com (www.medical-events.com) 提供全球医学会议检索的网站 可以按学科分类浏览会议预告信息,也可以在 “Finder of congresses中检索会议信息
(二)会议日程检索 Medicalconference.com 中国学术会议在线 (www.medicalconferences.com) 提供医学7000多种医学会议、医学继续教育CME信息的检索 中国学术会议在线 (211.68.23.76/a.asp) 由教育部科技发展中心主办 提供学术会议预告、会议专题报告视频、会议新闻等信息的网站
(三)博客(Blog)检索 BlogCatalog(www.blogcatalog.com) 全球博客主题目录,收集了全球各学科的博客,并提供按主题分类浏览和检索。 Google博客搜索(blogsearch.google.cn) 提供博客文章的全文搜索,可以用关键词搜索博客文章,也可以在高级搜索中对博客的标题、作者、网址进行检索,同时可以限定博客文章发布的时间和语种。