Google等搜索引擎 在文献检索方面的应用 ——学在图书馆(二) QQ咨询:45599956 邮件咨询: tsgweb@zucc.edu.cn 电话咨询: 88285701 祝黎丽 图书馆主页:libweb.zucc.edu.cn 图书馆微博:浙大城院学习空间 http://weibo.com/zdcytsg 图书馆博客:浙大城院图书馆学习空间 http://blog.sina.com.cn/zdcytsg
主要内容 搜索引擎的概念、分类及工作原理 搜索引擎使用原则 常用搜索引擎介绍 网上免费文献检索
搜索引擎的概念和分类 获得网站网页资料,能够建立数据库并提供查询的系统。 分类: 概念: 获得网站网页资料,能够建立数据库并提供查询的系统。 分类: 全文搜索引擎 Full Text Search Engine 分类目录 Directory
全文搜索引擎 全文搜索引擎的数据库是依靠一个叫“网络机器人”或叫“网络蜘蛛”的软件,通过网络上的各种链接自动获取大量网页信息内容,并按已定的规则分析整理形成的。Google、百度都是比较典型的全文搜索引擎系统。
分类目录 通过人工的方式收集整理网站资料形成数据库的,比如雅虎中国以及国内的搜狐、新浪、网易分类目录。另外,在网上的一些导航站点,也可以归属为原始的分类目录,比如“网址之家”。
搜索引擎的工作原理 全文搜索引擎的“网络机器人”或“网络蜘蛛”是一种网络上的软件,它遍历Web空间,能够扫描一定IP地址范围内的网站,并沿着网络上的链接从一个网页到另一个网页,从一个网站到另一个网站采集网页资料。它为保证采集的资料最新,还会回访已抓取过的网页。
搜索引擎的工作原理 分类目录:整个工作过程也同样分为收集信息、分析信息和查询信息三部分,只不过分类目录的收集、分析信息两部分主要依靠人工完成。分类目录一般都有专门的编辑人员,负责收集网站的信息。随着收录站点的增多,现在一般都是由站点管理者递交自己的网站信息给分类目录,然后由分类目录的编辑人员审核递交的网站,以决定是否收录该站点。如果该站点审核通过,分类目录的编辑人员还需要分析该站点的内容,并将该站点放在相应的类别和目录中。
搜索引擎使用原则 搜索关键词提练 细化搜索条件 用好逻辑命令 “AND”、“OR”、“NOT”及与之对应的“+”、“-” 精确匹配搜索 特殊搜索命令 链接(link)、网站(site)、标题(title) 附加搜索功能 用什么样的搜索引擎搜索
搜索关键词提练 形成一个比较清晰概念 产品?标准?资料性的文档 ? 分析信息的共性和特性 需要信息共同的特点 区别其他信息的特点 提炼关键词
细化搜索条件 搜索条件 越具体,返回的结果 越精确 搜索条件 越具体,返回的结果 越精确 一些功能词汇和太常用的名词,搜索引擎是不支持的。这些词被称为停用词(Stop Words)或过滤词(Filter Words),在搜索时将被搜索引擎忽略。 由于中英文在词语排列上的差异,建议主动将中文字词之间用空格隔开,以避免过多的无效搜索 。
用好逻辑命令 常用的是“+”号和“-”号 相对应的布尔(Boolean)逻辑命令AND、OR和NOT “+”号(AND)用于在搜索中指定涵盖某项内容,而“-”号(NOT)则用来从结果中排除某项内容
精确匹配搜索 使用“”引号来进行精确匹配查询(也称短语搜索) “”与逻辑+ 共同点:限定网页中要同时包含关键字 区别: “”号的查询范围更小 例: “computer adventure games”与 +computer +adventure +games 后者其顺序和相邻位置允许是任意的。前者关键字的顺序也要求完全相同,并且它们必须还是挨在一起的。 使用精确匹配,可以强制搜索引擎将停用词作为短语的一部分进行搜索
特殊搜索命令 ■ 标题搜索 返回的结果是标题中包含关键字、词的信息条目。 多数搜索引擎都支持针对网页标题的搜索,命令是“title:”,在Yahoo中是“t:”(注意冒号为英文字符且后面不跟空格)。在进行标题搜索时,前面提到的逻辑符号和精确匹配原则同样适用。 ■ 网站搜索 命令是“site:”(Google)、“host:”(AltaVista)、“url:”(Infoseek)或“domain:”(HotBot)。 ■ 链接搜索 在Google和AltaVista中,用户均可通过“link:”命令来查找某网站的外部导入链接(inbound links)。
用什么样的搜索引擎搜索 全文搜索引擎(Full-Text Search Engine) 参考资料 目录索引(Search Directory) 产品或服务
常用搜索引擎介绍 GOOGLE(谷歌) http://www.google.cn/ 百度 http://www.baidu.com/ Elsevier Scirus科学搜索引擎 http://www.scirus.com CNKI知识搜索 http://search.cnki.net/ Scopus搜索引擎 http://www.scopus.com
CNKI知识搜索 学术搜索 数字搜索 一切用数字说话 新概念搜索 追踪学术新概念 学术定义搜索 实现学术定义的快速查询 数字搜索 一切用数字说话 新概念搜索 追踪学术新概念 学术定义搜索 实现学术定义的快速查询 表格图片搜索 首创对学术图形、表格内容的搜索 翻译助手 全能翻译工具
输入检索关键词 检索出的翻译结果
输入检索关键词 近几年被引频次最高文章 某个特定月份浏览最多的文章
表格搜索
工具书搜索
Google简介 Google是由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明,Google Inc. 于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。1998年至今,Google已经获得30多项业界大奖。
特色搜索 1.filetype:pdf 湿地遥感 2.Site 足球 site:gov.cn 3.定义 define 湿地 http://www.google.cn/intl/zh-CN/help/features.html 1.filetype:pdf 湿地遥感 2.Site 足球 site:gov.cn 3.定义 define 湿地 4.手气不错 西溪湿地
特色搜索 5. intext 湿地 6. intitle 湿地 7. inurl wetland http://www.google.cn/intl/zh-CN/help/features.html 5. intext 湿地 6. intitle 湿地 7. inurl wetland
指定文件类型
限定网域
类似于CNKI的概念检索
检索的关键词包含在网页正文中
检索的关键词包含在网页标题中
检索关键词包含在网址中
Google Scholar Google学术搜索 http://scholar.google.com/
Google学术搜索返回的结果记录信息 标题。有链接,网上如有该文的免费全文(一般为PDF文件),则直接链接到可获取全文的网址。否则链接到该文文摘。文摘页面通常会告诉用户获取该文全文的途径和方法。一般为有偿服务; 作者; 出版物(通常为期刊名称或网站); 发表时间; 提供文献信息的单位; 该论文部分摘要; 该论文被其他学术文献引用的次数,并可链接到被引用的详细情况; 相关文章,可点击链接; HTML版,如该论文有免费全文。则由Google学术搜索自动生成HTML版本; 网页搜索,用Google普通搜索引擎再次搜索该论文。
本地馆藏链接
全文下载
无需进入数据库,直接google网页下载全文
里面显示的图书都是随机的,每次点击都不一样 Google book search 里面显示的图书都是随机的,每次点击都不一样
SCIRUS简介 2001年,Elsevier Science和挪威搜索引擎公司合作开发,专门面向科学家和科研人员的学术信息检索工具 以自然科学为主,如农业与生物学,天文学,生物科学,化学与化工,计算机科学,地球与行星科学,工程、能源与技术,环境科学,生命科学,材料科学,数学,医学,神经系统科学 也有部分社科资源,如经济、金融与管理科学,语言学,法学,心理学,社会与行为科学,社会学等 网址:http://www.scirus.com/
SCIRUS http://www.scirus.com/ 设置使用偏好
SCIRUS 检索举例 可以选择只检索期刊资源、精选网络资源还是其他网络资源 检索词组时,请注意勾选此选项
检索结果分类:期刊、精选网页、其他网络资源 查看期刊论文 保存标记的检索结果,将标记的检索结果发送email,导出标记的检索结果 系统推荐的检索词,可据此修改自己的检索词 二次检索框
查看期刊论文 查看期刊原文 馆藏链接按钮
查看期刊论文 此篇文章来源于ScienceDirect数据库 点击此链接,查看所有通过Scirus查询到的在Science Direct数据库中与检索需求相关的记录
学术网页 学术文献 专利信息 机构仓储 超过4亿个 科学、技术、医学及社会科学 机构及科学家主页 4000出版商出版的超过16000种期刊 开放仓储arXiv、NASA 预印本系统、课件等 学术文献 科学、技术、医学及社会科学 4000出版商出版的超过16000种期刊 包括1000余种开放获取期刊 500余种会议录 600余种商业出版物 超过125种丛书 专利信息 超过2000万条 USPTO(美国专利局) UKIPO(英国专利局) JPO(日本专利局) EPO(欧洲专利局) WIPO(世界知识产权组织) 机构仓储 接近13万条 Yale University\、MIT、 Stockholm University University of Hong Kong等
Scopus收录的内容—文摘 最早回溯到1823年 部分出版社论文文摘回溯至第一卷第一期,最早日期为1823年 Elsevier、Springer/Kluwer、Nature Royal Society of Chemistry、 American Chemical Society Institute of Physics、American Institute of Physics、和American Physical Society Article in Press 早于官方出版日期1-4个月(依期刊情况而定) Elsevier、Springer、Karger Medical,Scientific Publisher,Nature,BioMed Central和IEEE
Scopus的核心内容: 超过 15,000种全学科、同行评议期刊 Number of Peer-Reviewed Journals per Subject Area * 15,000 * Number of Journal Titles * * Titles can belong to multiple disciplines * * * * * “The coverage provided by Scopus is balanced in terms of subject areas when compared with Ulrich’s core.” De Moya (Scientometrics 2007)
Scopus的主页:http://www.scopus.com 输入检索词,并在下拉列表中选择检索字段
一键下载全文
检索结果处理 选择处理方式 打印、输出、电邮、加入列表
文献输出
数据库下载不到全文,怎么办? 向其它学校的同学求助(已经购买了收录该文章的数据库); 图书馆的文献传递服务; 网上各文献求助板块; 直接向该作者发E-mail索取; 5. 搜索免费代理服务器进入一些大型图书馆或数据库。
向作者索取原文的一份索取信示例 Dear Mr.(author name): I would appreciate receiving a reprint of your article:**(title of this paper).**journal name.However,this Journal is not available in Our library. I wonder if you would consider sending me the full text by E-mail.Thank you very much for your consideration! Sincerely: Your name
进入数据库的方式 IP地址:google搜索代理或者用代理搜索软件(proxyhunter等) 用户名和密码 刊物的名字+username+password password=welcome+(X)
需要输入户名和密码
检索已购买某数据库的高校的进校代理服务器
检索数据库用户名和密码
网络免费学术资源检索 2019/9/10
免费学术资源 网络免费学术资源是指在互联网上可以免费获得的具有学术研究价值的社会科学或自然科学领域的电子资源。
免费学术资源有哪些类型 开放获取的学术文献; 政府出版物; 公共版权资源; 其他免费资源。 其中开放获取学术文献资源包括开放获取期刊、开放获取图书、开放获取课件、开放获取学位论文、开放获取会议论文、学术机构收藏库、电子印本资源等。
开放获取的特点 定义:文献在因特网上可以被免费获取,允许任何用户阅读、下载、复制、传递、打印、搜索和超链接,用户在使用时不受财力、法律、或技术限制,只需在存取文献时保持完整性,版权归作者所有。 特点: 数字化 网络存档 免费,几乎没有授权的限制 使用者以免费方式存取信息,作者保留被存取之外的权利
开放获取出现的背景 科研人员将研究成果的版权有偿或无偿转移给出版商,出版商将其制作成各种文献,并通过特有的发行途径传播,再由个人使用者、图书馆、政府和科研单位购买使用。 这种学术信息传播和交流机制下,出版商日益垄断市场,学术交流在商业出版商控制下逐步被商业化。 另一方面,由于经费短缺、出版物价格上涨,支持科学研究的机构(公众)在学术资源收藏(获取)方面日益面临困难,尤其是欠发达国家的科研机构和人员难以获得和利用重要的科技信息资源。 开放获取目的就是打破出版商的垄断,将学术交流的主导权和控制权回到科研人员手里。
开放获取的文献类型 开放获取期刊 开放获取图书 电子印本系统 开放获取课程 开放获取学位论文、会议论文
开放获取期刊检索 1.Directory of Open Access Journal(DOAJ) 瑞典隆德大学(Lund Univ.)开发维护的开放获取期刊目录; 截至目前共提供各学科3982种OA期刊的简介和网站链接,有266050篇论文, 1421种期刊提供全文; 收录期刊全部有同行评审或编辑质量控制。 http://www.doaj.org/
开放获取期刊检索 2.High Wire Press High Wire Press是全球最大的提供免费全文的网站之一,由美国斯坦福大学High Wire 于1995年建立; 内容涉及生命科学、医学、物理科学及社会科学方面的期刊及非期刊性质的出版物; 目前收录140多家学术出版机构的电子期刊1232种,文章总数达5,607,502篇,其中1890041篇可免费获得全文; http://highwire.stanford.edu/
开放获取期刊检索 3 BioMed Central 非营利性学术出版机构,致力于提供生物医学文献的开放获取; 共出版202种生物医学OA期刊,并在不断出版新的期刊,所有期刊都经同行评审; BioMed还与Faculty of 1000合作,出版基于1000名以上学科权威推荐的生物学重点文献; 除期刊外,还提供生物医学类开放获取机构库(Open Repository)、著名学者个人开放存档(PeoplesArchive)、生物学图库(Biology Image Library)的查询; http://www.biomedcentral.com/
大部分期刊都是open access
开放获取期刊检索 4 PubMed Central(PMC) 美国卫生研究院和美国国立医学图书馆联合建立的生命科学和生物医学期刊文献免费存档系统; 凡由NIH资助的研究者发表的学术论文必须在该网站上保存一份数字拷贝,供永久开放存取; 截至2008年2月14日共收录期刊约469种。 http://www.pubmedcentral.nih.gov/
延期开放获取 即时开发获取
开放获取期刊检索 5 PLoS Journal (科学公共图书馆期刊) http://www.plos.org/ 成立于2000年,致力于推动全球科技和医学领域文献的免费获取。2002年成立期刊编辑部,成为非营利性组织出版商; 目前该组织共出版了8种期刊,所有期刊都是OA期刊,且均由同行专家严格评审,拒稿率达90%。 http://www.plos.org/
开放获取期刊检索 http://findarticles.com/ 6 FindArticles
预印本服务 学术论文预印本(preprint)是研究人员在一项研究过程中,一旦取得某些突破,出于与同行交流目的或自愿,在寄往杂志发表或在会议上交流之前,就以非正式论文发表的形式,自己印制一些论文单行本,通过邮寄迅速向国内外同行传播自己的学术成果。电子预印本(e-print),是通过因特网在专门网页上张贴学术成果,供用户浏览的一种电子出版方式。
电子印本系统 1、 中国预印本服务系统 中国科学技术信息研究所与国家科技图书文献中心联合建设的实时学术交流系统; 该系统包括国内预印本服务子系统和国外预印本门户两个子系统; 网址:http://prep.istic.ac.cn
电子印本系统 2、 奇迹文库 中国是国内最早的中文预印本服务器,由一群年轻的科学、教育与技术工作者发起并创建; 非盈利性质的网络服务项目,奇迹电子文库不是出版物,也没有审稿流程,资料全部为奇迹注册用户自行上传,这些资料的版权归原作者所有。 发布各种学术资料2800多项,主要收录中文科研文章、综述、学位论文、讲义及专著的预印本,内容涵盖自然科学、工程科学与技术、人文与社会科学等主要基础学科; 网址:http://www.qiji.cn/
电子印本系统 3、中国科技论文在线 http://www.paper.edu.cn/ 由教育部科技发展中心建立的一个电子印本系统,该网站提供国内优秀学者论文、在线发表论文、各种科技期刊论文(各种大学学报与科技期刊)全文,此外还提供对国外免费数据库的链接; http://www.paper.edu.cn/
开放获取课件 1、中国开放教育资源联合体(CORE) CORE网站是提供优质免费教育资源的双语网站 引进以美国麻省理工学院为代表的国外大学的优秀课件、先进教学技术、教学手段等资源,应用于中国的教学中。 主要业务 :国外开放课程的翻译 、国外开放课程的应用、中国精品课程翻译、国际合作与交流等 http://www.core.org.cn/
开放获取课件 MIT开放获取课件(MIT OpenCourseWare) 网址:http://ocw.mit.edu 网址:http://ocw.mit.edu 世界课堂(World Lecture Hall) 网址: http://wlh.webhost.utexas.edu/index.cfm 中国国家科学数字图书馆与化学相关的教学资源 网址: Http://chemport.ipe.ac.cn/ListPageC/Edu.shtml 日本开放式课程 网址:http://www.jocw.jp
开放获取学位论文 NDLTD 学位论文库 (美国国家自然科学基金的一个网上学位论文共建共享项目,利用Open Archives Initiative- OAI的学位论文联合目录,目前包含全球十几家成员,多数有全文) MIT Theses(MIT学位论文,多数有全文,下载时间稍长。) Virginia Polytechnic Institute and State University学位论文库 多数有全文,但论文列表前有“vt”标记的,不能访问全文。 Texas Digital Library(The Universit-y of Texas、Texas A&M University、 The University of Houston、Texas Tech Universit-y四所大学的部分学位论文,有全文。) DIVA Portal(北欧部分大学的学位论文,部分有全文。) Digital Scientific Publications from Swedish Universities(可查到瑞典学位论文以及其他科技出版物,有全文。) ETH 学位论文库(1999年以来的一些瑞士学位论文,有全文。)
开放获取学位论文 1、PQDD http://proquest.calis.edu.cn 2、伍斯特工学院电子学位论文 http://www.wpi.edu/Pubs/ETD 3、诺丁汉大学电子学位论文 http://etheses.nottingham.ac.uk 4、弗吉尼亚公共资产大学免费博、硕论文数据库 http://etd.vcu.edu/ETD-db/ETD-search/search 5、宾夕法尼亚州大学电子论文库 http://etda.libraries.psu.edu/ETD-db/ETD-search/search 6、北卡罗来纳州立大学 http://www.lib.ncsu.edu/ETD-db/ETD-search/search 7、俄亥俄州立大学电子学位论文全文数据库 http://www.ohiolink.edu/etd/search.cgi 8、田纳西大学电子学位论文数据库 http://diglib.lib.utk.edu/cgi/b/bib/bib-idx?c=etd-bib; cc=etd-bib;page=index 9、加拿大AMICUS学位论文检索系统 http://www.collectionscanada.gc.ca/thesescanada /index-e.html 10、比勒陀利亚大学的电子学位论文 http://upetd.up.ac.za
开放获取会议论文 AllConferences 该网站包含大量国际学术会议、商业会议信息,相关会议网站,会议预告等。 Science Conference Proceedings 由美国能源部(DOE)科技信息办公室(OSTI)维护,主要收集一些专业学会和国家实验室的会议文献,涉及学科:粒子物理、核物理、化学、石油、航空航天、气象、工程、计算机、电力等。 ASEE Proceedings 美国工程教育学会(American Society for Engineering Education)网站,可检索或浏览该学会1996-2007年的所有会议文献。并有即将召开的2008年会议信息。 中国学术会议在线 教育部科技发展中心主办的国内学术会议信息交流平台,涵盖学科领域广,更新及时。办有电子期刊《国际学术动态》,刊登国际学术会议评论、出国考察报告、国际合作项目进展等内容。使用该网站请先注册。
文献检索bbs 网上读书园地 http://readfree.net/bbs/ 零点花园论坛 http://www.soudoc.com/bbs/ 科技论坛 http://www.tech-domain.com 美河学习在线 http://www.eimhe.com/bbs/ 小木虫论坛 http://www.emuch.net/bbs/ 丁香园(生命科学专业论坛)http://www.dxy.cn/bbs/ 啄木鸟论坛 http://www.zhuomu.cn/ 研学论坛 http://bbs.matwav.com/ 阿果资源网 http://www.agpr.net/
谢 谢