Download presentation
Presentation is loading. Please wait.
1
Google及其使用 基本介绍 常用检索方法 特殊功能
2
Google (http://www.google.com)
Google是从第一代搜索引擎中脱颖而出的第二代搜索引擎的代表。1998年,两位斯坦福大学的博士生Larry Page和Sergey Brin创立了Google,它的使命就是要为用户提供网上最好的查询服务,促进全球信息的交流。 Google开发出了世界上最大的搜索引擎,提供了最便捷的网上信息查询方法。通过对20多亿网页进行整理,可为世界各地的用户提供适合需要的搜索结果,而且搜索时间通常不到半秒。现在,Google每天提供1.5亿次查询服务
3
Google的技术特点 (1)Google并非只使用关键词或代理搜索技术,它将自身建立在高级的PageRank™(网页级别)技术基础之上,这项技术可确保始终将最重要的搜索结果首先呈现给用户。 (2)网页级别可对网页的重要性进行客观的分析。用于计算网页级别的公式包含5亿个变量和20多亿个项。网页级别利用巨大的网络链接结构对网页进行组织整理。实质上,当从网页A链接到网页B时,Google就认为“网页A投了网页B一票”。 (3)Google复杂的自动搜索方法可以避免任何人为感情因素。与其他搜索引擎不同,Google的结构设计即确保了它绝对诚实公正,任何人都无法用钱换取较高的排名。Google可以诚实、客观并且方便地帮助用户在网上找到有价值的信息。
4
Google的检索方法 1.分类检索 在Google首页中选择“网页目录”(Directory),即可进入Google分类目 录检索界面。
为若干小类. 该目录里目前收录了来自150万个以上网站的网页。用户可按相关类目进 行检索。例如,在Google目录的Science > Astronomy > Solar System 类别中搜索“Saturn”,可以找到只与Saturn(土星)有关的信息。而不 会找到“Saturn”牌汽车、“Saturn”游戏系统,或“Saturn”的其它含义。
5
分类检索(网页目录)
7
2.关键词检索 Google关键词检索分为基本检索和高级检索 基本检索界面查询简洁方便,仅需输入查询内容并按一
下回车键 (Enter),或单击“Google Search”按钮即可得到相关 资料。Google查询严谨细致,能帮助用户找到最重要、最相关 的内容。例如,当Google对网页进行分析时,它也会考虑与该 网页链接的其它网页上的相关内容。Google还先列出那些搜索 关键词相距较近的网页。 自动使用“and”进行查询。 Google只会返回那些符合用户的全 部查询条件的网页。不需要在关键词之间加上“and”或“+”。如 果您想缩小搜索范围,只需输入更多的关键词,只要在关键词 中间留空格就行了。
8
忽略词。Google会自动过滤掉最常用的词和字符,这些词和字符 称为忽略词。例如:的、了、吗、和,及http、.com等字符以及
数字和单字,这类字词不仅无助于缩小查询范围,而且会大大 降低搜索速度。使用英文双引号可将这些忽略词强加于搜索 项。 例如:输入“柳堡的故事”时,加上英文双引号会使“的”强加于 搜索项中。 根据上下文确定要查看的网页。每个Google搜索结果都包含从 该网页中抽出的一段摘要,这些摘要提供了搜索关键词在网页 中的上下文。
9
Google不使用“词干法”,也不支持“通配符”(*) 搜索。也就是说,
例如:搜索“googl”或“googl*”,不会得到类似“googler”或 “googlin”的 结果。 Google对检索词的位置和顺序敏感。 例如:检索“神舟飞船 杨立伟”,它会优先 返回“神舟飞船”在前,“杨立 伟”在后的记录 Google搜索不区分英文字母大小写,所有的字母均当做小写处理。 例如:搜索“google”、“GOOGLE”或“GoOgLe”,得到的结果都一样。 简繁转换。Google运用智能型汉字简繁自动转换系统,为用户找到更多相关信息。这个系统不是简单的字符变换,而是简体和繁体文本之间的“翻译”转换。 例如,简体的“计算机”会对应于繁体的“电脑”。
10
缩小搜索范围 1.添加搜索词 2.减除无关资料 3.短语搜索 由于Google 只搜索包含全部查询内容的网页,所以缩小搜索范
围的简单方法就是添加搜索词。添加词语后,查询结果的范围就 会比原来的“过于宽泛”的查询小得多。 2.减除无关资料 如果要避免搜索某个词语,可以在这个词前面加上一个减号 (“-”, 英文字符)。但在减号之前必须留一空格。 3.短语搜索 在 Google 中,可以通过添加英文双引号来搜索短语。双引号中 的词语(比如“like this”)在查询到的文档中将作为一个整体出 现。这一方法在查找名言警句或专有名词时显得格外有用。一些 字符可以作为短语连接符。Google 将“-”、“\”、“.”、“=”和“...” 等标点符号识别为短语连接符。
11
缩小搜索范围 4.指定网域 有一些词后面加上冒号对 Google 有特殊的含义。其 中有一个词是“site:”。要在某个特定的域或站点中进行搜索,可以在 Google 搜索框中输入 “site:……”。 例如,要在 Google 站点上查找新闻,可以输入: 示例: 5.按类别搜索 利用 Google 目录 可以根据主题来缩小搜索范围。 例如,在 Google 目录的 Science > Astronomy 类别中搜索“Saturn”,可以找到只与 Saturn(土星)有关的信息。而不会找到“Saturn”牌汽车、“Saturn”游戏系统,或“Saturn”的其它含义。 在某个类别的网页中搜索可以快速找到所需的网页。
12
通常,只需在范围较广的查询中添加词语就可以缩小搜索范围。不过,Google 还提供了很多不同的搜索功能,利用这些功能可以做到:
6.高级搜索 通常,只需在范围较广的查询中添加词语就可以缩小搜索范围。不过,Google 还提供了很多不同的搜索功能,利用这些功能可以做到: 将搜索范围限制在某个特定的网站中 排除某个特定网站的网页 将搜索限制于某种指定的语言 查找链接到某个指定网页的所有网页 查找与指定网页相关的网页 利用 Google 的高级搜索页可以很轻松地在搜索中应用这些功能。
13
Google的特殊功能 1.可查找 PDF、Flash 等13种非HTML文件
Google已经可以支持13种非HTML文件的搜索。包括:pdf、txt、zip、 Microsoft Office (doc, ppt, xls, rtf)、Shockwave Flash (swf)、PostScript (ps)和其它类型文档。新的文档类型只要与用户的搜索相关,就会自动显示在搜索结果中。 例如,如果您只想查找 PDF或Flash 文件,而不要一般网页,只需搜索 “关键词 filetype:pdf” 或“关键词 filetype:swf” Google同时也提供用户不同类型文件的“HTML版”,方便用户在即使没 有安装相应应用程序的情况下阅读各种类型文件的内容。用“HTML版” 阅读也能帮助用户防范某些类型的文档中可能带来的病毒。 总的来说,不同类型文件类型的搜索大大拓宽了Google用户能在网上获得的知识内容。Google将不断拓展新的可搜索文件种类。
14
Google的特殊功能 2.问答 3.网页快照 想知道日本有多少人口吗?长江的长度?摩洛哥的首都在哪里?只
在网上查找答案并将其显示在搜索结果的最上面。答案的来源也会 一起显示,以方便您了解更多相关的资料。 示例: 3.网页快照 Google 在访问网站时,会将看过的网页复制一份网页快照,以备在找不到原来的网页时使用。单击“网页快照”时,您将看到 Google 将该网页编入索引时的页面。 在显示网页快照时,其顶部有一个标题,用来提醒您这不是实际的网页。符合搜索条件的词语在网页快照上突出显示,便于您快速查找所需的相关资料。 尚未编入索引的网站没有“网页快照”,另外,如果网站的所有者要求 Google 删除其快照,这些网站也没有“网页快照”。
15
Google的特殊功能 4.相关搜索 5.类似网页 6.按链接搜索
Google 能够提供与您原搜索相关的搜索词。这些相关的搜索词是根据过去 Google 所有用户的搜索习惯和 Google 提供的计算两个搜索词之间相关度的独家技术而产生出来的。这些相关的搜索词一般比原搜索词更常用,并且更可能产生相关的结果。 5.类似网页 单击“类似网页”时,Google 帮您找到其他有类似资料的网站;如果您在寻找产品信息,Google 侦察兵会为您提供相关信息,供您比较,使您尽可货比三家;如果您在某一领域做学问,Google 侦察兵会成为您的助手,帮您快速找到大量资料。 6.按链接搜索 有一些词后面加上冒号对 Google 具有特殊的含义。其中的一个词是“link:”。查 询 link: 显示所有指向该网址的网页。例如,“link: 指向 Google 主页的网页。不能将 link: 搜索与普通关键词搜索结合使用。 示例:
16
Google的特殊功能 7.指定网域 有一些词后面加上冒号对 Google 有特殊的含义。其中的一个词是“site:”。要在某个特定的域或站点中进行搜索,可以在 Google 搜索框中输入“site:xxxxx.com”。 例如,要在 Google 站点上查找新闻,可以输入: 示例: 8.手气不错 按下“手气不错™”按钮将自动进入 Google 查询到的第一个网页。您将完全看不到其它的搜索结果。使用“手气不错”进行搜索表示用于搜索网页的时间较少而用于检查网页的时间较多。 例如,要查找 Stanford 大学的主页,只需在搜索字段中输入“Stanford”,然后单击“手气不错”按钮。Google 将直接带您进入 Stanford 大学的官方主页
17
Google的特殊功能 9.定义 查看字词或词组的定义,只需键入“define”,接着键入一个空格,然后键入您需要其定义的词。如果 Google 在网络上找到了该字词或词组的定义,则会检索该信息并在搜索结果的顶部显示它们。 例如,[define: metadata]
18
基本检索(关键词)
23
高级检索(关键词)
28
打造你的科研助手 Google Scholar
29
概述(Introduction) 推出时间(launched ):2004年11月 网址:http://scholar.google.com
理念(faith):站在巨人的肩膀上
30
内容(Scope and Coverage )
不同于任何单一数据库,其组建策略是收集全球范围内的学术资源,是各种学术资源之集成者。 资源选择标准严格,进入Google Scholar的网页必须是学术相关内容,具有广泛性、全面性和学术性。 其资源的构成主要有以下几方面:
31
内容(Scope and Coverage )
网上免费学术资源 开放存取的期刊网站 收费电子资源提供商 图书馆链接
32
有许多机构网站(如大学、协会或学会),汇聚了大量本机构研究人员的学术成果,内容包括同行评论的文章(peer-reviewed papers)、论文(theses)、图书(books)、预印本(preprints、摘要(abstracts)、技术报告(technical reports)等学术文献,向公众提供免费访问。同时,有许多学者的个人网站也是其成果的发布网站,有许多有价值的学术文献。Google公司将这部分资源集中到Google Scholar中, 以提供更加专指的搜索结果。
33
许多传统的期刊出版商加入到开放存取(Open Access)期刊出版行列,如:①斯坦福大学的Hie,h wire出版社将,截至2OO7年1月16日,提供免费检索的期刊有1 011种,免费的论文全文达 篇。②英国牛津大学出版社开放2OO2年以来牛津大学作者出版的学术论文。③英国Biomed Central出版商,开放160余种经同行评议的期刊。 这些开放存取的期刊网站的内容已基本为Google Scholar所包括,可以通过Google Scholar检索并提供全文的链接。
34
有许多收费电子资源提供商也与G00gle合作,将其电子数据库的索引或文摘提供给Google Scholar,据研究表明:Google Scholar已覆盖了SpfingerLink的68%,Cambridge Journals Oilline的94% ,Sociological Abstracts 的44%等。 但这个来源的大多数只能查到文章题录信息,偶尔会有免费原文提供。中文的维普数据库和万方数据库也与Google Scholar合作,提供了中文期刊文章的题录信息。
35
这个项目是Google将其非在线信息转变为可搜索的在线信息计划的一部分,读者将在网上阅读到以前只能在图书馆找到的难以获得的珍贵图书。
Google公司向图书馆发出免费链接邀请,可以提供面向这些图书馆资源的链接和查询。早在2004年12月就与哈佛、斯坦福、密西根、牛顿大学图书馆以及纽约公共图书馆合作开展了网上图书馆项目,将这些图书馆的馆藏图书扫描制成电子版供全球读者通过Google在网上阅读。 全球已有100多家图书馆加入到Google Scholar的图书馆链接中。国内一些图书馆也相继与Coogle公司合作,如:国家图书馆、清华大学图书馆、国家科学数字图书馆等。从Google Scholar就可定位到这些图书馆的图书目录信息,对用户来说,即可以通过“图书馆链接”找到距离自己最近的图书馆,以获得图书。
36
检索方法(Retrieval Methods )
简单检索(Basic Search) 高级检索(Advanced Scholar Search ) 参数设置(Scholar Preferences )
37
简单检索界面 高级检索 参数设置 运算符: OR (逻辑或),NOT (逻辑非), Filetype:paf(检索PDF文档),
Memory “visual memory” 参数设置 简单检索 运算符: OR (逻辑或),NOT (逻辑非), Filetype:paf(检索PDF文档), intitle:(检索网页或文档的标题), site: (检索某个具体网站或者网站频道),author:(检索作者), inurl:(检索URL中的关键词)。
38
简单检索结果 简单检索结果
39
高级检索界面 按照作者检索 按照出版物检索 按照出版日期范围检索 检索词限于文章标题的检索或者全文检索 选择结果页面显示搜索结果条数
Memory Visual memory 检索词限于文章标题的检索或者全文检索 选择结果页面显示搜索结果条数 按照作者检索 按照出版物检索 按照出版日期范围检索 高级检索页面
40
Scholar Preferences China Scholar preference
41
结果显示(Search Results) 按照相关度对搜索结果进行排序的,具体表现在一篇文献被引用的次数排列。
格式:标题、作者、出版物名、出版年/期、摘要等。 三类记录(three record types) 互联网文献(Web documents) Article citation Book citation 举例说明(for examples)
42
1 2 3 结果显示
43
结果显示
44
利用Google scholar检索结果获取全文的方法一
“每组……个” ( “Group of ”) 表明该文章可能存在于多个来源中,点击可以获得该文章的多个来源。 举例:research behavior
45
people.cornell.edu -dspace.library.cornell.edu
点击进入后,有13个来源,去重后有7个来源 doi.wiley.com cat.inist.fr portal.acm.org muse.jhu.edu eric.ed.gov citeseer.ist.psu.edu people.cornell.edu -dspace.library.cornell.edu 其中,前5个为无法获取全文,而后两个可以获取全文。 分析: 可获取全文的为大多为开放获取网站和大学机构以及个人网站,一般为非授权,即免费公开,网址都带有.edu标记等。如:上例中的后两个能获得全文的网址,其中一个就是Cornell大学的机构仓储网站。 不可获取全文的是数据提供商网站、受限的机构仓储网站,一般需要授权或付费,如上例中的前5个网址。不过这些网站偶尔也有免费论文。
46
利用Google scholar检索结果获取全文的方法二
网页快照 Google的网页快照功能,是Google在爬行中针对PDF等文件的自动扫描、保存。这是获取全文的另一个很重要的途径。有许多全文在网上公开的时间有限,可能以前能看到,现在没有了。如果Google进行了网页快照,则即使原来的获取地址不存在,也仍然能看到全文。网页快照的标记是:题录信息下方的“网页快照”或“HTML版”按钮。
47
利用Google scholar检索结果获取全文的方法三
网页搜索 该功能是返回通用Google搜索帮助查找。从Google Scholar返回Google查询,所得到的检索结果比直接在Google中查询的专指度高,主要为与在Google Scholar中想要的文章相关的一些Pdf格式的文件,即使找不到原先想到的文章,也可以意外发现很多与该主题相关的学术资源。
48
页面转到Google普通检索,在第三条记录,可见该文信息。
进入后,发现这是Spink, A的个人网站,有很多作者的文章可下载,包括最近的文章,其中就有该篇文章。
49
正面评价(Pros) 对用户(for users) 对图书馆(for libraries)
对于无法获取收费的专业索引/文摘数据库的用户有重要意义。等价于几个价格昂贵的传统在线索引/文摘数据库。 对图书馆(for libraries)
50
存在的问题(Cons) Google Scholar击中的记录远少于出版商自带搜索引擎得到的结果 。 举例说明(for examples)
(Google Scholar vs. the publishers’ search engines) 举例说明(for examples) 在内容方面,Google Scholar有时会收录一些非学术性的资料;同时也会收录一些不准确的资料.
51
Google scholar Nature Blackwell比较
52
存在的问题(Cons Continued)
在检索结果排列方面,由于根据引文被引用情况排列,因此那些排在前面的论文往往是年份较早的,同时Google Scholar又没有提供按日期排列的服务 。 改进:“近期文章”按钮 排序方式无法自订
53
近期文章
54
近期文章结果
55
总结(Conclusions) Google Scholar的面世,为科研用户提供了一个强有力的学术搜索工具,它可以帮助用户第一手的全面了解某一领域的学术文献,可以帮助用户屏蔽掉网上许多无关信息,可以帮助用户找到信息的来源,可以帮助用户发现其还不了解的内容。(It helps us find out what we don’t know.)
Similar presentations