Download presentation
Presentation is loading. Please wait.
1
网络搜索引擎的使用介绍 天津商学院图书馆 王宏波
2
讲座主要内容 了解什么是搜索引擎 掌握搜索引擎的分类方法 了解各类搜索引擎的优先和缺点 掌握各类搜索引擎的使用方法
3
一、什么是搜索引擎? 搜索引擎是一个对互联网上的信息资源进行搜集整理,然后供用户查询的系统,它包括信息采集、信息整理和用户查询三部分。
4
二、搜索引擎的历史 早期的搜索引擎是从手工分类网址站发展起来的,适用于信息量不大的情况
现代搜索引擎技术用到了信息检索、数据库、数据挖掘、系统技术、多媒体、人工智能、计算机网络、分布式处理、数字图书馆、自然语言处理等许多领域的理论和技术
5
三、搜索引擎的分类 按信息采集方法分: 按用户搜索方法分: 按搜索结果类型分: 目录型----- Yahoo雅虎,搜狐、新浪、网易搜索
程序型 元搜索引擎 按用户搜索方法分: 目录型 关键词型 Google、Altavista、百度 混合型 按搜索结果类型分: 综合型 专业型 特殊型
6
各类搜索引擎的定义----目录搜索引擎 即是信息采集方式,也是信息搜索方法 特点:
信息采集:把搜集到的信息资源按照一定的主题分门别类,建立多级目录结构 信息搜索:逐层浏览打开目录,逐步细化,就可以查到所需信息 特点: 需以人工方式或半自动方式采集信息 优点:信息准确、导航质量高 缺点:需要人工介入,维护量大,信息量少,信息更新不够及时。 站点本身的动态变化不会反映到搜索结果中
8
各类搜索引擎的定义----蜘蛛程序搜索引擎
蜘蛛(Spider)程序自动访问网站,提取网页信息,并转移到相关链接页面 优点:信息量大、更新及时、不需要人工干预 缺点:返回信息过多
9
各类搜索引擎的定义----元搜索引擎 本身没有存放网页信息的数据库 将用户查询提交其他搜索引擎处理 对返回结果删重排序后返回给用户
优点:返回结果的信息量更大、更全 缺点:用户需要做更多的筛选 举例:万韦、3721、最酷网站
10
各类搜索引擎的定义----关键词搜索引擎
用户输入关键词查找所需的信息资源 方便、直接,可以使用逻辑关系组合关键词,对满足选定条件的资源准确定位
12
各类搜索引擎的定义----混合型搜索引擎兼有关键词型和目录型两种搜索方式,既可直接输入关键词查找特定信息,又可浏览目录了解某领域范围的资源
13
各类搜索引擎的定义----综合型搜索引擎
不限制搜索主题范围和数据类型
14
各类搜索引擎的定义----专业型搜索引擎
只搜集某一行业或专业范围内的信息资源
15
各类搜索引擎的定义----特殊型搜索引擎
搜集特定类型格式的信息 例如电话、人名、地址、图像、股市信息等
16
四、搜索引擎的使用 目录搜索引擎的使用 掌握目录分类原则,准确确定目标分类 关键词搜索引擎的使用 确定使用的搜索引擎和搜索关键词
查询条件具体化 使用多条件搜索 使用减号将不相关的关键词排除 使用引号来限定关键词的精确组合
17
(一) 知名搜索引擎举要 Google(http://www.google.com) 百度(http://www.baidu.com)
雅虎: 雅虎中国: 一搜( 新浪搜索( 搜狐搜索( 网易搜索( 图行天下(
18
(二)Google的使用技巧 Google简介:
Google( Page与Sergey Brin于1998年9月发明,Google Inc. 于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。98年至今,Google已经获得30多项业界大奖。到Google的新闻中心(
19
Google的成功得益于其强大的功能和独到的特点:
Google速度极快,年初时据说有15000多台服务器,200多条T3级宽带; Google的专利网页级别技术PageRank能够提供准确率极高的搜索结果;
20
Google智能化的“手气不错”功能,提供可能最符合要求的网站;
Google的“网页快照”功能,能从Google服务器里直接取出缓存的网页。 Google具有独到的图片搜索功能; Google具有强大的新闻组搜索功能; Google具有二进制文件搜索功能(PDF,DOC,SWF等); Google还有很多尚在开发阶段的令人吃惊的设想和功能。
21
搜索结果要求包含两个及两个以上关键字 示例:搜索所有包含关键词“搜索引擎” 的中文网页 搜索:“搜索引擎” 结果:搜索 搜索引擎 获得约 294,000,000 条结果(启用了安全搜索功能),以下是第 1-10 条。 (用时 0.11 秒) 搜索: “搜索引擎 历史“ 结果:搜索 搜索引擎 历史 获得约 2,680,000 条结果(启用了安全搜索功能),以下是第 1-10 条。 (用时 0.07 秒)
22
搜索结果要求不包含某些特定信息 Google用 “-”表示逻辑“非”操作。“A-B”表示搜索包含A但没有B的网页。 示例:搜索所有包含“搜索引擎”和“历史”但不含“文化”、“中国历史”和“世界历史”的中文网页 搜索:“搜索引擎 历史 -文化 -中国历史 -世界历史” 结果: 搜索 搜索引擎 历史-文化-中国历史-世界历史 获得约 1,720,000 条结果(启用了安全搜索功能),以下是第 1-10 条。 (用时 0.09 秒) 。
23
搜索结果至少包含多个关键字中的任意一个 Google用大写的“OR”表示逻辑“或”操作。搜索“A OR B”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B。 示例:搜索如下网页,要求含有“计算机”和“电脑”, 搜索:“计算机 OR 电脑” 搜索 计算机 OR 电脑 获得约 236,000,000 条结果(启用了安全搜索功能),以下是第 1-10 条。 (用时 0.09 秒) 注意:“与”操作必须用大写的“OR”,而不是小写的“or”。
24
其他技巧: 例:以德治国、以法治国、以党治国 ⑴通配符问题 很多搜索引擎支持通配符号,如“*”代表一连串 字符,“?”代表单个字符等。
Google对通配符支持有限。它目前只可以用 “*”来替代单个字符,而且包含“*”必须用“”引起来。比如,“”以*治国“”,表示搜索第一个为“以”,末两个为“治国”的四字短语,中间的“*”可以为任何字符。 例:以德治国、以法治国、以党治国
25
⑵关键字的字母大小写 Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。 搜索整个短语或者句子
示例:搜索关于第一次世界大战的英文信息。 搜索:“”world war I“” 结果: 搜索 “world war I” 获得约 15,700,000 条结果(启用了安全搜索功能),以下是第 1-10 条。 (用时 0.26 秒) 搜索: world war I 结果:搜索 world war I 获得约 461,000,000 条结果(启用了安全搜索功能),以下是第 1-10 条。 (用时 0.13 秒)
26
⑶搜索引擎忽略的字符以及强制搜索 Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。 搜索:“+www +的历史 internet” 结果:搜索 +www +的历史 internet 获得约 948,000 条结果(启用了安全搜索功能),以下是第 1-10 条。 (用时 0.14 秒)
27
另一个强制搜索的方法是把上述的关键字用英文双引号引起来。在上例
搜索:“www的历史 internet” 结果: 搜索 “www的历史 internet” 获得约 18,300 条结果(启用了安全搜索功能),以下是第 1-10 条。 (用时 0.52 秒) 搜索:www的历史 internet 结果:搜索 www的历史 internet 获得约 2,210,000 条结果(启用了安全搜索功能),以下是第 1-10 条。 (用时 0.05 秒)
28
⑷更好使用google的几个参数介绍 对搜索的网站进行限制
“site”表示搜索结果局限于某个具体网站或者网站频道,如“ 示例:搜索中文教育科研网站(edu.cn)上关于搜索引擎技巧的页面。 搜索:“搜索引擎 技巧 site:edu.cn” 结果:已搜索有关搜索引擎 技巧 site:edu.cn的中文(简体)网页。 共约有608项查询结果,这是第1-10项 。 搜索用时0.05秒。 注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“
29
常用域名举例:
30
在某一类文件中查找信息 “filetype:”是Google开发的非常强大实用的一个搜索语 法。目前,Google已经能检索微软的Office文档 如.xls、.ppt、.doc,.rtf,WordPerfect文档,Lotus1-2-3 文档,Adobe的.pdf文档,ShockWave的.swf文档 (Flash动画)等。 其中最实用的文档搜索是PDF搜索。PDF是ADOBE公 司开发的电子文档格式,现在已经成为互联网的电子化 出版标准。目前Google检索的PDF文档大约有2500万左 右,大约占所有索引的二进制文档数量的80%。PDF文 档通常是一些图文并茂的综合性文档,提供的资讯一般 比较集中全面。
31
示例:搜索几个资产负债表的Office文档。 搜索:“资产负债表 filetype:doc OR filetype:xls OR filetype:ppt” 结果:搜索 资产负债表 filetype:doc OR filetype:xls OR filetype:ppt 获得约 51,900 条结果(启用了安全搜索功能),以下是第 1-10 条。 (用时 0.06 秒) 。
32
搜索的关键字包含在URL链接中 “inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。 示例:查找MIDI曲“稻香”。 搜索:“inurl:midi “稻香” 结果:搜索 inurl:midi “稻香 获得约 146 条结果(启用了安全搜索功能),以下是第 1-10 条。 (用时 0.13 秒) 注意:“inurl:”后面不能有空格,Google也不对URL符号如“/”进行搜索。例如,Google会把“cgi-bin/phf”中的“/”当成空格处理。 “allinurl”语法返回的网页的链接中包含所有作用关键字。这个查询的关键字只集中于网页的链接字符串。
33
搜索的关键字包含在网页标题中 “intitle”和“allintitle”的用法类似于上面的inurl和allinurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。 示例:查找法国歌手Alizee照片集。 搜索:“intitle: Alizee "写真集"” 结果: 搜索 intitle: Alizee "写真集" 获得约 136 条结果(启用了安全搜索功能),以下是第 1-10 条。 (用时 0.13 秒) 。
34
搜索所有链接到某个URL地址的网页 示例:搜索所有含指向华军软件园“ 搜索:“link: 查找与某个页面结构内容相似的页面 例:搜索所有与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等) “related:wwwsina.com.cn/index.shtml”。 从Google服务器上缓存页面中查询信息 “cache”用来搜索Google服务器上某页面的缓存,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。
35
(6)google的其他功能 图片搜索(logo-yahoo) 目录检索 新闻组搜索 网页快照 单词英文解释 网页翻译 单词纠错 简繁转换
39
(7)Google学术搜索简介 网址: http://scholar.google.com/ 什么是 Google 学术搜索?
42
Google 学术搜索的功能 从一个位置方便地搜索各种资源 查找报告、摘要及引用内容 通过您的图书馆或在 Web 上查找完整的论文 了解任何科研领域的重要论文
43
Google 学术搜索技巧 如何按作者搜索?
输入加引号的作者姓名:"d knuth"。要增加结果的数量,请不要使用完整的名字,使用首字母即可。 如果您找到太多提及该作者的论文,则可以使用 "作者:"操作符搜索特定作者。例如,您可以尝试 [作者:"knuth"]、[作者:"d knuth"] 或 [作者:"donald e knuth"]。
44
如何按标题搜索? 输入加引号的论文标题:"A History of the China Sea"。Google 学术搜索会自动查找此论文以及提及此论文的其他论文。
45
怎样找到某一特定论题的最新研究进展? 在任一搜索结果页,单击右手边的“近期文章”链接,即可显示与您搜索话题相关的最新研究进展。这部分结果根据其他相关因素排名,可帮助您更快找到较新的研究发现。 注: 其他搜索设定可以在”高级搜索”中进行设置.
46
2、百度的使用技巧 (1) 简单搜索使用技巧 百度搜索简单方便。您只需要在搜索框内输入需要查询的内容,敲回车键,或者鼠标点击搜索框右侧的百度搜索按钮,就可以得到最符合查询需求的网页内容。 输入多个词语搜索(不同字词之间用一个空格隔开),可以获得更精确的搜索结果。 例如:想了解上海人民公园的相关信息,在搜索框中输入 [上海 人民公园] 获得的搜索效果会比输入 [人民公园] 得到的结果更好。
47
(2) 如何选择适当的查询词 表述准确-----例如,要查找2004年国内十大新闻,查询词可以是“2004年国内十大新闻”;但如果把查询词换成“2004年国内十大事件”,搜索结果就没有能满足需求的了。 查询词的主题关联与简练-----如“小学三年级关于时间的名人名言”不如查询“时间名言”。 根据网页特征选择查询词-----如查询“林青霞 姓名 身高” 不如查询“姓名 身高 intitle:林青霞”。
48
(3) 与google不同的几种搜索语法 精确匹配——双引号和书名号 如果输入的查询词很长,百度在经过分析后,给出的搜索结果中的查询词,可能是拆分的。如果您对这种情况不满意,可以尝试让百度不拆分查询词。给查询词加上双引号,就可以达到这种效果。如“上海科技大学”和《手机》。 要求搜索结果中不含特定查询词 ----用减号语法,就可以去除所有这些含有特定关键词的网页。 天气查询-----例如,搜索“北京天气”,百度支持全国多达400多个城市和近百个国外著名城市的天气查询。
49
相关搜索 百度相关搜索排布在搜索结果页的下方,按搜索热门度排序 拼音提示 如,输入“zhurongji”,提示如下:您要找的是不是: 朱鎔基 错别字提示 如,输入“唐醋排骨”,提示如下:您要找的是不是: 糖醋排骨。 计算器和度量衡转换 ----log((sin(5))^2)-3+pi = 英汉互译词典
50
练习题: 1、能够区分几种搜索引擎的差异。 2、查询关于文献检索方面的PPT文件。 3、查找任意一个人的尽可能多的情况。
4、检索只包含计算机但不包含电脑的网页。 5、在 6、查找歌曲“烛光”的MP3文件。
Similar presentations