1 如何检索学习资料 广东第二师范学院 计算机科学系 陈国明
2 目录 1. 搜索引擎搜索网上信息 2. 查询的一般规则 3. 常用的搜索引擎 4. 知识库检索信息
3 搜索引擎( Search Engine ) 搜索引擎是一个用来搜索世界各地 Internet 网 络资源的 WEB 服务器 。它像一本书的目录, Internet 各个站点的网址就像是页码,可以 通过 关键词 或 主题分类 的方式来查找感兴趣的 信息所在的 WEB 页面。
4 检索界面的建立 每个搜索引擎都必须向用户提供一个良好的信 息查询界面,一般包括 分类目录 及 关键词 两 种信息查询途径。 思考:分类目录查询和关键词查询各自适合什么情况下 使用?各自的优缺点?
5
6
7
8
9
10
11 主要英文搜索引擎 ——Google 查找 特定格式的文件 Google 支持 13 种非 HTML 文件的搜索。 Google 现在还 可以搜索 Microsoft Office (doc, ppt, xls )、 pdf 、 Shockwave Flash (swf) 、 PostScript (ps) 和其它类型 文档。新的文档类型只要与用户的搜索相关,就会自 动显示在搜索结果中。 例如:若想查找 PDF 或 Flash 文件,而不要其他网 页,只需搜索 “ 关键词 filetype : pdf” 或 “ 关键词 filetype : swf” 就可以了。
12
13 搜索引擎的一般查询规则 1. 布尔逻辑算符 (1) 逻辑 “ 与 ” :一般用 “AND” 表示,有的搜索引擎还可以 用 “&” 表示。使用逻辑 “ 与 ” 是为了要求检索结果的 Web 页面中同时出现所有输入的检索词,提高查准 率。 (2) 逻辑 “ 或 ” :一般用 “OR” 表示,有的搜索引擎还可以用 “|” 表示。使用逻辑 “ 或 ” 是为了提高查全率。 (3) 逻辑 “ 非 ” :一般用 “NOT” 表示,有的搜索引擎还可用 “ ! ” 表示。使用逻辑 “ 非 ” 是为了缩小检索范围。
14 搜索引擎的一般查询规则 2. 连接符 连接符有加号( + )和减号( - )。 (1) 在检索词前使用 “+” 时,表示所有检索结果的页面 中都必须包含该词。例如:检索式 “+A+B” ,表示 查得的页面中应出现 “A” 和 “B” 方面的信息;而检索 式 “A+B” ,则表示在检索结果页面中一定含有 “B” , 但不一定有 “A” 的信息。 (2) 检索词前使用 “-” 时,表示任何检索结果的页面中 都不能包含该词。例如:检索式 “microwave- ceramic” ,则表示查找关于 microwave 的页面, 但排除那些和 ceramic 有关的页面。
15 搜索引擎的一般查询规则 3. 截词符 截词符一般用星号( * )表示。当 “*” 置于一个 词的末尾时,表示将相同词干的词全部检索 出来。例如;检索式 “compu*” ,则表示可 以检索到 computer 、 computing 、 compulsion 等词。有一些搜索引擎支持自 动截词,用户不需要专门输入截词符,系统 自动将相同词干的词全部找出来。注意: “*” 不能用在检索词的开始和中间。
16 搜索引擎的一般查询规则 4. 邻近符 邻近符( NEAR )它指定了检索词之间的距 离。用 NEAR/n ( n 为 1 , 2 , 3… )精确控制 检索词之间的距离,表示检索词的间距最大 不超过 n 个单词。例如:检索式 “Computer near/10 Network” ,可查找出 computer 和 Network 两词之间插入不大于 10 个单词的 文献,检索结果输出时,间隔越小的排列位 置越靠前。
17 搜索引擎的一般查询规则 5. 空格、逗号、括号、引号的作用 (1) 空格 空格的作用与逻辑 “ 与 ” ( AND )相同。在汉 字作为关键词输入时,切记不要在构成关键 词的两个字之间插入空格,否则,就会发生 两个字之间进行逻辑 “ 与 ” 的检索错误, 比较: “ 飞机 ”
18 搜索引擎的一般查询规则 (2) 逗号 逗号(,)的作用类似于逻辑 “ 或 ” ( OR ), 也是查找那些至少含有一个指定关键词的页 面,区别是,检索结果输出时,包含指定关 键词越多的页面,其排列的位置越靠前。 例如,检索式 “ 计算机,网络,多媒体 ” ,可 查出包含三个关键词中的任何一个或几个的 页面,而同时含有 “ 计算机 ” 、 “ 网络 ” 和 “ 多媒 体 ” 的页面输出时排在前面。
19 搜索引擎的一般查询规则 (3) 括号 括号 “( )” 的作用是使括在其中的运算符优先 执行,用于改变复杂检索式中固有逻辑运算 符优先级的次序。 例如,检索式 “ 多媒体 and (计算机 or 网 络) ” ,表示要求先执行括号中的 “OR” 运算, 再执行括号外的 “AND” 运算。
20 搜索引擎的一般查询规则 (4) 引号 引号( “ ” )的作用是,括在其中的多个词被当作 一个短语来检索。绝大部分主要搜索引擎都支持短 语检索,找到含有与短语词序和意义完全相同的页 面。 例如,检索式 “electronic magazine” ,表示把 electronic magazine 当作一个短语来搜索。如果 不加引号,搜索引擎就会把两词之间的空格按 “ 与 ” 处理,查出包含 electronic 和 magazine 的页面, 结果应与用户要求的主题内容相去甚远。
21 搜索引擎的一般查询规则 6. 限定字段检索 限定字段检索,即限定检索词在搜索引擎数 据库中某个字段范围进行查找,如网页标题、 站点、网址、链接等。 (1) 标题检索 标题检索就是在网页的标题中查找输入的检 索词,使用的命令一般是 “title” ,其格式为: title :检索式, 例如: title : mars title : mars landings title : “mars landings”
22 搜索引擎的一般查询规则 (2) 站点检索 站点检索就是在网站地址域名中检索输入的词, 以查找用户指定站点上的所有页面。使用的 命令一般是 “host” ,其格式为: host :域名 中的词, 例如,检索式 “host : digital.com” , 表示可以检索出 WWW 服务器中主机名为 “digital.com” 的网页。 假如想要查找关于火星着陆方面的资料,并且 只想在教育网站(后缀为.edu )中查找,可 以输入这样的检索式: “mars landings”+ host : edu 。
23 搜索引擎的一般查询规则 (3) URL 检索 有些搜索引擎提供在 URL 的文本中进行检索的 功能,这和站点检索非常相似。使用的命令 一般是 “url” ,其格式为: url : URL 中的词 例如,检索式 “url : home.html” 可以检索出在 网页地址中含有 “home.html” 的页面
24 搜索引擎的一般查询规则 (4) 链接检索 链接检索就是在与特定网页或域有链接的所有 网页中进行检索。使用的命令一般是 “link” , 其格式为: link :特定网页或域中的词 例如,检索式 “link : thomas.gov” 可以检索出 与 “thomas.gov” 至少有一次链接的页面。
25 主要英文搜索引擎 ——Yahoo ! Yahoo !( http : // ) Yahoo !是 Internet 上最受欢迎的搜索引擎,也是访问频率 最高的一个门户网站。它是由美国斯坦福大学的华裔博士 杨致远与他的同学 David Filo 于 1994 年开发的,在全球有 24 个网站, 12 个语言版本,其中雅虎中国网站 ( )于 1999 年 9 月正式开通。 Yahoo 提供了两种模式的检索方式:分类目录检索和关键词 检索。雅虎的特点在于其分类目录的内容组织。它对网点 信息按主题建立分类索引,按字母顺序列出 14 大类,每个 大类下还有多个二级类目,其所包含的子类有精练的描述, 每个子类有数以千计的网站信息。
26
27
28 主要中文搜索引擎 —— 天网中文
29 AltaVista AltaVista 是 DEC 公司 1995 年 12 月推出的万维 网搜索引擎
30 AskJeeves(
31 Excite 斯坦福大学 1993 年 8 月创建
32 MetaCrawler( ler.com/ )
33 知识库检索信息 “ 让全世界的人都可以自由的获取人类全部的 知识 ” 一、什么是维基百科( Wikipedia ) 维基百科(英文: Wikipedia )维基百科(英文: Wikipedia )是一个基于 Wiki 技术的全球性多语言百科全书协作计划, 同时也是一部用不同语言写成的网络百科全 书,是一个动态的、可自由访问和编辑的全 球知识体。
34
35
36
37
38
39 THANK YOU !