网络信息搜索专题
百度(baidu.com)/谷歌(google.com) 信息搜索工具 百度(baidu.com)/谷歌(google.com)
自我介绍:独一无二的王佑镁
Google世界中的王佑镁
Who is Wang Youmei?
+、-、OR +:用 “+”来表示逻辑“与”操作,只要空格就可以了。 -:用减号“-”表示逻辑“非”操作. OR:或者
“+”、“-”和“OR”的混合查询 混合查询涉及到逻辑操作符的顺序问题。一般而言,搜索引擎按照从左往右的顺序读取操作符号。如果只涉及“与”操作和“非”操作,则不会产生顺序问题,搜索结果数量和关键字顺序无关,不过,具体搜索的结果顺序会视关键字的顺序而定。单纯的“或”操作也同样道理。但是,如果“或”查询和其他两种查询混合在一起,问题就复杂了。
实例 现在我们做这样的查询:“所有关于Britney或者Beatles、但是没有Madonna相关信息的中文网页”。
比较 搜索:“Britney OR Beatles -Madonna” 结果:已搜索有关Britney OR Beatles -Madonna的中文(简体)网页。 共约有16,200项查询结果,这是第1-10项 。 搜索用时0.23秒。 搜索:“-Madonna Britney OR Beatles” 结果:已搜索有关-Madonna Britney OR Beatles的中文(简体)网页。 共约有16,200项查询结果,这是第1-10项 。 搜索用时0.13秒。 搜索:“Britney -Madonna OR Beatles” 结果:找不到和您的查询-Britney -Madonna OR Beatles-相符的网页 搜索:“Britney OR -Madonna Beatles” 结果:找不到和您的查询-Britney OR -Madonna Beatles -相符的网页 可见,“或”操作的前后两个关键字必须是默认的“与”查询,否则,搜索引擎将无法完成搜索。
提示 关键词不是仅限于单个的词,还应包括词组和短语。
如何才能找到最适合你的关键词呢 选择相关的关键词 选择具体的关键词 选用较长的关键词 别忘错拼的单词?
Baidu篇
百度技巧1 进入百度主页,在搜索栏中输入: site:网址 搜索内容 就可以对这个网站进行搜索!
百度技巧2 很多有价值的资料,在互联网上并非是普通的网页,而是以Word、PowerPoint、PDF等格式存在。百度支持对Office文档(包括Word、Excel、PowerPoint)、Adobe PDF文档、RTF文档进行了全文搜索。要搜索这类文档,很简单,在普通的查询词后面,加一个“filetype:”文档类型限定。“filetype:”后可以跟以下文件格式:DOC、XLS、PPT、PDF、RTF、ALL。其中,ALL表示搜索所有这些文件类型。 例如:查找张五常关于交易费用方面的经济学论文。 输入“交易费用 张五常 filetype:doc”,点击结果标题,直接下载该文档,也可以点击标题后的“HTML版”快速查看该文档的网页格式内容。 您也可以通过百度文档搜索(http://file.baidu.com),直接使用专业文档搜索功能。
(3) domain搜索参数 当我们在百度搜索引擎中随便输入任意一个域名(去除http://部分,例如21cn.com)再进行搜索,网页上除了能看到搜索结果外,还会出现一个提示:“如果您在寻找正文中包含“www.21cn.com/”的所有网页,请点击这里”(如图1),再单击此链接后你会发现在搜索栏中多了一个“domain:”参数,究竟这个参数是有什么作用的呢?现在就让我来为大家介绍一下。
domain具有“领域、范围”的意思,顾名思义,如果在某一网址前加上了domain就代表将在这一范围内进行搜索。我们首先用“domain:关键字”的形式来进行搜索,而关键字可以是网站的域名或IP地址(例如www.21cn.com/或61.140.60.83),但必须在英文输入状态下双引号把URL“包”起来(例如domain:“www.21cn.com/”),否则得到的结果会出现错误。 小提示 ★这个参数可以同时与其他搜索参数一起搭配使用,只要其它搜索语法中的关键词与该参数之间空一格即可。 ★在参数后的域名或IP地址可以直接使用http://xxxx.com的形式,但这样会大大减少搜索结果的数量,建议使用时去除http://部分。
(4)Filetype参数 互联网上除一般常见的网页格式外,还有如PDF、DOC、RTF、XlS、PPT等多种文件格式,尽管这些文件在数量上没有网页文件那样多,但这些文件通常都会包含一些别处没有的重要资料,因此往往具有独特的价值和吸引力。 如果你只想查找某个特定类型文件中的资料,而不要一般网页,只需在搜索关键词后边加上“filetype:文档类型”即可。目前百度支持的文档类型包括PDF、DOC、RTF、XlS、PPT、RTF、ALL(其中ALL表示搜索百度所有支持的文档类型)。 小提示 对一些无法确定文件类型的资料可以不妨考虑率先选用ALL格式,这样就不会错过任何一种有用的信息了。
(5)在指定网站内搜索 在一个网址前加"site:",可以限制只搜索某个具体网站、网站频道、或某域名内的网页。例如:[电话 site:www.baidu.com] 表示在http://www.baidu.com/网站内搜索和"电话"相关的资料;[竞价排名 site:baidu.com] 表示在baidu.com网站内搜索和"竞价排名"相关的资料; [intel site:com.cn] 表示在域名以"com.cn"结尾的网站内搜索和"intel"相关的资料;[门户 .cn] 表示在域名以"cn"结尾的网站内搜索和"门户"相关的资料;注意:搜索关键词在前,site:及网址在后;关键词与site:之间须留一空格隔开;site后的冒号":"可以是半角":"也可以是全角":",百度搜索引擎会自动辨认。"site:"后不能有"http://"前缀或"/"后缀,网站频道只局限于"频道名.域名"方式,不能是"域名/频道名"方式。
(6)在标题中搜索 在一个或几个关键词前加"intitle:",可以限制只搜索网页标题中含有这些关键词的网页。 例如, [intitle:南瓜] 表示搜索标题中含有关键词"南瓜"的网页;[intitle:百度 互联网] 表示搜索标题中含有关键词"百度"和"互联网"的网页。
(7)在url中搜索 在"inurl: "后加url中的文字,可以限制只搜索url中含有这些文字的网页。 例如, [inurl:mp3] 表示搜索url中含有"mp3"的网页;[inurl:网页] 表示搜索url中含有"网页"的网页;[inurl:china news] 表示搜索url中含有"china"和"news"的网页。
(8)并行搜索 使用“A|B”来搜索“或者包含词语A,或者包含词语B”的网页。 例如:您要查询“图片”或“写真”相关资料,无须分两次查询,只要输入 [图片|写真] 搜索即可。 百度会提供跟“|”前后任何字词相关的资料,并把最相关的网页排在前列。
Google篇
(1)查找 PDF 文件 除一般网页外,Google 现在还可以查找 Adobe 的可移植文档格式 (PDF) 文件。虽然 PDF 文件不象 HTML 文件那样多,但这些文件通常会包含一些别处没有的重要资料。 如果您只想查找 PDF 文件,而不要一般网页,只需在搜索关键词后加上 filetype:pdf 就可以了。
(2)网页快照 Google 在访问网站时,会将看过的网页复制一份网页快照,以备在找不到原来的网页时使用。单击“网页快照”时,您将看到 Google 将该网页编入索引时的页面。Google 依据这些快照来分析网页是否符合您的需求。 在显示网页快照时,其顶部有一个标题,用来提醒您这不是实际的网页。符合搜索条件的词语在网页快照上突出显示,便于您快速查找所需的相关资料。
(3)类似网页 Google 侦察兵可以“一兵多用”。如果您对某一网站的内容很感兴趣,但又嫌资料不够,Google 侦察兵会帮您找到其他有类似资料的网站;如果您在寻找产品信息,Google 侦察兵会为您提供相关信息,供您比较,使您尽可货比三家;如果您在某一领域做学问,Google 侦察兵会成为您的助手,帮您快速找到大量资料。 Google 侦察兵已为成千上万的网页找到了类似网页,但网页越有个性,能找到的类似网页就越少。例如,您独树一帜的个人主页就很难有类似网页。此外,如果公司有多个网址(如 google.com 和 www.google.com),Google 侦察兵为各个网址找到的类似网页可能会有所不同。但这种情况实属罕见,Google 侦察兵将是您出色的助手。
(4)按链接搜索 有一些词后面加上冒号对 Google 具有特殊的含义。其中的一个词是“link:”。查询 link: 显示所有指向该网址的网页。例如,“link:www.google.com”将找出所有指向 Google 主页的网页。不能将 link: 搜索与普通关键词搜索结合使用。
(5)指定网域 有一些词后面加上冒号对 Google 有特殊的含义。其中的一个词是“site:”。要在某个特定的域或站点中进行搜索,可以在 Google 搜索框中输入“site:xxxxx.com”。
(6)手气不错 按下“手气不错™”按钮将自动进入 Google 查询到的第一个网页。您将完全看不到其它的搜索结果。使用“手气不错”进行搜索表示用于搜索网页的时间较少而用于检查网页的时间较多。 例如,要查找 Stanford 大学的主页,只需在搜索字段中输入“Stanford”,然后单击“手气不错”按钮。Google 将直接带您进入 Stanford 大学的官方主页 www.stanford.edu。
(7)错别字改正 Google 的错别字改正软件系统会对输入的关键词进行自动扫描, 检查有没有错别字。如果发现用其他字词搜索可能会有更好的结果,它能提供相应提示来帮助纠正可能有的错别字。例如,搜索“互连网”,Google 会自动提示 “您是不是要找:互联网”。如果您点击 “互联网”,Google 将以“互联网”作为关键词进行搜索。 因为Google 的错别字改正软件系统是建立在互联网上所能找到的所有词条之上,它能够提示常用人名及地名的最常见的书写方式,这是一般的错别字改正软件所不及的。
(8)中英文字典 Google 给中英文单词互译带来了极大的方便。您只需输入一个关键词(“翻译”,“fy” 和“FY” 任选其一)和要查的中 (英) 文单词,Google返回的网上字典链接让您即刻便可知道您要查的词的英文(或中文)翻译。如果是中译英,Google还会直接显示您要查的单词的英文释义。
(9)天气查询 用Google 查询中国城市地区的天气和天气预报,只需输入一个关键词(“天气”,“tq” 或“TQ” 任选其一)和您要查询的城市地区名称即可。Google返回的网站链接会带给您最新的当地天气状况和天气预报。
(10)股票查询 用Google 查询股票价格和股市行情,非常简洁方便。您只需输入一个关键词(“股票”,“gp” 和“GP” 任选其一)和想查询的股票证券名称或是其六位数代码,Google就会返回其他链接让您只要一次点击便能得到有关股票证券的详尽资料。
(11)邮编区号 用Google 查询邮政编码或长途电话区号,您只需输入关键词(“邮编”,“yb” 和“YB” 任选其一;“区号”, “qh” 和“QH” 任选其一)和要查的城市地名或邮政编码或电话区号即可。Google 会为您提供相关的所有信息,包括所在地的省市名称,邮政编码及长途电话区号。
(12)手机号码 用Google 查询手机电话号码归属地,您只需直接输入要查的号码即可(不需要任何关键词)。Google 能自动识别以13开头的11位数字为手机号码而返回相关的网站链接,让您即刻便知道答案。 目前 Google 简体中文界面的股票,天气,邮编区号和手机号码查询功能仅适用于中国大陆地区。
(13)搜索的关键字包含在URL链接中 “inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。
示例:查找MIDI曲“沧海一声笑”。 搜索:“inurl:midi “沧海一声笑”” 结果:已搜索有关inurl:midi “沧海一声笑”的中文(简体)网页。 共约有27项查询结果,这是第1-10项 。 搜索用时0.34秒。 注意:“inurl:”后面不能有空格,Google也不对URL符号如“/”进行搜索。例如,Google会把“cgi-bin/phf”中的“/”当成空格处理。 “allinurl”语法返回的网页的链接中包含所有作用关键字。这个查询的关键字只集中于网页的链接字符串。
(14)搜索的关键字包含在网页标题中 “intitle”和“allintitle”的用法类似于上面的inurl和allinurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。 示例:查找日本明星藤原纪香的照片集。 搜索:“intitle:藤原纪香 "写真集"” 结果:已搜索有关intitle:藤原纪香 "写真集"的中文(简体)网页。 共约有315项查询结果,这是第1-10项 。 搜索用时0.15秒。
(15)其他类型搜索 图片、论坛、新闻等
(16)如何选择服务器 Google在互联网上有许多镜像站点,用于搜索的服务器也有数千台,但你可知道,它们对各种语种更新的速度是各自不同的,而且各服务器的更新时间也是不一样的,其采用的更新方式经常是梯度式进行,即先更新某些服务器,后来全面更新。在使用中本人发现,Google对中文语种最快更新的服务器是以下这个网址:http://www3.google.com,因为当我使用http://www.google.com没有找到任何结果时改用http://www3.google.com进行搜索则常常有意想不到的效果,这种情况在搜索一些如时事新闻一类更新频繁的内容时效果更加明显。所以建议各位尽快更新书签中Google主页的网址。
(17)最后一招 首先打开Google,在关键词输入框中输入"index of/"inurl:lib(双引号为英文状态下),选择“搜索简体中文网页”选项,回车搜索,得到了一些网页,不要以为这是一些普通的页面,其实它们是一些图书网站的资源列表,点击打开它来看看,怎么样?是不是所有资源一收眼底了?