GOOGLE搜索从入门到精通
2
前言
? 以前的学习,一般需要预先在肚子里存储下足够的知识,必要时,
就从海量的信息中提取所需的部分。
? 但是,到了信息领域大大超出, 四书五经, 的新时期,预先无目
的的吞下海量信息的学习方式就有些不合时宜了。
? 旧有的学习方式需要变更以适应这个信息爆炸的年代。目的明确
的去学习,即先知道要学什么,然后有目的的去寻找答案,这种
方式看上去更加有效率。
? 新的学习方式的实施的前提:
? 首先,要求学习者拥有一个包罗万象的信息库,以供随时抽取各种
目的信息;
? 其次,需要一个强劲的信息检索工具,以便高效率的从信息库中提
取信息。
? 很明显,Internet可以充当那个海量的信息库,而搜索引擎,则正是
寻找光明之火的绝好工具。
? 我们非常幸运的有了,GOOGLE
3
摘要
? 简要的介绍了 GOOGLE的历史和特点,
? GOOGLE的基本搜索语法和高级搜索语法,
? GOOGLE的特色功能,包括图片搜索、新闻组搜索和
集成工具条等,
? 简单的介绍了一些常用搜索技巧和实用个案。
? http://www.google.com/about.html
4
GOOGLE简介
? Google( www.google.com) 是一个搜索引擎,由两个斯坦福大学
博士生 Larry Page与 Sergey Brin于 1998年 9月发明,Google Inc,
于 1999年创立。 2000年 7月份,Google替代 Inktomi成为 Yahoo公
司的搜索引擎,同年 9月份,Google成为中国网易公司的搜索引擎。
98年至今,GOOGLE已经获得 30多项业界大奖。
? GOOGLE的成功得益于其强大的功能和独到的特点:
? GOOGLE支持多达 132种语言,包括简体中文和繁体中文;
? GOOGLE网站只提供搜索引擎功能,没有花里胡哨的累赘;
? GOOGLE速度极快,据说有 10000多台服务器,200多条 T3级宽带
? GOOGLE的专利网页级别技术 PageRank能够提供高命中率的搜索结果
? GOOGLE的搜索结果摘录查询网页的含有关键字的内容,而不仅仅是
网站简介;
? GOOGLE智能化的, 手气不错, 功能,提供可能最符合要求的网站;
? GOOGLE的, 网页快照, 功能,能从 GOOGLE服务器里直接取出缓存
的网页。
5
6
搜索入门
? 要用 GOOGLE做搜索,当然首先要进 GOOGLE网站 --
www.google.com; 不过,163.com和 yahoo.com.cn使用的实际
上也是 GOOGLE搜索引擎,只是对搜索结果进行了编排,但无法
提供一些特色功能,如图片搜索等。
? 第一次进入 GOOGLE,它会根据你的操作系统,确定语言界面。
需要提醒的是,GOOGLE是通过 cookie来存储页面设定的,所以,
如果系统禁用 cookie,就无法对 GOOGLE界面进行个人设定了。
? GOOGLE的首页很清爽,LOGO下面,排列了五大功能模块:网
站、图像、新闻组、网上论坛和目录服务。默认是网站搜索。
? 现在进行第一次搜索实践,要查找所有关于, 易筋经, 的中文网
站和网页。在搜索框内输入一个关键字, 易筋经,,然后点击下
面的, google搜索, 按钮(或者直接回车),结果就出来了。
? 搜索:, 易筋经,
结果:已搜索有关易筋经的中文 (简体 )网页。 共约有 44,500项查
询结果,这是第 1-10项 。 搜索用时 0.07秒。
7
8
初阶搜索
本节探讨多个关键字以及关键字间不同逻辑关系的查询。
? 搜索结果要求包含两个及两个以上关键字
? 一般搜索引擎需要在多个关键字之间加上, +”,而 GOOGLE无需用
明文的, +” 来表示逻辑, 与, 操作,只要空格就可以了。
? 示例:搜索所有包含关键词, 易筋经, 和, 吸星大法, 的中文网页
搜索:, 易筋经 吸星大法,
结果:已搜索有关易筋经 吸星大法的中文 (简体 )网页。 共约有 774
项查询结果,这是第 1-10项 。 搜索用时 0.24秒。
? 注意:搜索关键词外面的引号仅起引用作用,不能带入搜索栏内。
? 搜索结果要求不包含某些特定信息
? GOOGLE用减号, -” 表示逻辑, 非, 操作。
? 示例:搜索所有包含, 易筋经, 而不含, 吸星大法, 的中文网页
搜索:, 易筋经 -吸星大法,
结果:已搜索有关易筋经 -吸星大法的中文 (简体 )网页。 共约有
5,150项查询结果,这是第 1-10项 。 搜索用时 0.40秒。
? 注意:这里的, +” 和, -” 号,是英文字符,操作符与作用的关键
字之间,不能有空格。
9
初阶搜索(续)
? 搜索结果至少包含多个关键字中的任意一个
? GOOGLE用大写的, OR”表示逻辑, 或, 操作。假定你是布兰
妮和披头士的歌迷,现在要查找所有关于布兰妮和披头士的
中文网页。
? 示例:搜索包含布兰妮, Britney”或者披头士, Beatles”,或
者两者均有的中文网页。
搜索:, Britney OR Beatles OR 布兰妮 OR披头士,
结果:已搜索有关 Britney OR Beatles OR 布兰妮 OR披头士
的中文 (简体 )网页。 共约有 10,400,300项查询结果,这是第
1-10项。
? 注意:小写的, or”,在查询的时候将被忽略;这样上述的操
作实际上变成了一次, 与, 查询。
10
11
初阶搜索(续)
? 用, +” 和, -” 减少冗余信息
?, +” 和, -” 很多时候能够缩小搜索结果的范围,以提高查
询结果命中率。
? 例:查阅天龙八部具体是哪八部。分析:如果光用, 天龙八
部, 做关键字,搜索结果有 20,300项,而且前面的主要与金
庸小说《天龙八部》相关,很难找到所需要的资讯。可以用
两个方法减少无关结果。
? 1,如果知道八部中的某一部,比如阿修罗,增加, 阿修
罗, 关键字。, 天龙八部 阿修罗, 的搜索结果就只有
1,050项。
? 2,如果不知道八部中的任何一部,但知道这与佛教相关,
可以排除与金庸小说相关的记录。, 天龙八部 佛教 -金庸,
的查询结果为 1,120项,可以迅速找到需要的资料。
12
初阶搜索(续)
?, +”,, -” 和, OR”的混合查询
? 混合查询涉及到逻辑操作符的顺序问题。一般而言,搜索引擎按照从左
往右的顺序读取操作符号。如果只涉及, 与, 操作和, 非, 操作或单纯
的, 或, 操作,则不会产生顺序问题。
? 示例:查询:, 所有关于 Britney或者 Beatles,但是没有 Madonna相关信
息的中文网页, 。
? 搜索:, Britney OR Beatles -Madonna”
结果:已搜索有关 Britney OR Beatles -Madonna的中文 (简体 )网页。 共约有
16,200项查询结果,这是第 1-10项。 搜索用时 0.23秒。
? 搜索:, -Madonna Britney OR Beatles”
结果:已搜索有关 -Madonna Britney OR Beatles的中文 (简体 )网页。 共约有
16,200项查询结果,这是第 1-10项。 搜索用时 0.13秒。
? 搜索:, Britney -Madonna OR Beatles”
结果:找不到和您的查询 -Britney -Madonna OR Beatles-相符的网页
? 搜索:, Britney OR -Madonna Beatles”
结果:找不到和您的查询 -Britney OR -Madonna Beatles -相符的网页
? 可见,,或, 操作的前后两个关键字必须是默认的, 与, 查询,否则,
搜索引擎将无法完成搜索。
13
辅助搜索
? 通配符问题
? 很多搜索引擎支持通配符号,如, *” 代表一连串字符,,?”
代表单个字符等。 GOOGLE不支持通配符,只能做精确查询,
关键字中的, *” 或者,?” 会被忽略掉。
? 关键字的字母大小写
? GOOGLE对英文字符大小写不敏感,,GOD”和, god”搜索的
结果是一样的。
? 搜索整个句子
? GOOGLE的关键字可以是词组(中间没有空格),也可以是
句子(中间有空格),但是,用句子做关键字,必须加英文
引号。
? 示例:搜索包含, long,long ago”字串的页面。
搜索:, "long long ago"”
结果:已搜索有关 long long ago的中文 (简体 )网页。 共约有
16,500项查询结果,这是第 1-10项 。 搜索用时 0.06秒。 。
14
辅助搜索(续)
? 搜索引擎忽略的字符和词汇
? GOOGLE对一些网路上出现频率极高的英文单词,如, i”,“com”、
“www”等,以及一些符号如, *”,,,” 等,作忽略处理。
? 示例:搜索关于第一次世界大战的信息
搜索:, worldwar i”
结果:, i”太常用,没有被列入搜索范围。已向英特网搜索
,worldwar i”,共约有 67,000项符合 worldwar i的查询结果,这是
第 1-10项。 搜索用时 0.07秒。
? 强制搜索
? 如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明
文的, +” 号。
? 示例:搜索包含, Who am I?”的网页。如果用,” who am i?“”,
“Who”,“I”,“?”会被省略掉,搜索将只用, am”作关键字,所以应用
强制搜索。
搜索:,” +who +am +i“”
结果:已向英特网搜索, +who +am +i”,共约有 332,000项查询结
果,这是第 1-10项 。 搜索用时 3.68秒。
? 注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜
索关键字,加强制也不行。
15
进阶搜索
? 对搜索的网站进行限制
?, site”表示搜索结果局限于某个具体网站或者网站频道,如
,sina.com.cn”,“edu.sina.com.cn”,或者是某个域名,如
,com.cn”,“com”等等。如果是要排除某网站或者域名范围内的页
面,只需用, -网站 /域名, 。
? 示例:搜索中文教育科研网站( edu.cn) 上所有包含, 金庸, 的页
面。
搜索:, 金庸 site:edu.cn”
结果:已搜索有关金庸 site:edu.cn的中文 (简体 )网页。 共约有 1,730
项查询结果,这是第 1-10项 。 搜索用时 0.23秒。
? 示例:搜索新浪文教频道中关于鲁迅的信息。
搜索:, 鲁迅 site:edu.sina.com.cn”
结果:已在 edu.sina.com.cn搜索有关 鲁迅的中文 (简体 )网页。 共约
有 672项查询结果,这是第 1-10项 。 搜索用时 0.24秒。
? 注意,site后的冒号为英文字符,而且,冒号后不能有空格,否则,
,site:”将被作为一个搜索的关键字。此外,网站域名不能有任何, /”
的目录后缀;网站频道则只局限于, 频道名,域名, 方式,而不能是
,域名 /频道名, 方式。诸如, 金庸 site:edu.sina.com.cn/1/”的语法
是错误的。
16
进阶搜索(续)
? 查询某一类文件(往往带有同一扩展名)
? 语法:, filetype:”,现在已经可以搜索 15种,
? Adobe Portable Document Format (pdf)
? Adobe PostScript (ps)
? Lotus 1-2-3 (wk1,wk2,wk3,wk4,wk5,wki,wks,wku)
? Lotus WordPro (lwp)
? MacWrite (mw)
? Microsoft Excel (xls)
? Microsoft PowerPoint (ppt)
? Microsoft Word (doc)
? Microsoft Works (wks,wps,wdb)
? Microsoft Write (wri)
? Rich Text Format (rtf)
? Shockwave Flash (swf)
? Text (ans,txt)
17
进阶搜索(续)
? 查询某一类文件(往往带有同一扩展名)
? 最重要的文档搜索是 PDF搜索。 PDF是 ADOBE公司开发的电子
文档格式,现在已经成为互联网的电子化出版标准。目前
GOOGLE检索的 PDF文档大约有 2500万左右。 PDF文档通常是
一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
? 示例:搜索关于电子商务( ECOMMERCE) 的 PDF文档。
搜索:, ecommerce filetype:pdf”
结果:已向英特网搜索 ecommerce filetype:pdf,共约有
25,500项查询结果。 搜索用时 0.44秒。
? 可以看到,GOOGLE在 PDF档前加上了 [PDF]的标记,而且,
GOOGLE把 PDF文件转换成了文字档,点击, 一般文字档,,
可以粗略的查看该 PDF文档的大致内容。
? 注意,上述查询均是对 PDF内文的检索,,ecommerce”这个
关键字是包含在 PDF文档中的。
18
进阶搜索(续)
? 查询某一类文件(往往带有同一扩展名)
? 搜索 PDF文档还可以用, inurl:”语法。
? 示例:搜索关于电子商务( ECOMMERCE) 的 PDF文档。
搜索:, inurl:pdf ecommerce”
搜索结果数量大致相同,不过查询结果顺序略有差别。
?, filetype”的另一个强大用处在于图片搜索。后面将对
GOOGLE的图片搜索功能作详细说明,此处略提一下。
? 进入, http://images.google.com/”,查找关于本拉登的
JPG图片。
? 搜索:, Bin Laden filetype:jpg”
结果:搜索有关 Bin Laden filetype:jpg 的图片()。
(试验版) 共约有 1,630项查询结果,这是第 1-20项 。
搜索用时 0.14秒。
19
进阶搜索(续)
? 搜索的关键字包含在 URL链接中
?, inurl”语法返回的网页链接中包含第一个关键字,后面的关
键字则出现在链接中或者网页文档中。 INURL语法和基本搜
索语法的最大区别在于,前者通常能提供非常精确的专题资
料。
? 示例:查找微软网站上关于 windows2000的安全课题资料。
搜索:, inurl:security windows2000 site:microsoft.com”
结果:已在 microsoft.com内搜索有关 inurl:security
windows2000 的网页。 共约有 188项查询结果,这是第 1-
10项。 搜索用时 0.27秒。
? 注意:, inurl:”后面不能有空格,GOOGLE也不对 URL符
号如, /” 进行搜索。例如,会把, cgi-bin/phf”中的, /”
当成空格处理。
?, allinurl”语法返回的网页的链接中包含所有作用关键字。这
个查询的关键字只集中于网页的链接字符串。
? 语法:, allinurl:"cgi-bin" phf +com”
20
进阶搜索(续)
? 搜索的关键字包含在网页标题中
?, intitle”和, allintitle”的用法类似于上面的 inurl和 allinurl,只
是后者对 URL进行查询,而前者对网页的标题栏进行查询。
网页标题,就是 HTML标记语言 title中间的部分。网页设计的
一个原则就是要把主页的关键内容用简洁的语言表示在网页
标题中。因此,只查询标题栏,通常也可以找到高相关率的
专题页面。
? 示例:查找日本明星藤原纪香的照片集。
搜索:, intitle:藤原纪香 写真,
结果:已搜索有关 intitle:藤原纪香 写真的中文 (简体 )网页。
共约有 465项查询结果,这是第 1-10项 。 搜索用时 0.16秒。
21
其他罕用语法
? 搜索所有链接到某个 URL地址的网页
? 如果你拥有一个个人网站,估计很想知道有多少人对你的网
站作了链接。而, link”语法就能让你迅速达到这个目的。
? 示例:搜索所有含指向华军软件园, www.newhua.com”链接
的网页。
搜索:, link:www.newhua.com”
结果:搜索所有链接到 www.newhua.com的网页。共约有
856项查询结果,这是第 1-10项 。 搜索用时 0.17秒。
? 注意:, link”不能与其他语法相混合操作,所以, link:”后面
即使有空格,也将被 GOOGLE忽略。
? 查找与某个页面结构内容相似的页面
?, related”用来搜索结构内容方面相似的网页。例:搜索所有
与中文新浪网主页相似的页面(如网易首页,搜狐首页,中
华网首页等),,related:wwwsina.com.cn/index.shtml”。
22
其他罕用语法(续)
? 从 GOOGLE服务器上缓存页面中查询信息
?, cache”用来搜索 GOOGLE服务器上某页面的缓存,通常用于
查找某些已经被删除的死链接网页,相当于使用普通搜索结
果页面中的, 网页快照, 功能。
? 示例:查找 GOOGLE缓存的中文 yahoo首页
搜索:, cache:www.yahoo.com.cn”
结果:这是 Google内 http://cn.yahoo.com/ 的页库快照。
Google已先预览各网站,拍下网页的快照存档。
这网页可能有更新的版本,请按此查看新版。
Google 和网页作者无关,不对网页的内容负责。
...
23
其他罕用语法(续)
? info
? info用来显示与某链接相关的一系列搜索,提供 cache,link、
related和完全包含该链接的网页的功能。
? 示例:查找和新浪首页相关的一些资讯。
搜索:, info:www.sina.com.cn”
结果:有关 www.sina.com.cn的网页信息。
新浪首页
北京站 上海站 广东站,,.,首页,|,新闻,|,体育,|,财经,|,
科技,|,娱乐,|,游戏,|,军事,|,健康,|,教育,|,汽车,|,
女性,|,个人家园,,.,
简介, 位于北京的新闻中心,包括新闻与评论。
类别, World > Chinese Simplified > 新闻
Google 提供这个网址的信息,
查看 Google网页快照里 www.sina.com.cn的存档
寻找和 www.sina.com.cn类似的网页
寻找网页有链接到 www.sina.com.cn
寻找网页包含有 "www.sina.com.cn"
24
图片搜索
? 不得不承认,GOOGLE的图片搜索功能真是个伟大的发明!!
GOOGLE自称可以检索 320,000,000张图片,并称自己为, 互联网
上最好用的图像搜索工具, 。
? GOOGLE首页点击, 图像, 链接就进入了 GOOGLE的图像搜索界
面, images.google.com”。 在关键字栏内输入描述图像内容的关
键字,如, britney spears”,就会搜索到大量的小甜甜布兰妮的
图片。
? GOOGLE给出的搜索结果具有一个直观的缩略图( THUMBNAIL),
以及对该缩略图的简单描述,如图像文件名称,以及大小等。
? GOOGLE图像搜索目前支持的语法包括, +”,, -”,, OR”,
“site”和, filetype”。
? 示例:查找美国教育网上的宇宙大爆炸 jpg图片
搜索:, BIG BANG filetype:jpg site:edu”
结果:搜索有关 BIG BANG filetype:jpg site:edu 的图片。共约有
337项查询结果,这是第 1-20项。 搜索用时 1.99秒。
25
目录内搜索
? 如果不想搜索广泛的网页,而是想寻找某些专题网站,可以访问
GOOGLE的分类目录, http://directory.google.com/”,中文目录

,http://directory.google.com/Top/World/Chinese_Simplified/”。
? 目前 GOOGLE使用的分类目录采用了 ODP的内容。, Open
Directory Project”是网景公司所主持的大型公共网页目录。由全
世界各地的义务编辑人员审核挑选网页,并依照网页的性质及内
容来分门别类。因此,在某一目录门类中进行搜索往往能有更高
的命中率。
? 示例:查找关于癌症治疗以及护理方面的中文资料
搜索:先进入中文简体分类目录,再进入, 健康, 子目录,确定
选中, 只在健康中搜索, 单选项目。在搜索栏内填入, 癌症, 进
行搜索。
结果:在分类健康项中搜索癌症。共约有 370项查询结果,这是
第 1-10项。搜索用时 0.05秒。
? 可以看到,上述查询结果比普通的检索更有效,因为在分类中进
行搜索剔除了很多不相关的无效信息。
? 对于中文用户而言,最大的问题是志愿的中文目录编辑太少,导致
收录站点太少,因此搜索结果范围显得过于狭隘。
26
新闻组( USENET) 搜索
? 新闻组有详尽的分类主题,某些主题还有专人管理和编辑,具有
大量的有价值信息。由于新闻组包含的信息实在是海量,因此不
利用工具进行检索是不大可能的。除了搜索之外,GOOGLE还支
持新闻组的 WEB方式浏览和张贴功能。
? 进入 GOOGLE新闻组, http://groups.google.com/”,有两种信息
查找方式:
? 一层层的点击进入特定主题讨论组
? 直接搜索
? 示例:查找新闻组中关于山顶洞人的讨论信息
搜索:, 山顶洞人,
结果:在各群组内搜索山顶洞人共约有 18项查询结果,这是第 1-
10项。搜索用时 0.29秒。
? 新闻组中的帖子实在是多,而且又涉及一些普通搜索所没有的语
法,所以建议使用, 高级群组搜寻, 。新闻组高级搜索提供留言
内容、分类主题、标题、留言者、留言代码、语言和发布日期作
为条件进行搜索。(作者指发帖所用的唯一识别号电子信箱)
27
其他杰出功能
? 集成化的工具条
? 为方便搜索者,GOOGLE提供了工具条,集成于浏览器中,用户无
需打开 GOOGLE主页就可以在工具条内输入关键字进行搜索。此外,
工具条还提供许多其他功能,如显示页面 PageRank等。最方便的一
点在于用户可以快捷的在 GOOGLE主页、目录服务、新闻组搜索、
高级搜索和搜索设定之间切换。
? 欲安装 GOOGLE的工具条,可以访问, http://toolbar.google.com/”,
按页面提示可以自动下载并安装。
? 对于经常进行网络搜索者而言,GOOGLE工具条实在是必备的东
西!!
? 搜索结果过滤
? 网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良
企图,浏览者很容易掉入其中的陷阱。为此,GOOGLE设立了成人
内容过滤功能,见 GOOGLE的设置页面,
http://www.google.com/preferences,最底下有一个选项
SafeSearch Filtering。 不过,中文状态下的 GOOGLE尚没有这个功能。
28
其他杰出功能(续)
? 单词英文解释
? 写英文文章的时候,最头疼的事情就是对某个英文单词的用
法不确定。现在有了 GOOGLE,一切就迎刃而解了!无论是
想查找某个生词的意思还是想了解某个单词的用法,均可使
用在线词典。
? 进入英文 GOOGLE,输入要查的单词。举个例子,想查一下
suggest的用法。结果如下:, Searched the web for suggest,
Results 1 - 10 of about 8,000,000,Search took 0.08
seconds.,注意看上面句子中,单词 suggest下出现了一个横
线,点击这个链接,就跳转到另外一个网站
,http://www.dictionary.com/”,GOOGLE已经把单词提交给
该网站的查询脚本。看看这个网站所提供的详尽解释吧。
29
其他杰出功能(续)
? 网页翻译
? 懂英文,但是不见得就懂德文、法文、拉丁文。如果搜索出来的页
面是这些语言怎么办?呵呵,GOOGLE提供了网页翻译功能!!虽
然目前只支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文,
但是不得不承认,这是个杰出功能。
? 试着做以下搜索:, big bang site:fr”。 这个表示查找关于宇宙大爆
炸的法文网页。看第一条结果:
The Big Bang Website - [ Translate this page ]
..,A propos de Big Bang,Le dernier numéro en date,Les anciens
numéros,Autres
activités,Concerts progressifs en France,Emissions de radio,Liens,
perso.club-internet.fr/calyx/bigbang/ - 3k - Cached - Similar pages
有点晕。没关系,点击, Translate this page”按钮。再看结果,嗯,
大致能看明白,这原来是个叫, big bang”的乐队的网站,与大爆炸
无关,..
? 机器翻译是一个很前沿的人工智能课题,想指望翻译出来的结果跟
专门用英语撰写的内容是不可能的。但西文间的互相转译比中英文
机译强得多得多了。至少能看明白。
30
关键词选择初探
? 关键词的选择在搜索中起到决定性的作用,关键词选
择是最基本也是最有效的。
? 例一:查找《镜花缘》一书中淑士国酒保的酸话原文。
? 分析:如果按照一般的思路,找某部小说中的具体段落,就
需要用搜索引擎先找到这本书,然后再翻到该段落。这样做
当然可以,但是效率很低。如果了解目标信息的构成,用一
些目标信息所特有的字词,可以非常迅速的查到所需要的资
料。也就是说,高效率的搜索关键字不一定就是目标信息的
主题。在上面的例子中,酒保谈到酒的浓淡与贵贱的关系时,
之乎者也横飞。因此,可以用特定的词语一下子找到目标资
料。
? 搜索:, 酒 贵 贱 之,, OK,找到的第一条信息就是镜花缘
的这一段落:, 先生听者:今以酒醋论之,酒价贱之,醋价
贵之。因何贱之?为甚贵之?真所分之,在其味之。酒昧淡
之,故而贱之;醋味厚之,所以贵之。,..”
? 以上的关键字选择技巧可以谓之, 特定词法, 。
31
关键词选择初探(续)
? 关键词的选择在搜索中起到决定性的作用,关键词选
择是最基本也是最有效的。
? 例二:, 黄花闺女, 一词中, 黄花, 是什么意思。
? 分析:, 黄花闺女, 是一个约定的俗语,如果只用, 黄花闺

黄花, 做关键词,搜索结果将浩如烟海,没什么价值,因此
必须要加更多的关键词,约束搜索结果。选择什么关键词好
呢?备选的有, 意思,,, 含义,,, 来历,,, 由来,,
,典故,,, 出典,,, 渊源, 等,可以猜到的是,类似的
资料,应该包含在一些民俗介绍性的文字里,所以用诸如
,来历,,, 由来,,, 出典, 等词汇的概率更高一些。
? 搜索:, 黄花闺女 黄花 由来,,查到, 黄花, 原来出典于
《太平御览》,与南朝的寿阳公主相关。如果想获得第一手
资料,那就可以用, 太平御览 寿阳公主, 做搜索了。
? 以上的关键字选择技巧可以谓之, 近义词法, 。
32
关键词选择初探(续)
? 关键词的选择在搜索中起到决定性的作用,关键词选择是最基本
也是最有效的。
? 例三:刘德华的胸围是多少。
? 分析:非常直接的搜索是,,刘德华 胸围,,但事实上,这么搜索
出来的结果,尽是一些诸如, 刘德华取笑莫文蔚胸围太小, 之类的
八卦新闻,无法快速得到所需要的资料。可以想到的是,需要的资
料应该包含在刘德华的全面介绍性文字中,除了胸围,应该还包括
他的身高,体重,生日等一系列相关信息。 OK,这样就可以进一步
的增加其他约束性关键词以缩小搜索范围。
? 搜索:, 刘德华 胸围 身高,,没有料到的情况发生了,网上炙手可
热的痞子蔡《第一次亲密接触》里居然含有这样关键字,阿泰, 改
编自刘德华《忘情水》的变态歪歌,,, 用身高体重三围和生日来
加以编号, 。好办,把这部小说去掉,,刘德华胸围 身高 -阿泰,,
OK,结果出来了,华仔胸围 84cm。 说明一下,为什么用, 阿泰, 而
不用, 第一次亲密接触, 呢?这是因为小说的名字被转载的时候可
能有变动,但里面角色的名字是不会变的。
? 以上的关键字选择技巧可以谓之, 相关词法, 。
33
常用搜索个案
? 找人
? 分析:一个人在网上揭示的资料通常有:姓名,网名,性别,年龄,
毕业学校,工作单位,外号,住址,电话,信箱,BP,手机号码,
ICQ号,OICQ号等等。所以,如果要了解一下多年没见过的同学,
那不妨用上述信息做关键字进行查询,也许会有大的收获。
? 找书
? 分析一:常访问的电子图书馆类网站就那么几个,比如文艺类的
,www.shuku.net”。 于是可以用 SITE语法很简单的找到某本书(如
果该网站上有的话)。比如,,旧唐书 site:shuku.net”,就可以马
上找到该书。如果没有,通常别的网站上也很难找到。因此,找书
的关键,是了解一大批著名的图书馆网站。
? 分析二:上面介绍的第一项关键字选择技巧特定词法,对于迅速找
到某书或者文章也是极其有用的,当然,这得建立在你已经读过该
书,对书的内容有印象的基础上。比如如果了解堂吉诃德一书战风
车的大致内容,就可以用, 吉诃德风车 桑乔, 迅速找到该书。
34
常用搜索个案(续)
? 找软件
? 分析一:最简单的搜索当然就是直接以软件名称以及版本号为关键
字查询。但是,仅仅有软件名称和目标网站,显然还不行,因为搜
索到的可能是软件的相关新闻。考虑到下载页面上常有, 点击此处
下载, 或者, download”的提示语,因此,可以增加, 下载, 或者
,download”为关键字。例:搜索, winzip 8.0 下载, 。
? 分析二:很多网站设有专门的下载目录,而且就命名为, download”,
因此,可以用 INURL语法直接搜索这些下载目录。例:搜索
,winzip 8.0 inurl:download”。
? 在互联网上随意的下载软件是不安全的,因为供下载的软件有可能
带有病毒或者捆绑了木马,所以,对下载网站作一个限定,是一个
稳妥的思路。可以用 SITE语法达到这个目的。
? 共享软件下载完之后,使用的时候,软件总跳出警示框,或者软件
的功能受到一定限制。所以应该再找一个注册码。找注册码,除了
软件的名称和版本号外,还需要有诸如, serial number”,“sn”,“序
列号, 等关键字。现在,来搜索一下 winzip8.0的注册码。例:搜索
,winzip 8.0 sn”。
35
常用搜索个案(续)
? 找图片
? 除使用 GOOGLE提供的专门图片搜索功能,还可以组合使用
一些搜索语法,达到图片搜索之目的。
? 分析一:专门的图片集合,提供图片的网站通常会把图片放
在某个专门目录下,如, gallary”,“album”,“photo”、
“image”等。这样就可以使用 INURL语法迅速找到这类目录。
现在,试着找找小甜甜布兰妮的照片集。
搜索:, "britney spears" inurl:photo”。
? 分析二:提供图片集合的网页,在标题栏内通常会注明,这
是谁谁的图片集合。于是就可以用 INTITLE语法找到这类网页。
搜索:, intitle:"britney spears" picture”。
? 分析三:明星的 FANS通常会申请免费个人主页来存放他们偶
像的靓照。于是用 SITE语法指定某免费主页提供站点,是个
迅速找到图片的好办法。
搜索:, "britney spears" site:geocities.com”。
36
常用搜索个案(续)
? 找 MP3
? 分析一:提供 MP3的网站,通常会建立一个叫做 MP3的目录,
目录底下分门别类的存放各种 MP3乐曲。所以,可以用 INURL
语法迅速找到这类目录。现在用这个办法找找老歌, say
you say me”。
搜索:, "say you say me" inurl:mp3”
结果:已向英特网搜索 inurl:mp3 "say you say me",共约有
155项查询结果,这是第 1-10项。搜索用时 0.17秒。
? 分析二:也可以通过网页标题,找到这类提供 MP3的网页。
搜索:, "say you say me" intitle:mp3”
结果:已向英特网搜索 "say you say me" intitle:mp3,共约有
178项查询结果,这是第 1-10项。搜索用时 0.73秒。
? 当然,如果知道某个网站的下载速度快,而且乐曲全,就可
以用 SITE语法先到该网站上看看有没有目标乐曲。
37
GOOGLE搜索 FAQ
? Q,如何全面的了解 google.com?
A,查看网站相关页面, http://www.google.com/about.html”。
? Q,如何切换 google.com的初始语言界面?
A,点击搜索栏右边的, 使用偏好, ( Preferences),选择, 界
面语言, ( Interface Language) 中你期望的语言,点击最下面
的, 设定使用偏好, ( Save Preferences) 按钮。需要提醒的是,
GOOGLE使用 cookie记录这个偏好,所以如果把浏览器的 cookie
功能关掉,就无法进行设定。
? Q,如何设定每页搜索结果显示数量?
A,同上,进入使用偏好,在该页的, 查看结果, ( Number of
Results) 选择显示结果数,数目越大,显示结果需要的时间越长,
默认是 10项。
38
GOOGLE搜索 FAQ
? Q,搜索到的链接无法打开怎么办?
A,链接无法打开的原因很多,比如网站当机,或者页面已经死
掉等等,可以点击 GOOGLE的, 网页快照, 查看在 GOOGLE服务
器上的网页缓存。不过,如果该页面是被当地 ISP过滤的话,服
务器缓存还是无法打开。唯一的办法在于利用代理服务器,然后
在 URL栏内输入链接的 IP地址。
? Q,打开搜索结果的链接,可是该页面太大,很难找到一下子找
到目的资料怎么办?
A,直接打开, 网页快照,, GOOGLE会把关键词用不同颜色标
记出来,很容易找到。
? Q,点击每个查询结果的时候,我想单独弹出窗口,这该怎么办?
A,进入, 使用偏好, 界面,注意底部有个, 结果视窗, 项目,
选中, 开启新视窗以显示查询结果, 复选框然后存储设置就可以
了。
39
40
补充几点
? 几个关于 google的常识:
? 词典功能。在引擎中填入任何一个字,点击结果中的那个关
键字,google自动转到
www.dictionary.com 显示该字的解释。
? yahoo的搜索引擎买的就是 google,如果 google找不到,就别
去 yahoo了,也不要去网易。
? google每月更新一次 web 数据库,如果 google找不到,去更
新最勤的
www.alltheweb.com —— 9到 12天,或许有收获。 google的
新闻组数据库号称每天更新数次。
? google的爬虫只爬到每个文档的前 110k字节处就停止了,所
以长文档里面的部分,google会找不到。