大纲序言,Internet及其信息资源一、网络信息检索的常用技巧二、网络信息检索的主要途径三、关于搜索引擎的基本知识四、常用搜索引擎介绍 (实例 )
一、网络信息检索的常用技巧
1,布尔逻辑符号的使用
2,通配符的使用
3,Near符号的使用
4,双引号的使用
5,+、-的使用
6,字段检索和限制检索
1,布尔逻辑符号的使用布尔逻辑检索是最简单、最基本的匹配模式。
逻辑与,AND、*、&
A AND B,表示同时检索 A和 B。
逻辑或,OR、+、|
A OR B,表示检索 A或 B或 A和 B
逻辑非,NOT、-、!
A NOT B,表示检索不含 B的 A。
布尔逻辑提炼符 (),重新规定顺序。
A AND (B NOT C)
2,通配符的使用
通配符,也叫截词符,主要有星号*或问号?,
可代替任意字母组合。
econom*,表示:
economy,economic,
economics,economical,
economist,economize等
3,Near符号的使用
Near检索操作符,提供临近位置检索,检索词间距可以通过 near后的数值控制。
符号一般记为 (N)或 (nN),前者表示两侧检索词相邻;后者括号内小写 n,表示其两侧的检索词之间允许插入 0~ n个词。
library (N) digital,检索结果为 library digital或 digital
library;
econom* (2N) recovery,检索结果为 economic recovery,
recovery of the economy,recovery from economic
troubles等。
4,双引号的使用
双引号的作用是将引号中的词作为一个整体,进行匹配查找。
,digital library”,检索结果为含
digital library的专门资料,而非分别出现,digital”或,library”
的资料。
5,+、-的使用
+号表示该检索词一定要出现在检索结果中,如“+资源”表示检索结果中一定有“资源”方面的资料。
(大致相当于逻辑与 )
-号表示该检索词不能出现在检索结果中,如“-资源”表示检索结果中不包含“资源”方面的资料。
(大致相当于逻辑非 )
6,字段检索和限制检索
,t”或,u”加检索词,限定在特定字段检索。 t
表示只在标题中检索,u表示只检索网址。
限定条件,如年代、资料类型、题名、全文等。
多样化检索,如检索词同义替换,数据库选择,
搜索引擎更换等。
提高检索效率,如关闭主页图像提高下载速度,
多窗口检索减少等待时间,避免用泛义词和太专指词提高检准率,采用词组检索提高检准率等。
全面掌握各种数据库、搜索引擎等检索的具体要求、技巧与策略。
二、网络信息检索的主要途径
1.本地检索 (局域网信息检索 )
2.联机检索 (数据库网络检索 )
3.网络检索 (网络免费信息检索 )
1.本地检索
中文数据库
外文数据库
自建数据库
2.联机检索
联机检索是用户利用计算机终端,向联机信息中心发出请求,进行联机检索中心数据库,满足特定需求的一种检索方法 。
现在,世界著名的联机数据库检索中心有,OCLC(美国 ),DIALOG(美国 ),ORBIT(美国 ),MEDLINE(美国 )、
ESA/IRS(欧洲 ),JOIS(日本 )等。
我国在 50多个城市建立了 110多个国际联机检索终端,与国外 12个大型信息检索系统相连,可检索国际上 600多个大型数据库。国内的远程检索终端有 400多个,可检索国内各联机数据库百万余条信息。国内规模较大的联机服务中心有北京文献服务处的 BDSIRS,中国科技信息所的 CD/ISIS与 TRIP,信息产业部的 MEIRS。
3.网络检索
3.1 查找网址 (Uniform Resource Locator)
3.2 信息浏览 (information browse)
3.3 搜索引擎 (Search Engine)
3.1查找网址
TCP是 Transmission Control Protocol (传输控制协议 )的缩写,IP是 Internet Protocol (网际协议 )的缩写,TCP/IP即传输控制与网际协议,这是 INTERNET
得以存在的理论基础。 TCP/IP共包括 100多种具体协议,如支持 E-mail功能 的 SMTP(Simple Mail
Transfer Protocol,简单邮件传输协议 )和 POP(Post
Office Protocol,邮局协议 )、支持 FTP功能的
FTP(File Transfer Protocol,文件传输协议 )、支持
NetNews功能的 NNTP(Network News Transport
Protocol,网络新闻传输协议 )、支持 WWW功能的
HTTP(Hypertext Transport Protocol,超文本传输协议,该协议容许文字、图画、声音等同时传输 )等等。
INTERNET实际上就是靠这些协议维持运行的,任何连入 INTERNET的计算机都必须遵循至少一种这样的协议。
DN是 Domain Name的缩写,它由 2到 5段字符构成,中间用,隔开,形如 host.inst.fild.stat
其中 stat 是国别代码,美国因创建 Internet优先而无此码,au为澳大利亚,ca为加拿大,cn为中国,
de为德国,fr为法国,it为意大利,uk为英国,等等;
fild是网络分类代码,ac学术网,com商用网、
edu教育网,gov政府网,mil军事网,net公共网、
org社团网,1997年秋季起 Internet管理机构决定未来将增设 arts文艺机构,firm公司企业,info信息服务机构,nom个人专用,rec娱乐专用,store商店专用、
web万维网专用等七类代码;
inst 是单位或子网代码,一般是其英文缩写;
host 是主机或服务器代码。
如中南林业科技大学的 WWW服务器的 DN为
www.cfstu.com。
IP地址即 Internet Protocol地址,一般为四段数字,中间用,隔开,第一部分是 IP网络号,
第二部分是主机号 。 例如,172.16.14.3,其网络号是 172.16,主机号是 14.3。
IP地址是 Internet定位所必需的,每台以专线方式联入 Internet的计算机都应有一个唯一的
IP地址; DN则非每台上网机必需,只有作为服务器的计算机才需要 。 Internet上通过域名服务器 (DNS)将 DN自动转换为 IP。
统一资源定位符 URL(Uniform Resource Locator),俗称网址,是 Internet用来描述信息资源的字符串 。 它包括传输协议,信息资源的主机 IP地址和主机目录及文件名的具体地址三个部分 。 查找网址,是最快捷,最对口,
最方便地查找相关信息的检索方法 。
网络数据库,网上出版物,网络机构等有固定的 URL。
联机数据库检索中心,期刊,报纸等电子出版物,图书馆,高校,企业,政府等机构都有唯一明确的网址 。 利用网络浏览器 (如 IE)查找网址,可以快捷,方便地获得针对性极强的网络信息 。
URL是全球资源定位器。 URL可看作是计算机文件系统在网络上的扩展,它定义文件在
Internet上的位置,无论其位于哪台主机、
哪个子目录,只要给出文件的 URL地址,就能在 Internet信息海洋中准确无误地定位该文件,就象是一个全球定位器。 URL与 Browser
和 Java一道被誉为 INTERNET上的三大发明。
URL的一般语法格式为,
protocol://hostdnorip[:port/path/file]
其中 protocol是属于 TCP/IP的具体协议,可用 http、
ftp,telnet,gopher,wais等,[ ]内为可选项,
http://表示用 HTTP(HyperText Transfer Protocol)协议连通 WWW服务器;
ftp://表示用 FTP(File Transfer Protocol)协议来连通
FTP服务器;
telnet://表示远程登录到一个 UNIX服务器;
gopher://表示请求一个 Gopher服务器给予响应;
wais://表示请求一个 WAIS服务器给予响应。
几个合法的网址实例如,
http://www.w3.org;
ftp://ftp.net.edu.cn;
ftp://ftp.whnet.edu.cn/
ftp://ftp.pku.edu.cn/
telnet://166.111.1.11
网络实名 http://www.3721.com/
http://news.hnol.net/gb/node/2004-04/02/node_12.htm
湖南日报
IP(数字 )-> DN(英语 )->网络实名 (汉语 )
3.2信息浏览
站内浏览中国科研和计算机网
网络导航
CSFTU校园网主页上网络服务中 网络导航
LIB重点 学科导航,(图书馆学情报学、法学、
哲学、经济学、化学、数学、物理学、化工 )
友情链接、合作伙伴或相关专题网 (网站 )
相关链接 (网页 )
3.3搜索引擎
搜索引擎,泛指在数据库系统中查找信息的工具,主要用于检索网站、网址、文献信息等内容。
搜索引擎是检索 Internet信息的强有力工具,
在搜索框内输入由主题词、关键词及运算符组成的检索式,合理地运用限制条件,点击搜索就能找到相关的网址或网页。
三、关于搜索引擎的基本知识
1.网络搜索引擎的现状
2.网络搜索引擎的趋势
3.网络搜索引擎的分类
1.网络搜索引擎的现状
搜索引擎 (Search Engine),也称导航站点,为用户与信息架起一座桥梁。 85%的用户通过使用搜索引擎来寻找需要的信息,到 2002年,仅
google就索引了 2,073,418,204个页面,常规用户超过 200,000,000个。 搜索引擎技术集中体现在四个方面:访问、阅读、整理 Web信息的信息采集,建立包含关键信息的索引数据库,根据用户请求查找索引数据库相关文档的搜索软件,
以及为用户提供可视化的查询输入和结果输出界面的用户接口。目前,实现网络信息检索的搜索引擎可以分为两类。
1.1分类目录搜索引擎
1.2全文索引搜索引擎 (机器人搜索引擎,Robot
Search Engine)
1.3两种搜索引擎的比较
2.网络搜索引擎的趋势
智能化知识检索以知识为单元,智能化的检索、分析和反馈功能。
多媒体检索技术多媒体信息是文本、图像、声频和视频的混合体。
新一代搜索引擎技术元搜索引擎和分布式搜索引擎 。
自然语言处理技术依靠人工智能技术由计算机自动进行 。
基于内容的检索技术
,内容 — 对象,关系型索引多媒体数据库 。
3.网络搜索引擎的分类网络搜索引擎种类繁多,主要包括发:
A Web Search Engine(万维网搜索引擎 )
B FTP Search Engine(文件搜索引擎 )
C Email/WhitePage Search (电子函件 /白页搜索引擎 )
个人信息搜索引擎是查询个人信息的搜索工具 (个人电话号码簿通常为白页 )。
D YellowPage Search Engine(黄页搜索引擎 )
商界信息搜索引擎是查询商界信息的搜索工具 (在电话号码薄中商界用黄页 )。
E Usenet Search Engine(新闻论坛搜索引擎 )
F Meta-search Engine(元搜索引擎 )
在日常应用中,搜索引擎可按如下标准分类:
3.1按语种分类中文搜索引擎,外文搜索引擎
3.2按内容分类垂直搜索引擎,综合搜索引擎
3.3按功能分类普通搜索引擎,元搜索引擎
中文搜索引擎:
新浪、搜狐、网易、悠游、天网、北极星、
常青藤等。
外文搜索引擎:
Vltavista,Webcrawler,Infoseek、
Lycos,Opentext等。
多语言搜索引擎有,Yahoo,Excite、
google等。
垂直搜索引擎 (专业搜索引擎 ):
中国健康网 http://www.healthoo.com/
中国医药网 http://www.pharmnet.com.cn/
和讯金融搜索 http://search.homeway.com.cn/
化工 YAHOO http://sr2.chemnet.com.cn/site/
招聘网 http://www.zhaopin.com/
图行天下 http://www.go2map.com/
中国旅游资讯网 http://www.chinaholiday.com/search/
中国企业产品在线 http://www.manufacture.com.cn/
中贸网 http://cn.chinae.com/
综合搜索引擎,
yahoo,sina,sohu,网易、悠游、天网等。
独立搜索引擎,sina,yahoo,sohu等。
元搜索引擎:
元搜索引擎 (Meta Search Engine,亦称集合型搜索引擎 ),是关于搜索引擎的搜索引擎,把检索任务分配给多个独立搜索引擎。按照搜索机制划分,元搜索引擎包括并行式和串行式两类。
目前,国外已经有 AskJeeves,Cyber411、
DigiSearch,Dogpile,Highway61,IsIcuth、
Mamma,MetaCrawler,ProFusion等元搜索引擎,国内关于中文元搜索引擎的研究仍然很少。
四、常用搜索引擎介绍 (实例 )
1 新浪
2 google
3 网易
4 yahoo
5 搜狐
2,Google介绍
基本搜索
Google 查询简洁方便,仅需输入查询内容并敲一下回车键 (Enter),或单击,Google 搜索”按钮即可得到相关资料。
Google 查询严谨细致,能帮助您找到最重要、最相关的内容。例如,当 Google
对网页进行分析时,它也会考虑与该网页链接的其它网页上的相关内容。 Google 还会先列出那些搜索关键词相距较近的网页。
自动使用,and”进行查询
Google 只会返回那些符合您的全部查询条件的网页。不需要在关键词之间加上,and”或,+”。如果您想缩小搜索范围,只需输入更多的关键词,只要在关键词中间留空格就行了。
忽略词
Google 会忽略最常用的词和字符,这些词和字符称为忽略词。
Google 自动忽略,http”,
,,com”和“的”等字符以及数字和单字,这类字词不仅无助于缩小查询范围,而且会大大降低搜索速度。
使用英文双引号可将这些忽略词强加于搜索项,例如:输入“柳堡的故事”时,加上英文双引号会使“的”强加于搜索项中。
根据上下文确定要查看的网页
每个 Google 搜索结果都包含从该网页中抽出的一段摘要,这些摘要提供了搜索关键词在网页中的上下文。
简繁转换
Google运用智能型汉字简繁自动转换系统,为您找到更多相关信息。
这个系统不是简单的字符变换,而是简体和繁体文本之间的“翻译”
转换。例如简体的“计算机”会对应于繁体的“电脑”。当您搜索所有中文网页时,Google会对搜索项进行简繁转换后,同时检索简体和繁体网页。并将搜索结果的标题和摘要转换成和搜索项的同一文本,
便您阅读。
词干法 在合适的情况下,Google会同时搜索关键词和与关键词相近的字词。词干法对英文搜索尤其有效。例如:搜索,dietary
needs”,Google会同时搜索,diet needs”和其它该词的变种。用于搜索的您原来用词的任何变化都将在搜索结果的简述文字中标示出来。
Google 搜索不区分英文字母大小写。所有的字母均当做小写处理。例如:搜索,google”、
,GOOGLE”或,GoOgLe”,得到的结果都一样。
拼音汉字转换
Google 运用智能软件系统对拼音关键词能进行自动中文转换并提供相应提示。例如:搜索,shang wu tong”,Google 能自动提示
,您是不是要找:商务通”。如果您点击“商务通”,Google
将以“商务通”作为关键词进行搜索。对于拼音和中文混和关键词,
系统也能做有效转换。对于拼音,lü”,“lüe”,“nü” 或,nüe”,
您可输入,lv”,“lve”,“nv” 或
,nve”。如果拼音中没有空格,例如,shangwutong”,
Google 也会做相应处理,但是在多个拼音中加空格能提高转换准确率和速度。
由于汉语的多音字和方言众多,常用发音与实际发音常常有出入,
更不用说拼音输入中可能出现的错误了。 Google
的拼音汉字转换系统能支持模糊拼音搜索,为用户提示最符合的中文关键词,具有容错和改正的功能。例如:搜索,wan luo xing
wen”,
Google 会提示,您是不是要找:万罗兴文 万络行文 网络新闻”,其中,网 (wang)络新 (xin)闻”
是系统参考了可能会有的拼音错误后自动转换的。点击其中任一提示,Google 将以其作为关键词进行搜索。
Google 的特殊功能
查找 Flash 文件
查找 Flash文件,只需搜索“关键词 filetype:swf”。
Google已经可以支持 13种非 HTML文件的搜索。除了 PDF文档,
Google现在还可以搜索 Microsoft Office (doc,ppt,
xls,rtf),Shockwave Flash (swf),PostScript
(ps)和其它类型文档。新的文档类型只要与用户的搜索相关,就会自动显示在搜索结果中。
例如,如果您只想查找 PDF或 Flash 文件,而不要一般网页,只需搜索“关键词 filetype:pdf” 或“关键词
filetype:swf”就可以了。
Google同时也提供用户不同类型文件的,HTML版”,方便用户在即使没有安装相应应用程序的情况下阅读各种类型文件的内容。用
,HTML版”阅读也能帮助用户防范某些类型的文档中可能带来的病毒。
总的来说,不同类型文件类型的搜索大大拓宽了 Google用户能在网上获得的知识内容。
网页快照
Google 在访问网站时,会将看过的网页复制一份网页快照,以备在找不到原来的网页时使用。单击
“网页快照”时,您将看到 Google
将该网页编入索引时的页面。 Google 依据这些快照来分析网页是否符合您的需求。
在显示网页快照时,其顶部有一个标题,用来提醒您这不是实际的网页。符合搜索条件的词语在网页快照上突出显示,便于您快速查找所需的相关资料。
尚未编入索引的网站没有“网页快照”,另外,如果网站的所有者要求 Google 删除其快照,这些网站也没有“网页快照”。
计算器
只需要在搜索字段中输入算式,按一下回车键或者搜索就可以了。这个计算器可以用来做所有简单的计算,
一些复杂的科学计算,单位换算,以及提供各种物理常数。您可以试一下下面的例子,或者查看我们的详细说明。
下面的例子可以展示这个计算器的功能:
5+2*2
2^20
sqrt(-4)
一磅 =?克
光速乘以二秒等于多少公里
相关搜索
Google 能够提供与您原搜索相关的搜索词。这些相关的搜索词是根据过去 Google 所有用户的搜索习惯和 Google
提供的计算两个搜索词之间相关度的独家技术而产生出来的。这些相关的搜索词一般比原搜索词更常用,
并且更可能产生相关的结果。只需点击 google提供的相关搜索词,就会自动被带到这个词的结果页。
Google 相关搜索将帮助我们更快地找到更有价值的结果。
类似网页
单击“类似网页”时,Google 侦察兵便开始寻找与这一网页相关的网页。
Google 侦察兵可以“一兵多用”。如果我们对某一网站的内容很感兴趣,而资料不够,Google 侦察兵会帮我们找到其他有类似资料的网站;如果寻找产品信息,Google
侦察兵会提供相关信息,供我们货比三家;如果您在某一领域做学问,Google 侦察兵会成为您的助手,帮您快速找到大量资料。
Google 侦察兵已为成千上万的网页找到了类似网页,
但网页越有个性,能找到的类似网页就越少。例如,独树一帜的个人主页就很难有类似网页。此外,如果公司有多个网址(如 google.com 和 www.google.com),Google
侦察兵为各个网址找到的类似网页可能会有所不同。但这种情况实属罕见。
按链接搜索
有一些词后面加上冒号对 Google 具有特殊的含义。其中的一个词是,link:”。查询 link,
显示所有指向该网址的网页。
例如,,link:www.google.com”将找出所有指向 Google 主页的网页。
不能将 link,搜索与普通关键词搜索结合使用。
指定网域
有一些词后面加上冒号对 Google 有特殊的含义。其中的一个词是,site:”。要在某个特定的域或站点中进行搜索,可以在 Google
搜索框中输入,site:xxxxx.com”。
手气不错
按下“手气不错,按钮将自动进入 Google
查询到的第一个网页。您将完全看不到其它的搜索结果。使用“手气不错”进行搜索表示用于搜索网页的时间较少而用于检查网页的时间较多。
例如,要查找 中南林业科技大学的主页,只需在搜索字段中输入“中南林业科技大学”,然后单击
“手气不错”按钮。 Google 将直接进入 中南林业科技大学的主页
错别字改正
Google可对输入的关键词进行错别字自动扫描,检查有没有错别字。如果发现用其他字词搜索可能会有更好的结果,就提供相应提示来纠正可能有的错别字。
例如,搜索“互连网”,Google 会自动提示
,您是不是要找:互联网”。如果您点击,互联网”,Google 将以“互联网”作为关键词进行搜索。
因为 Google 的错别字改正软件系统是建立在互联网上所能找到的所有词条之上,它能够提示常用人名及地名的最常见的书写方式,这是一般的错别字改正软件所不及的。
中英文字典
Google 给中英文单词互译带来了极大的方便。您只需输入一个关键词 (“翻译”,“fy” 和,FY” 任选其一)
和要查的中 (英 ) 文单词,Google会直接显示您要查的单词的英文(或中文)翻译。
例如,要查找 apple (或 苹果)的中(英)文翻译,
只需在搜索字段中输入,fy apple
天气查询
用 Google 查询中国城市地区的天气和天气预报,
只需输入一个关键词(“天气”,“tq” 或,TQ” )和要查询的城市地区名称即可。 Google返回的网站链接会带给您最新的当地天气状况和天气预报。
例如,要查找长沙地区的天气状况,可以输入:
长沙 天气 或 长沙 TQ
股票查询
用 Google 查询股票价格和股市行情,非常简洁方便。只需输入一个关键词(“股票”,“gp” 和,GP” )
和想查询的股票证券名称或是其六位数代码,Google
就会返回其他链接让您只要一次点击便能得到有关股票证券的详尽资料。
例如,要查找中国石化的行情走势,可以输入:
中国石化 股票 或 gp 600028 或 zgsh gp均可。
邮编区号
用 Google 查询邮政编码或长途电话区号,只需输入关键词(“邮编”,“yb” 和,YB” 任选其一;“区号”,,qh” 和,QH” )和要查的城市地名或邮政编码或电话区号即可。 Google 会为您提供相关的所有信息,包括所在地的省市名称,邮政编码及长途电话区号。
例如,要在 Google 站点上查找长沙地区的邮编区号或邮编 412000,区号 0735的归属地,可以输入:
长沙 邮编 区号 yb 412000 qh 0735
手机号码
用 Google 查询手机电话号码归属地,只需直接输入要查的号码即可(不需要任何关键词)。 Google
能自动识别以 13开头的 11位数字为手机号码而返回相关的网站链接,让您即刻便知道答案。
例如,要查找手机号 13123456789的归属地,可输入,13123456789
定义
要查看字词或词组的定义,只需键入,define:”,
接着键入一个空格,然后键入您需要其定义的词。如果 Google
在网络上找到了该字词或词组的定义,则会检索该信息并在搜索结果的顶部显示它们。
示例:
通过包含特殊操作符,define:”,并使该操作符与您需要其定义的字词之间不留空格,还可获得定义的列表。例如,搜索 [define:HTML]
将显示从各种在线来源收集到的,HTML”定义的列表。
搜 索 技 巧
由于 Google 只搜索包含全部查询内容的网页,所以缩小搜索范围的简单方法就是添加搜索词。添加词语后,查询结果的范围就会比原来的“过于宽泛”的查询小得多。
减除无关资料 如果要避免搜索某个词语,可以在这个词前面加上一个减号(,-”,英文字符)。但在减号之前必须留一空格。
英文短语搜索 可以通过添加英文双引号来搜索短语。双引号中的词语(比如 "like this")在查询到的文档中将作为一个整体出现。这一方法在查找名言警句或专有名词时显得格外有用。
一些字符可以作为短语连接符。 Google 将,-”、,\”、,.”、
,=”和,..."等标点符号识别为短语连接符。
指定网域 有一些词后面加上冒号对 Google 有特殊的含义。其中有一个词是,site:”。要在某个特定的域或站点中进行搜索,
可以在 Google
搜索框中输入,site:xxxxx.com”。 例如,要在 Google 站点上查找新闻,可以输入:新闻 site:www.google.com
按类别搜索
利用 Google 目录 可以根据主题来缩小搜索范围。例如,在
Google 目录的 Science > Astronomy
类别中搜索,Saturn”,可以找到只与
Saturn(土星)有关的信息。而不会找到,Saturn”牌汽车、
,Saturn”游戏系统,或,Saturn”的其它含义。
在某个类别的网页中搜索可以快速找到所需的网页。
高级搜索
通常,只需在范围较广的查询中添加词语就可以缩小搜索范围。不过,Google 还提供了很多不同的搜索功能,利用这些功能可以做到:
将搜索范围限制在某个特定的网站中
排除某个特定网站的网页
将搜索限制于某种指定的语言
查找链接到某个指定网页的所有网页
查找与指定网页相关的网页
利用 Google 的高级搜索页可以很轻松地在搜索中应用这些功能。