第 7章 信息检索与发布
1.教学基本要求
① 信息检索的基本概念、方法
② 搜索引擎的分类、组成、工作原理
③ 常见的搜索引擎特点及其使用方法
④ 信息发布于网站推广的方法
2.教学重点
① 常见的搜索引擎特点及其使用方法
3.教学难点
① 信息检索的基本概念、方法
② 搜索引擎的分类、组成、工作原理
信息检索与发布
1,信息检索
2,信息发布与网站推广
1 信息检索
① 信息检索简介
② 网络信息检索方式
③ 搜索引擎简介
④ 关键词检索技术
⑤ 常用搜索引擎
⑥ FTP搜索引擎
信息检索简介
? 信息检索是指将杂乱无序的信息有序化,形成
信息集合,并根据需要从信息集合中查找出特
定信息的过程,全称是信息存储与检索
( information storage and retrieval)。
网络信息检索方式
? 较为典型的传统信息查询工具有 Gopher、
Archie,WAIS等,它们分别可以查询 Gopher
资源,FTP资源和 WAIS资源。而目前发展最
为迅速、最受人们欢迎的信息检索工具是
WWW(即万维网 )上的检索工具。
? 网络信息检索的一般方法是指利用搜索引擎或
是搜索目录进行信息检索的方法。搜索引擎与
搜索目录又称之为检索工具。
搜索引擎简介
? 搜索引擎的分类
搜索引擎系统可以分为三大类,目录式搜索
引擎,机器人搜索引擎,元搜索引擎
? 搜索引擎组成部分及其主要技术, 一个搜
索引擎由搜索器( Spider)、索引器( Indexer)、检索器
( Searcher)和用户接口( User Interface)等四个部分
组成。
? 搜索引擎的基本原理, 全文搜索引擎并不真正
搜索互联网,它搜索的实际上是预先整理好的网页索引数
据库。
以人工方式或半自动
方式搜集信息,由编
辑员查看信息之后,
人工形成信息摘要,
并将信息置于事先确
定的分类框架中。
由一个称为蜘蛛( Spider)
的机器人程序以某种策略自
动地在 Internet中搜集和发现
信息,由索引器为搜集到的
信息建立索引,由检索器根
据用户的查询输入检索索引
库,并将查询结果返回给用
户。
这类搜索引擎没有自己的数
据,而是将用户的查询请求
同时向多个搜索引擎递交,
将返回的结果进行重复排除、
重新排序等处理后,作为自
己的结果返回给用户。服务
方式为面向网页的全文检索。
关键词检索技术
? 一般数据库的检索功能多数万维网搜索引擎均
能提供,如:布尔逻辑检索、词组检索、截词
检索、字段检索、限制检索和位置检索等。
? 按照这几种检索功能在各种搜索引擎中受支持
的程度划分,布尔逻辑检索和词组检索功能排
位第一,几乎所有的搜索引擎都支持这两项功
能;而位置检索功能,仅有少数搜索引擎支持;
居中排列的是截词检索、字段检索和限制检索,
它们受支持的程度随不同的搜索引擎而变化。
常用搜索引擎
? 百度
在浏览器的地址栏输入 http://www.baidu.com,就可以进入百度的主页 。其
中中间空白的部分可以由用户输入检索的关键字。百度搜索引擎提供包含新
闻、网页、贴吧,MP3、图片、网站等多种检索方式。
? Google
Google是目前世界上最大的搜索引擎,它提供 70多种界面语言和 35
种检索语言,有分类查询和关键词检索两种检索功能。目前,
163.com和 Yahoo.com.cn使用的实际上也是 Google搜索引擎,只是
对搜索结果进行了编排。在浏览器的地址栏输入
http://www.Google.com,就可以进入 Google的主页。
FTP搜索引擎
? FTP搜索引擎简介
FTP搜索引擎的功能是搜集匿名 FTP服务器提
供的目录列表以及向用户提供文件信息的查询
服务。
? 著名 FTP搜索引擎
国内著名的 FTP搜索引擎
( 1) http://bingle.pku.edu.cn 北大天网中英文
FTP搜索引擎。
( 2) http://166.111.136.3 清华 9#搜索引擎。
2 信息发布与网站推广
① 信息发布
网络信息发布的基本方法可以概括为以下几
种类型:建立自己的网站发布信息、利用某
些网络工具发布信息,利用网络广告发布商
务信息
② 网站推广
三种最常见的推广方法:利用搜索引擎推广、
利用电子邮件推广,利用网络广告推广
布尔检索
? 布尔检索式是采用逻辑与(,AND”或,*”)、逻辑或(,OR”或,+”)和逻辑非
(,NOT”或,—,)等算符,指定文献的标引词中必须存在的条件或不能出现的条件。
布尔逻辑示意图见图。
( 1)逻辑与
采用,AND”(,*”)算符时,检索式写作 A AND B(即 A * B),表明数据库中同时
有检索词 A和 B的记录才为命中记录。逻辑与可增强检索的专指性,缩小检索范围。
( 2)逻辑或
采用,OR”(,+”)算符时,检索式写作 A OR B(即 A + B),表明数据库中凡有检索
词 A或者 B,或同时有 A和 B的记录均为命中记录。使用逻辑或可连接同一检索组面的多
个同义词、近义词和相关词,扩大检索范围。
( 3)逻辑非
采用,NOT”(,—,)算符时,检索式写作 A NOT B(即 A — B),表明数据库中凡有
检索词 A而不含检索词 B的记录才为命中记录。使用逻辑非可以排除不希望出现的概念,
增强检索的准确性。