上海理工大学电子商务研究所
设计制作:王锡俊
网络信息检索
第 四 章
第四章 网络信息管理
4.1 网络信息管理简介
4.2 网络信息管理基本技术
4.3 网络信息的整理
4.4 个人网络信息查询系统的设计
4.5 个人数据库建立
4.1 网络信息管理简介
4.1.1 网络信息管理的定义
4.1.2 网络信息管理的目标
4.1.1 网络信息管理的定义
? 网络信息管理以保障网络服务和网络应用为目标,从信
息资源组织、信息平台协调、用户及其权限管理、安全
防范策略等方面进行集成化协调管理。主要突出网络服
务安全性、服务管理易操作性,为用户提供一个界面友
好的基于 Web的网络信息管理平台。在这种管理中,个
人用户既是使用者,也是管理者。
4.1.2 网络信息管理的目标
? 网络信息管理的目标有以下两个方面:
1) 实现一个集多种信息管理于一体的综合网络信息管理平
台,提供相应的管理工具,使信息管理由人工向智能化
方向转化,减少人为的失误;
2) 采用集中加分布的管理策略,对各种信息服务提供统一
的管理模式和机制,为个人网络信息管理用户提供一种
方便、易用的中文化的网络信息服务管理平台。针对网
络提供的服务进行配置管理、状态监控、日志分析等。
4.2 网络信息管理基本技术
4.2.1 数据库技术
4.2.2 局域网技术
4.2.3 网络信息管理安全技术
4.2.1 数据库技术
? 数据库技术主要研究的是存储、使用、管理数据和信息
资源,是计算机在数据信息管理的最高阶段。
? 在数据库技术产生初期,数据库只是一项近乎独立的技
术,近年来,数据库技术和计算机网络技术的发展相互
渗透、相互促进,已成为当今计算机领域的发展迅速、
应用广泛的两大领域。
4.2.2 局域网技术
1,局域网简介
? 局域网( LAN)是指在某一区域内有多个计算机互联成
的计算机组。它主要链接各种微型机、小型计算机、终
端和各种外部设备。它可提供数据、语音、视频图像和
图形等综合服务。其基本技术包括:拓扑结构、传输技
术信道的访问控制方法。它们共同确定传输信息的形式、
通信速度和效率、信道容量以及网络所支持的应用服务
类型。
2,局域网特点
1) 信息共享。
2) 硬件和软件共享。
? 20世纪 90年代以来,随着信息高速公路的崛起,局域网
进一步朝着高速、宽带、高性能的方向发展。
4.2.3 网络信息管理安全技术
? 在网络信息管理中,安全技术主要是为了防止数据损失,
提高系统和环境的安全性。系统安全是指为防止非授权
用户存取造成数据泄密或人为破坏所采取的各种措施,
包括用户标识和鉴定、分级授权、数据加密等;环境安
全是指如何有效地防止天灾人祸等意外事故而采取得防
范措施。
1,用户标识和鉴定
? 为了避免未经授权的用户非法访问,需要设置用户名和
口令识别机制。使用数据库系统时必须先输入用户姓名
或口令,系统鉴定通过后才能够访问数据库或执行相应
的操作。口令可以分几个层次来设置。
2,访问授权
? 对于获得系统使用权的用户,可以进一步根据用户的访
问权限进行控制。访问权限是指不同的用户对于不同的
数据单元允许进行的操作权限。具体权限通过授权语句
来授予和撤销。访问数据库时,系统确认用户的访问权
限后才能执行操作。
3,数据加密
? 为了更加有效的保护数据的安全,可以用密码存储口令
和数据,向远程用户用加密后的密文传送数据,以防止
明文传送的中途被非法窃取。把密文译成原文称为解密,
用户掌握密钥才能解密。
4,环境安全
? 环境安全是管理制度问题。
? 在安全技术中,备份是最主要的也是最重要的一项。
4.3 网络信息的整理
4.3.1 网络信息的收集与存储
4.3.2 个人网络信息的整理
4.3.3 个人网络信息的加工处理
4.3.4 书签 ( Bookmark) 的整理
4.3.1 网络信息的收集与存储
? 信息收集是指对信息进行聚合和集中,以更好地掌握和
使用信息。
? 信息的存储就是把所收集的大量信息用适当的方法进行
保存,为进一步处理和正确认识、利用这些信息打基础。
? 下载信息是收集信息和存储信息的基础,这里以 Netscape
Communicator 4为例,介绍几种常用的下载方法:
1) 全文下载。 对需要保存的 HTML文档,在 File下选择 Save
As,把它作为一个 HTML文档保存在你的硬盘和软盘的
适当位置。
2) 图像下载。 将光标置于图像上,按住鼠标右键,出现工
具栏,点击 Save Image As,即可出现是否保存图像的对
话框,选择适当的文件夹,即可保存图像。
3) 连图像一起保存 HTML文档。 查看到需要下载保存的页
面后,在 Fi1e菜单中选择 Edit Document,就会弹出一个
编辑窗口中对页面进行适当编辑、修改,然后在 File菜单
中选择 Save As,选择硬盘或软盘上合适的目录并为文件
起一个文件名,图片文件和 HTML文件就可以一起保存
下来了。
4.3.2 个人网络信息的整理
1,网络信息整理的一般原则
( 1) 系统原则
? 系统观点是网络信息资源管理不同于以往信息管理的最
大特点,它将使网络信息管理获得新的生命力和新的活
力。
( 2) 科学原则
? 科学原则是指网络信息资源管理要遵循信息运动的客观
规律,体现信息管理的特殊性。
( 3) 安全原则
2,网络信息整理的一般步骤
( 1) 明确信息来源
( 2) 浏览信息
( 3) 分类
( 4) 初步筛选
4.3.3 个人网络信息的加工处理
? 网络信息的加工处理是将各种有关信息进行比较、分析,
并以自己的初衷为基本出发点,发挥个人的才智,进行
综合设计,形成新的有价值的个人信息资源。信息加工
的目的是要进一步改变或改进信息利用的效率,使其向
着最优化发展。
? 信息加工处理的方式主要是两种,即人工处理和机器处
理。人工处理是指由人脑进行信息处理;机器处理是指
计算机的信息处理(包括专家系统)。
? 个人网络信息处理一般包括以下几种类型:
1,为了提高效率而进行的个人网络信息处理
? 这种处理主要是指各种各样的信息压缩,即去除信息中
的多余成分或次要成分,留下信息的主要成分。目前所
采用的信息压缩技术完全局限在语法信息和改变统计分
布的范畴。主要原理是消除语法信息中的统计相关性具
体的途径是通过有效性编码来实现。
? 下一代的信息压缩技术可能突破语法信息的限制,深入
到语义信息和语用信息的范畴。
2,为了提高抗扰性而进行的个人网络信息处理
? 为了提高网络信息的抗扰性,也必须对信息进行处理。
无论在信息的传输过程中还是在信息的存储过程中,干
扰的出现都会造成信息的变异,形成差错。克服干扰影
响的方法在于增强信息的抗干扰能力以及容错能力,具
体的途径是对信息进行抗干扰编码。目前,实现抗干扰
编码及容错功能设计的一般原理仅局限在语法信息的范
畴。
? 新一代的抗干扰编码及容错功能设计也将突破语法信息
的局限,进入基于语义和语用信息的范畴。
3,为提高信息纯度而进行的个人网络信息处理
? 区别信息的有用、无用还是有害,主要取决于主体的特
定目的或目标,另一方面,对任何特定主体来说,有用
信息与无用信息或有害信息往往都同时存在或互为背景。
因此,就需要提高信息的纯度。到目前为止,在这一方
面所发展的网络信息处理也基本局限在语法信息的范畴
内。其中,过滤和识别事最典型的处理技术。
? 更完善的网络信息处理同样有赖于语义和语用信息的利
用:要根据语义信息来判断信息的内容,并根据语用信
息来判断它的效用,在此基础上排除无用信息。
4,为了提高安全度而进行的个人网络信息处理
? 安全指的是对信息的保护,是指信息不被未授权者所获
得。为此,必须对信息进行处理,把“明码”变成“密
码”。把明码变换成为密码的过程称为信息加密或保密
过程,把密码反变换成为明码的过程称为信息解密过程
或破密过程。加密和解密(保密和破密)是一对矛盾,
二者相互促进,相辅相成。目前的加密技术也完全局限
在语法信息的范畴内,将来会出现基于语义和语用信息
的密码技术。
4.3.4 书签( Bookmark)的整理
1,书签整理的一般步骤
? 网景浏览器的默认书签文件是 Bookmark.htm。由此可见,
书签文件本身就是一个 html文件,是可以直接在网景浏
览器下用 Open file调用的。用户浏览到某个可能对以后
有用的页面时,可用书签形式将其连接。保存下来,用
户以后再到该地址访问时就不必再输入该网站的 URL地
址了。加入书签的方法是:单击 Bookmarks或键入 Ctrl+
d,然后单击 Add Bookmarks按钮。
? 对书签项目进行归类整理,可以按以下步骤进行:
1) 单击 Bookmarks或键入 Ctrl十 b,并单击 Go to Bookmarks
按钮出现新窗口后,单击 Item(项目)菜单中的相应项
目即可增加一个书签夹或分割线,其中分割线就是菜单
中常见的一条横线。
2) 填上目录名。
3) 将各项目归到各目录。
4) 书签的排序。
2,书签应用实例 —— 金融类书签的整理
? ( 1)分类
? 1)根据自己收集到的财经类网址和使用习惯,笔者将常
用的网址分为 5个一级目录:搜索引擎类网址、资料检索
类网址、学校类网址、财经类网址、娱乐类网址。
? 2)对每个一级目录再进行细分。例如,笔者将财经类的
网址又分为 6个二级目录:财经网址、证券网址、更多证
券网址、银行网址、保险网址和彩票网址。
中国经济信息网 中国价格信息网 和讯网 华鼎财经网
中国财经信息网 中国财税信息网 新浪财经纵横 网易财经频道
搜狐工商财经 263天赢财经 Tom财经纵横 中华网财经频道
金融城 中国财富网 中华财会网 中国期货财经网
上海热线财经频道 东方财经 天虎财经网 中华工商时报
财经杂志(期刊) 财经法规信息网 文华财经网 联合经税网
雅虎中文财经 财富中文网 Lycos中国 -财经频

北大中国经济研究
中心
表 4-1 财经网址
( 2)放置网址
? 根据自己的使用习惯,分别将网址放在不同的分类中。
1) 财经网址(如表 4-1):
2) 证券网址(如表 4-2):
中国证监会 中国证券网 中国金融在线 海融证券网
华夏证券网 赢时通 证券之星 中国证券报
银河证券网 申银万国 和讯 东方趋势
中华证券网 中国证券在线 全景网 金融街
表 4-2 证券网址
3) 更多证券网址(如表 4-3):
信达证券网 国信证券鑫网 股易 Soyou证券频道
江南证券网 股迷 易富证券网 中股信息网
巨潮资讯网 百姓理财网 中金在线 股市通
中公网投资赢家 FM365股市频道 乾通科技 飞虎证券网
金新证券网 世纪龙证券网 金融时代 众和股讯网
金网理财 北大财富网 汪洋证券网旺智股

表 4-3 更多证券网址
4) 银行网址(如表 4-4):
上海浦东发展银行宁波国际银行长沙市商业银行
石家庄商业银行泉州市商业银行福建兴业银行深圳发展银行
厦门国际银行上海银行北京市商业银行光大银行
中信实业银行招商银行交通银行中国民生银行
中国工商银行中国建设银行中国银行中国人民银行
表 4-4 银行网址
5) 保险网址(如表 4-5):
保险之友保险潮流中华大黄页
保险频道
大众(车辆)保险
禧龙保险资讯网人人保险网非常保险网保险法信息网
中国保险友爱保险网中国保险 99网保险大道
汇保网吉利保险网平安保险网263易保保险
中国寿险网中国保易网中华保险网中国保险网
表 4-5 保险网址
6) 彩票网址(如表 4-6):
足彩之家我爱彩票网电子彩票中国彩票
足彩网彩票资讯 168国彩网中彩网
彩之网彩票软件网中体彩票网中国体彩网
表 4-6 彩票网址
4.4 个人网络信息查询系统的设计
4.4.1 个人网络信息查询系统建立的原则
4.4.2 个人网络信息查询系统的标准
4.4.3 查询系统的组成
4.4.1 个人网络信息查询系统
建立的原则
? 为了建立一个自己的实用信息查询系统,使其能够达到
预期的经济效益,建立的时候就应当注意特色化和创新
性相结合。
1) 特色化原则。设计信息查询系统应当适应具体情况,具
有自己的特色。
2) 创新性原则。必须根据自己的具体问题和具体目标,进
行创造性的信息查询系统设计。
4.4.2 个人网络信息查询系统的标准
? 一个好的查询系统应该符合以下标准:
1) 用户查询界面简洁,易学易用,最好提供中文界面和英
文界面。
2) 查询结果应包括与查询主题最为相关的文件,要尽可能
地减少重复率,查询结果格式清晰,内容充实。
3) 查询系统应适合于简单关键字和复杂关键字的查询,不
要求用户掌握布尔逻辑式或其他复杂的逻辑条件。
4) 系统反应速度快。
5) 数据库内容全面、规模大、更新速度快。
4.4.3 查询系统的组成
1,巡视软件
? 巡视软件( Robot或 Spiders)是一种穿行于 WWW空间的
计算机软件,它可以遵循超文本传输协议( HTTP)从网络
服务器上采集新出现的信息,自动搜寻超文本的链接,并
对网页的信息进行标引,确认网页之间的链接是否有效,
剔除已经无效的链接。
2,数据库
? 对于数据库的选择,以下几个问题是应予优先关注的:
1) 数据库的标准化和国际通用化。
2) 在建立自己的信息查询系统时,要注意信息的及时更新。
3) 数据资源的科学筛选问题。
3,查询代理
? 当用户提出查询要
求时,由查询软件
负责代替用户在数
据库里进行搜索,
并将查询到的结果
返还给用户,这一
过程就是查询代理
( Agent)。图 4-4
是一个简单的查询
系统执行过程的流
程图。
用户输入 查
询条件
查询本地数
据 库
得到未经加工
的结果
成 功?
按规定模式保存所
查询到的内容
引导用户使用其他更
详细的查询条件
返回结果
图 4-4 简单的查询系统执行过程的流程图
4.5 个人数据库建立
4.5.1 个人数据库的特点
4.5.2 个人数据库的设计思路
4.5.3 个人数据库的设计步骤
4.5.4 个人数据库建立案例
4.5.1 个人数据库的特点
? 数据库( database)是指保存与某个特定领域相关的所有
数据的中心结构。而在实际中,它的使用相对宽松,它
指的是包含某一过程的所有信息的结构。
? 实现一个数据库通常都包括以下任务:
1) 设计数据库,使得应用程序最优化的使用硬件并允许未
来的扩展;标识和建模数据库对象和应用程序逻辑,规
定每个对象的信息类型和关系的类型。
2)数据库和数据库对象,包括表( table)、数据完整性机
制、数据输入和获取对象(常常是存储过程),合适的
索引和安全策略。
4.5.2 个人数据库的设计思路
? 从系统设计的角度来看,个人网络信息数据库应用系统
应具有结构特性和行为特性两个方面:
1) 结构特性的设计。结构设计就是设计各级数据库模式,
决定数据库系统的信息内容。系统的结构设计由数据库
设计来实现。
2) 行为特性的设计。行为特性与数据库状态的转换有关,
即改变实体及其特性的操作。它决定数据库系统的功能,
包括事务处理等应用程序的设计。
组织
数据分析 功能分析
概念模型设计 功能模型 功能说明
事务设计逻辑数据库设计
物理数据库设计 程序说明
子模式设计
建立数据库
应用界面设计
程序设计
数 据 库 程序运行
图 4-5是数据库行为设计的示意图
4.5.3 个人数据库的设计步骤
1,需求分析
( 1)信息收集
( 2)分析整理
( 3)数据流图
( 4)数据字典
( 5)形成资料
( 6)用户确认
2,概念结构设计
? 概念结构设计的目标是产生反映符合个人信息需求的数
据库概念结构,即概念模式。概念模式是用户信息关系
的结构。它必须独立于计算机的任何数据模型,不受特
定的数据库管理系统的限制,不考虑计算机软硬件技术
细节,方便与其他用户进行交流。
3,逻辑结构设计
? 概念结构设计的结果得到一个与计算机、软硬件的具体
性能无关的全局概念模式。数据库逻辑设计的任务是将
概念结构转换成特定数据库管理系统( DBMS)所支持
的数据模型的过程。
? 数据库的初始逻辑模型必须进行规范化处理。首先确定
规范化的级别,要求所有的关系模式都达到某一种范式。
4,物理设计
( 1)物理结构设计
? 在物理结构中,数据的基本存取单位是存储记录。存储
记录是相关数据项的集合,一个存储记录可以和一个或
多个逻辑记录对应。存储记录中还包含必要的指针、记
录长度及描述特性的编码。
( 2)索引选择
? 存储记录是属性值的集合,主关键字(及其它候选关键
字)唯一确定一个记录,而其它属性的一个具体值不能
唯一确定是哪个记录。在主关键字上应该建立唯一索引,
这样除了能改善查询性能外.还能保证数据的完整性,
杜绝关键字重复值的录入。
? 多建立索引文件可以缩短存取时间,但是增加了索引文
件所占的存储空间及索引维护的费用。因此,应该根据
实际需求综合考虑,进行权衡。
( 3)记录聚簇
? 聚簇是改进系统性能的另一种技术。不改变逻辑数据库
的模式结构,但可以对存储记录进行分割。根据对数据
访问的频繁程度将数据分出主次。记录聚簇是指根据不
同的使用要求,将属性、记录或文件集中存放在不同的
位置,聚簇有 3种情况:
1) 分段。
2) 分区。
3) 聚簇。
5,数据库实施
? 数据库实施是指根据逻辑设计和物理设计的结果,在计
算机上建立起实际数据库结构、加载数据、进行测试和
试运行的过程。
( 1)数据库加载
? 用具体 DBMS提供的数据定义语言或方法将逻辑设计和
物理设计的结果严格地描述出来,建立起实际数据库。
( 2)数据库运行和维护
? 数据库投入运行标志着数据库与应用界面设计工作基本
结束,运行和维护阶段开始。数据库运行与维护阶段的
主要任务包括。
1) 维护数据库的安全性和完整性。
2) 监测并改善数据库性能。
3) 必要时对数据库进行重新组织。
4.5.4 个人数据库建立案例
? 以通讯录为例说明如何建立一个适合个人用户的数据库
并管理使用通讯信息 。
1,建立数据库
? 首先必须进行概念结构设计。在一个通讯录中,需要有
用户 ID号、姓名、公司、地址、城市、省、邮编等一系
列的项目,这些项目的属性是必须确定的。属性是数据
库中基本的数据单元,在给定的应用环境中,属性不再
需要进一步的描述。
? 第二步是逻辑结构设计,在这个阶段,要对各个项目的
关键字做出定义,并确定把哪一个项目作为你的数据库
表的主键。在此之后,还必须对表中项目分析其联系,
随后通过关键字使项目产生连接。
? 在接下来的物理设计中,必须对数据库的存储状态做出
综合的权衡。这样数据库的初步设计基本完成。
2,创建用户界面
? 一个有效的用户界面实际上是成功编程的关键。
? 开始创建一个重要的数据库程序时,要采取的第一步就
是编写一个需要包含在该程序中的特征列表。特征列表
也将有助于创建程序的一般版面和程序结构。
? 在创建基于通讯录的用户界面时,特征列表应该与下面
的内容相似:
1) 输入项-允许输入和修改字段:用户 ID、姓名、公司、
地址、城市、省、邮编、住宅电话、办公电话、移动电
话和备注。
2) 搜索-搜索所有字段的能力,包括通配符。
3) 删除-该程序应允许从列表中删除单个记录或多个记录。
4) 排序-用于浏览和打印,排序应该在用户 ID、姓名、邮
编等字段是有用的。
5) 打印-可以以电子表格格式打印单个记录和多个记录。
6) 在设计完特征列表后,你还必须考虑用户在操作中可能
出现的一系列问题,如在确认一条记录被删除之前,必
须让用户完成一个信息地确认过程。