第 4章 WEB出版
4.1 Web技术发展
4.1.1 超文本简介
? 1945年,范尼瓦 · 布什 (Vannevar Bush)在, 大西
洋月刊, 上发表了“按照我们的想象”( As We
May Think)一文。
? 布什设计了一种名为,Memex” ( Memony
extender,存储扩充器)的装置,,Memex的基本
特性就是提供一种方法,使得任何一条信息都可
以随意直接、自动地选择另一条信息。而在这其
中,重要的事情就是将两条信息连接到一起”
? 从 50年代起,美国斯坦福研究院的道格 · 英格尔
伯特( Doug Engelbart)开始人机交互的研究,
在他“扩展人类智力”的项目研究中,超文本的
构想首次被付诸实践。从他开发的联机系统
NLS(oN-Line System)已经具备了若干超文本的特
性。
? 1968年 12月,他在计算机科学家交流会上播放了
一段 90分钟的视频,介绍在联机系统上的超文本、
对象寻址、动态文件链接以及鼠标、多窗口、图
文组合文件等的演示内容。
? 1963年,美国布朗大学的泰
得 · 纳尔逊( Ted Nelson)
在“文学机器”( Literary
Machine)一文中首次杜撰了
“超文本”( Hypertext)这
个词汇,并在该文中绘出了
超文本的原理图,1965年,
他又致力于超文本,引
擎” Xanadu的设计与开发 。
4.1.2 Web的产生
? 1991年 CERN提供了 Web系统的源代码供人下
载,这表明 Web系统的发明者伯纳斯 ?李放弃
了 Web的专利权。
? 实际上他吸取了当时类似 Web的 Gopher系统
失败的教训:当开发 Gopher的明尼苏达大学
打算向用户授权使用时,很多用户随即放弃
使用 Gopher,Gopher系统的推广遭遇了尴尬。
? 1993年,美国伊利诺斯大学的学生马克 ?安
德森( Marc Adreesen)写了基于 X-Window
操作系统的马赛克( Mosaic)浏览器程序,
这是第一款基于图文界面的浏览器,经位于
该校的国家超级计算应用中心( National
Center for Supercomputing Applications,
NCSA)发布
? 引起了全球性的轰动。因为用户即使毫无
UNIX指令知识,也可利用该浏览器访问在
Web服务器上的图文内容,而此前的几种浏
览器只能在不同的窗口上显示文本和图形。
4.1.3 万维网联盟简介
? 万维网联盟( World Wide Web
Consortium,W3C)由万维网的发明人伯纳斯
?李于 1994年 10月在美国麻省理工学院的计
算机科学实验室创建(其网站为
www.w3.org),目标是将通过开发促进 Web
进化和确保其互用性的通用协议来挖掘 Web
全部的潜能,是网络出版的主要推进力量之
一,是世界公认的 Web相关的标准的发布机
构。
? W3C在组织上进一步分为工作组、兴趣组和
协调组。所有这些组由其会员组织的代表、
W3C团体的代表、指定的专家组成,其中工
作组负责技术标准的开发,兴趣组则开展更
加综合的工作,而协调组负责相关各组之间
沟通,最终各组通过产生技术报告、开放源
软件和提供服务来实现相应的目标。
4.2 Web原理
WEB的历史
? 1989年
? Tim Berners-Lee
?, 分布式超媒体
系统, 工程
? 连接于不同地点
的文件即超文本
的方法
? 找出可以让使用
者一起工作的方

? 1993年开发了第一个具备图形界面的浏览器
(Mosaic)
? 1995年,在 MIT成
立 W3联盟
(www.w3.org)
4.2.1 Web系统
4.2.2 超文本传输协议
HTTP协议
? ① 客户机 /服务器模型
? ②简易性
? 请求方式与 URL地址
? ③灵活性
? 任意类型数据
? ④ 无连接性,每次连接只限处理一个请求
? 连接
? 请求
? 应答
? 关闭
? ⑤无状态性, 对事务处理没有记忆能力
WEB到底是什么
? 传统主机系统
? Client/Server架构的系统
? 三层或多层的应用软件架构系统
? B/W/D结构的 WEB应用系统
两层应用软件的模型
用户
界面
商业和
应用逻辑
数据库
服务器
ODBC和 SQL
语言
客户机 服务器
三层应用软件的模型
用户
界面
商业和
应用逻辑



ODBC和 SQL
语言
客户机 服务器
自定义协议
应用服务器
B/W/D体系结构
用户
界面
商业

应用
逻辑



ODBC
和 SQL
语言
浏览器 服务器
HTTP
应用服务器
WEB
服务

CGI,DCOM
JAVA Servelt
cgi
Microsoft提出的 三层结构
3、超文本标记语言
? HTML(Hyper-Text Markup Language 超文本
标记语言)
? 一种很简单的技术
? 仅仅是一组标签和规范
? HTML元素只用来指明文件中各部分的地位
? 以便浏览器程序能对这些信息进行适当的格式化
并显示
? 广告学的原理
一个好的画框应该使欣赏者更加注意
绘画作品,而不是画框本身
HTML文件基本架构
<HTML> 文件开始
<HEAD> 标头区开始
<TITLE>...</TITLE> 标题区
</HEAD> 标头区结束
<BODY> 本文区开始
本文区内容
</BODY> 本文区结束
</HTML> 文件结束
<HTML> 网页文件格式
<HEAD> 标头区, 记录文件基本资料,如作者、编
写时间
<TITLE> 标题区, 文件标题可在浏览器最上面看到
<BODY> 本文区, 文件资料
XML技术
? XML(可扩展标记语言,eXtensible Markup
Language )与 HTML
? SGML(标准通用置标语言,Standard
Generalized Markup Language)的两个子集
? HTML是 SGML大量简化后的一个应用
? XML保留了 SGML最有活力的部分 ——可扩展能

? XML更加适合不断涌现的网络多媒体的应用
XML的优点
? 可以描述页面的内容
? 具有数据跟踪能力
? 提供元数据(关于信息的数据)
? 可用低成本的软件处理数据
? 简化数据交流
? 可提供有助于自动业务处理的数据
? Ariba cXML计划 (商务 XML),12种常用交易
的 XML DTD(文档类型定义)的子集
? 订单
? 发票
? 订单修改
? ebXML等基于业务逻辑的电子商务交易语言
标准
? 微软 BizTalk,电子商务框架
? BizTalk Server 2000
? 4.2.3 Web服务器
? 4.2.4 Web浏览器
? 4.2.5 统一资源定位符
? 4.2.6 超文本标记语言
4.3 Web扩展
? 4.3.1 Web服务器端扩展
? 4.3.2 客户机端扩展
? 4.3.3 动态网页出版
4.4 扩展标记语言 XML
4.4.1 从 HTML到 XML
? HTML将数据和数据的表现集中在一起,但
侧重于数据表现形式的描述,表现过于简
单,形式较为单调。尽管它能表达脚本、
表格等功能,但很难表达复杂的形式,如
矢量图形、科技符号和其它一些特殊显示
效果。
? 对信息语义及其内部结构的描述偏弱,不适
合用作网络信息资源的自动化组织管理。
HTML实际上是一种标记技术,在设计上是用
来展示内容和手工浏览网页的,它仅仅描述
了浏览器应该如何在页面上布置文字、图形
等,并不揭示所标记信息的具体含义,不能
适应日益增多的检索需求和存档需求,因此
HTML在功能上受到一定的限制。
? 扩展性差。 HTML的标记集合是固定的,不允
许用户自行定义他们自己的标识,因此无法
表示许多特殊行业的数据。同时,HTML标记
持续增加使浏览器的设计变得复杂,影响了
浏览器的效率。
? 链路容易断,链宿地址改变后,链源不能自
动纠正。
? 1996年,万维网联盟开始致力于开发新的标
记语言 XML,作为 SGML的子集,它保留了
SGML最有活力的部分 —— 可扩展性,利用
XML可以建立自己的标记,这些标记可以更
准确地描述用户所要的东西,而 HTML不能用
来定义新的应用,这是 XML与 HTML的最大区
别。
? 从技术上看,XML强调形式描述与内容描述
的分离,一方面使 XML文档的编写人员集中
精力于数据或内容本身,而不受显示方式的
影响;另一方面允许为相同的数据定义不同
的显示方式,从而适合于不同应用、不同媒
体,使 XML数据得到最大程度的重用性,因
此,XML具有广阔的应用前景。
? 1998年 2月,XML 1.0正式发布,成为万维网
联盟推荐的第二代 Web出版语言的标准。从
此万维网联盟通过各工作组、各种机构设计
适合自身需要的语言,并集成到 XML的标准
体系之中。
4.4.2 XML基本结构
? <?xml version=”1.0”?>
? <!DOCTYPE library SYSTEM,library.dtd”>
? <library>
? <book category=”科技类,
? published=”2001/04/05”>
? <author>张三 </author>
? <title>第一本书名 </title>
? <price>10.00</price>
? </book>
? <book category=”小说,
? published=”2003/04/20”>
? <author>李四 </author>
? <title>第二本书名 </title>
? <price>15.00</price>
? </book>
? </library>
4.4.3 XML对网络出版的
作用与影响
跨媒体出版
? 为了满足不同领域和显示设备的需要,人们利用 XML定义了
多个面向显示的语言
? XHTML( eXtensible HyperText Markup Language)
? Web图形的 VML( Vector Markup Language),PGML
( Precision Graphics Markup Language)和 SVG
( Scalable Vector Graphic)
? 多媒体的 SMIL( Synchronized Multimedia Integration
Language)
? 电子图书的 OEB( Open eBook Structure Specification)
? 手持设备的 WML( Wireless Markup Language)和 HDML
( Handheld Device Markup Language)
专业性出版
? XML允许不同的行业根据自己独特的需求制定标记
规范,例如,MathML,CML( Chemical Markup
Language)是 XML在数学、化学领域中使用的标记
语言,一些重要的数学、化学编辑软件已经在提
供对它们的支持,MathML可以将数学公式精确地
显示在浏览器上,而 CML在网页上可描述分子与晶
体结构、化合物的光谱结构等。
? XML的可扩展性允许更多的行业制定自己的 XML应
用规范,从而在专业出版、科技出版上发挥应有
的作用。
推送式出版
? 在 Internet Explorer 4.0及其以后的版本
中,微软推出了“频道”的概念。
? 用户可以通过订阅频道实现站点更新内容的
自动获取,其使用的 XML规范就是 CDF
( Channel Definition Fomat,频道定义格
式)。
网络出版联盟
? XML作为标准交换语言,不同来源的结构化数据可
以通过 XML在中间层服务器上进行集成,然后发送
到客户或其他服务器做进一步的处理和分发,担
负起描述数据交换的作用,这意味着今后的网络
出版商可以形成一个交换网络出版物的供应链联
盟。
? 实际上,微软的,Net技术就允许只面向用户阅读
的网站能够彼此提供信息服务,网站间的信息交
换就是采用 XML格式。
电子商务
? 当前基于 XML的电子商务的标准(包括拟订中的)
? 有微软的的 BizTalk
? UN/CEFACT小组和 OASIS共同发起的 ebXML计划
? CommerceNet 发起的 eCo计划
? RosettaNet的 PIP( Partner Interface Process)
? CommerceOne的 xCBL标准
? Ariba的 cXML等
移动网络出版
? 为了满足人们随时随地与互联网连接的需要,
Phone.com联合了 Nokia,Ericsson、
Motorola在 1997年 6月建立了 WAP论坛,旨在
利用已有的互联网技术和标准,为移动设备
连接互联网建立全球性的统一规范。
? 在 1998年 5月,推出了 WAP规范 1.0版。并于
1999年 11月发布最新的 1.2版。 WAP规范包括
WAP编程模型、无线标记语言 WML、微浏览器
规范、轻量级协议栈、无线电话应用( WTA)
框架,WAP网关几个组件。
? 其中 WML是利用 XML定义的专为手持设备的标
记语言。另外 W3C也定义了一个基于 XML的手
持设备标记语言 HDML,WML和 HDML非常类似,
因为 WML脱胎于 HDML,可以说根在 HDML,而
花开 WML。
? 需要指出的是,虽然人们在提到 WAP时首先想
到的是手机上网,但掌上电脑等手持设备的
上网也可以使用 WAP。
出版的智能化
? 网络出版的智能化是一项庞大的系统工程:
XML标准体系中的语义网( Semantic Web)了
?,语义”是指“文本的含义”,因此语义需
要理解文本的意思和结构,而与显示方式无
关。
? 语义网就是能够根据语义进行判断的网络,
语义网上的任一计算机能够理解词语和概念,
也能够理解它们之间的逻辑关系,这是一种
能够理解人类语言的智能网络。
? 这样语义网可以让计算机, 看懂, 数字内容,
使计算机成为, 智能, 的导航工具。
? 目前致力于语义网研究的提姆 · 伯纳斯 · 李
指出,,计算机能够理解并处理的一类新型
网络内容将掀起一场开辟种种崭新前景的革
命, 。这场革命将万维网中一个个现存的信
息孤岛,发展成一个巨大的数据库。
? 语义网的实现是基于 XML语言和资源描述框架
( RDF)来完成的。 RDF是用来表达网页的内
容。语义网嵌入万维网的工作刚刚起步,网
络出版利用这种语义网,不但能够理解人类
的语言,而且还可以使人机交互变得像人与
人之间交流一样轻松,具有巨大的社会效益。
4.5 Web网站建设
一,Web服务器使用方式
? 虚拟主机技术
? 自营主机
? 租用主机
? 主机托管
中国万网
? 中国万网 (www.net.cn)是国内最大的域名注册和网
站托管服务提供商,总部位于北京,在上海、广州
等国内主要 IT城市设有分支机构。
? 1998年,公司推出了“中国万网”计划,从而得到
了像 IDG公司的风险投资。中国万网的服务器采用机
架式服务器,通过千兆路由器由两条光纤从两个节
点接入 ChinaNet骨干。
? 通过中国万网注册的国际、国内域名已达三
十多万个,国内近四分之一的网络站点都是
在中国万网建立的。
? 其中北京同仁堂、海尔集团、上海证券交易
所等等企业和单位将域名和网站托管在中国
万网。
二,Web出版的设计
三,Web出版的步骤
4.5.2 Web编辑工具
? 标记处理
? 可视化处理
? 集成编程语言
? XML文档处理
4.5.3 Web出版示范系统