第1章 多媒体技术概要
***************************************************************************
1.1 多媒体是交互式信息传播媒体
1.2 多媒体涉及的几个概念
1.2.1 超文本的概念
1.2.2 超媒体的概念
1.2.3 标准通用标记语言(SGML)
1.2.4 超文本标记语言(HTML)
1.2.5 虚拟现实造型语言(VRML)
1.3 多媒体与网络
1.4 多媒体与光盘存储器
1.5 多媒体的技术研究与应用开发练习与思考题
***************************************************************************
多媒体是融合两种或者两种以上媒体的一种人-机交互式信息交流和传播媒体,使用的媒体包括文字、图形、图像、声音、动画和电视图像(video)。多媒体是超媒体系统中的一个子集,超媒体系统是使用超链接构成的全球信息系统,全球信息系统是因特网上使用TCP/IP协议和UDP/IP协议的应用系统。二维的多媒体网页使用HTML来编写,而三维的多媒体网页使用VRML来编写。目前许多多媒体作品使用光盘存储器发行,将来更多地使用网络来发行。
1.1 多媒体是交互式信息传播媒体多媒体(multimedia)是融合两种以上媒体的人-机交互式信息交流和传播媒体。在这个定义中需要明确几点:①多媒体是信息交流和传播媒体,从这个意义上说,多媒体和电视、报纸、杂志等媒体的功能是一样的。②多媒体是人-机交互式媒体,这里所指的“机”,目前主要是指计算机,或者由微处理器控制的其他终端设备。因为计算机的一个重要特性是“交互性”,使用它就比较容易实现人-机交互功能。从这个意义上说,多媒体和目前大家所熟悉的模拟电视、报纸、杂志等媒体是大不相同的。③多媒体信息都是以数字的形式而不是以模拟信号的形式存储和传输的。④传播信息的媒体的种类很多,如文字、声音、电视图像、图形、图像、动画等。虽然融合任何两种以上的媒体就可以称为多媒体,但通常认为多媒体中的连续媒体(声音和电视图像)是人与机器交互的最自然的媒体。
也许读者要问,电视也是使用活动画面和声音来表达和传播信息,也使用文字、图片和图形来点缀,多媒体和电视到底有什么不同?这需要让我们简单地回顾一下计算机和电视机所走过的历程,看看多媒体和电视在技术上的差别。计算机是20世纪40年代的伟大发明,一直沿着数字信号处理技术的方向发展,而且是沿着数值计算和金融管理发展起来的。60年代文字进入计算机,70年代图像、声音进入计算机,80年代电视进入计算机,进入90年代个人计算机已经能够实时处理数据量很大的声音和影视图像信息。电视是20世纪20年代的伟大发明,在50年代开发电视技术时,用任何一种数字技术来传输和再现真实世界的图像和声音都是极其困难的,因此电视技术一直沿着模拟信号处理技术的方向发展,直到70年代才开始开发数字电视。由于数字技术具有许多优越性,而且数字技术发展到足以使模拟电视向数字电视过渡的水平,电视和计算机才开始融合在一起。
由于多媒体和模拟电视采用的技术不同,对于同样内容的信息或者节目,它们所表现出的特性就很不相同,对人们所产生的不同影响也引起了许多有识之士的高度重视。我们现在看的模拟电视的特性是线性播放,简单地说就是影视节目是从头到尾播放的,而收看者是最活跃的人,人与电视之间,人是被动者而电视是主动者;多媒体是由计算机参与的,计算机的一个重要特性是交互性,就是人们可以使用像键盘、鼠标器、触摸屏、声音、数据手套等设备,通过计算机程序去控制各种媒体的播放,人与计算机之间,人驾驶多媒体,人是主动者而多媒体是被动者。
多媒体使用具有划时代意义的“超文本”思想与技术组成了一个全球范围的超媒体空间,通过网络、只读光盘存储器(compact disc read-only memory,CD-ROM)、数字多能光盘(digital versatile disc,DVD)和多媒体计算机,人们表达、获取和使用信息的方式和方法将产生重大变革,对人类社会产生长远和深刻的影响。
1.2 多媒体涉及的几个概念多媒体是一门综合技术,它涉及到许多概念,本节首先解释几个与多媒体密切相关的而且容易混淆的重要概念。通过对这些概念的介绍进一步加深对多媒体的认识,从整体上认识多媒体与超文本、超媒体、SGML、HTML和VRML等语言之间的关系。
1.2.1 超文本的概念
1965年Ted Nelson在计算机上处理文本文件时想了一种把文本中遇到的相关文本组织在一起的方法,让计算机能够响应人的思维以及能够方便地获取所需要的信息。他为这种方法杜撰了一个词,称为超文本(hypertext)。实际上,这个词的真正含义是“链接”的意思,用来描述计算机中的文件的组织方法,后来人们把用这种方法组织的文本称为“超文本”。
超文本是一种文本,它和书本上的文本是一样的。但与传统的文本文件相比,它们之间的主要差别是,传统文本是以线性方式组织的,而超文本是以非线性方式组织的。这里的“非线性”是指文本中遇到的一些相关内容通过链接组织在一起,用户可以很方便地浏览这些相关内容。这种文本的组织方式与人们的思维方式和工作方式比较接近。
超文本的概念可用图1-01来说明。超文本中带有链接关系的文本通常用下划线和不同的颜色表示。文本①中的“超文本”与②中的“超文本”建立有链接关系,①中的“超媒体”与③中的“超媒体”建立有链接关系,③中的“超链接”与④中的“超链接”建立有链接关系…,这种文件就称为超文本文件。

图1-01 超文本的概念
超链接(hyper link)是指文本中的词、短语、符号、图像、声音剪辑或影视剪辑之间的链接,或者与其他的文件、超文本文件之间的链接,也称为“热链接(hot link)”,或者称为“超文本链接(hypertext link)”。词、短语、符号、图像、声音剪辑、影视剪辑和其他文件通常被称为对象或者称为文档元素(element),因此超链接是对象之间或者文档元素之间的链接。建立互相链接的这些对象不受空间位置的限制,它们可以在同一个文件内也可以在不同的文件之间,也可以通过网络与世界上的任何一台连网计算机上的文件建立链接关系。
1.2.2 超媒体的概念在20世纪70年代,用户语言接口方面的先驱者Andries Van Dam创造了一个新词“电子图书”(Electronic Book),现在翻译成。电子图书中自然包含有许多静态图片和图形,它的含义是你可以在计算机上去创作作品和联想式地阅读文件,它保存了用纸做存储媒体的最好的特性,而同时又加入了丰富的非线性链接,这就促使在80年代产生了超媒体(hypermedia)技术。超媒体不仅可以包含文字而且还可以包含图形、图像,动画、声音和电视片断,这些媒体之间也是用超级链接组织的,而且它们之间的链接也是错综复杂的。
超媒体与超文本之间的不同之处是,超文本主要是以文字的形式表示信息,建立的链接关系主要是文句之间的链接关系。超媒体除了使用文本外,还使用图形、图像、声音、动画或影视片断等多种媒体来表示信息,建立的链接关系是文本、图形、图像、声音、动画和影视片断等媒体之间的链接关系,如图1-02所示。

图1-02 超媒体的概念
当我们使用Web浏览器浏览因特网时,在显示屏幕上看到的页面称为网页(Web Page),它是Web站点上的的文档。而进入该站点时在屏幕上显示的第一个综合界面称为起始页(home page)或者称为主页,它有一点像一本书的封面或者是书的目录表。在万维网网页上,为了区分有链接关系和没有链接关系的文档元素,对有链接关系的文档元素通常用不同颜色或者下划线来表示。目前,在网页上担当链接使命的主要是超文本标记语言(HTML),它是从标准通用标记语言(SGML)导出的。
1.2.3 标准通用标记语言(SGML)
1.SGML是什么:
标准通用标记语言(Standard Generalized Markup Language,SGML)是1986年出版发布的一个信息管理方面的国际标准,标准号是ISO 8879。该标准定义独立于平台和应用的文本文档的格式、索引和链接信息,为用户提供一种类似于语法的机制,用来定义文档的结构和指示文档结构的标签(tag)。 其中,markup的含义是指插入到文档(document)中的标记。标记分成两种,一种称为程序标记(procedural markup),用来描述文档显示的样式(style)(如字体的大小、黑体、斜体和颜色等),现在市场上出售的大多数字处理软件都内嵌有标记,而且这种标记几乎都是针对自己的软件产品而制定的;另一种称为描述标记(descriptive markup),也称为普通标记(generic markup),用来描述文档中的文句的用途(如篇、章、节或者内容表等),而不是描述文句所显示的样式。制定SGML的基本思想是把文档的内容与样式分开。
SGML规定了在文档中嵌入描述标记的标准格式,指定了描述文档结构的标准方法,这是SGML的精华。换句话说,你可使用SGML为你创作的每一种类型的文档设置层次结构模型,可以用“篇”、“章”、“节”、“标题”等描述标记来标识文档结构中的文档元素。SGML是一个包含超文本链接的综合语言,在Web上使用的HTML格式是使用固定标签集的一种SGML文档。
SGML的主要特点:①SGML可支持无数的文档结构类型,例如布告、技术手册、章节目录、设计规范、各种报告、信函和备忘录等;②SGML可以创建与特定的软硬件无关的文档,因此很容易与使用不同计算机系统的用户交换文档。
2,SGML的工作原理一个典型的文档可被分成3个层次:结构(structure)、内容(content)和样式(style)。SGML主要是处理结构和内容之间的关系。
(1) 结构:为了描述文档的结构,SGML定义了一个称为“文档类型定义(Document Type Definition,DTD)”的文件(file),它为组织文档的文档元素(例如章和章标题,节和主题等)提供了一个框架。此外,DTD还为文档元素之间的相互关系制定了规则。例如,“章的标题必须是在章开始之后的第一个文档元素”,“每个列表至少要有两个项目”等。DTD定义的这些规则可以确保文档的一致性。
(2) 内容:这里指的内容就是信息本身。内容包括信息名称(标题)、段落、项目列表和表格中的具体内容,具体的图形和声音等。确定内容在DTD结构中的位置的方法称为“加标签(tagging)”,而创建SGML文档实际上就是围绕内容插入相应的标签。这些标签就是给结构中的每一部分的开始和结束做标记。
[例1.1]:给一个段落做标记
<par>内容就是信息本身。</par>
其中的<par>表示段落的开始,而</par>表示该段落的结束,它们是成对出现的。“<par>内容就是信息本身</par>”这个段落可看成一个文档元素,它可以嵌入在其他的文档元素中。
[例1.2]:在其他文档元素中嵌入文档元素
<topic><par>内容就是信息本身</par></topic>
其中的“<par>内容就是信息本身</par>”是<topic>和</topic>中的一个文档元素。
[例1.3]:特定文档结构中的标签嵌套
<section><subhead>内容</subhead><par>内容就是信息本身</par></section>
像<section>与</section>,<subhead>与</subhead>,<par>与</par>,<topic>与</topic>等这些具体的符号称为标签(tag)。在创建SGML文档时,不需要从键盘上手工输入和检查这些标签,使用支持SGML的创作软件很容易插入和检查这些标签。使用支持SGML的创作软件显示例1.3的内容如下:

(3) 样式:SGML本身正在定义样式(style)的设置标准,即文档样式语义学和规范语言(Document Style Semantics and Specification Language,DSSSL)。
使用SGML对多媒体的创作将带来许多好处。例如,可使创作人员更集中于内容的创作,可提高作品的重复使用性能、可移植性能以及共享性能等;SGML的使用范围很广,除了传统的电子出版物之外,SGML还可用在其他许多场合。例如,前面介绍的超媒体和超文本文档、万维网页面的制作、数据库、电子邮件、专家系统、CD-ROM出版物、交互式电子技术手册等方面都大有用武之地。
1.2.4 超文本标记语言(HTML)
超文本标记语言(HyperText Makeup Language,HTML)是一种用来创作万维网页面的描述语言,而不是一种难于掌握的捉摸不定的语言(Hard To Master Lingo)。HTML使用HTML标签来定义文档的格式、组成和链接关系,如字形、字体、表单、标题和统一资源地址(Uniform Resource Locator,URL)等。HTML是从SGML语言导出的语言,是SGML的一个子集。使用HTML创作的文档是带有一套固定标签的SGML文档。
万维网采用HTML来组织文件。用HTML组织的文件本身属于普通的文档文件,可以用一般常见的文字编辑器来编辑,或用其他专门的HTML文件编辑器来编辑,如Microsoft公司的Office 97和FrontPage,Sausage Software公司的HotDog HTML编辑器等。
1.2.5 虚拟现实造型语言(VRML)
虚拟现实造型语言(Virtual Reality Modeling Language,VRML)是一种用来描述万维网页面上三维交互环境的文件格式。VRML的基本原理同HTML的基本原理一样简单,都是用一系列指令告诉浏览器如何显示一个文档,它们都是描述万维网页面的描述语言。它与HTML不同的是,以HTML为核心的万维网浏览器浏览的是二维世界,而以VRML为核心的万维网浏览器浏览的是三维世界,你可以使用鼠标器在这个世界里到处“逛一逛”,而不是像在二维世界里“一页一页”地显示。
体验三维世界需要有能接收和再现VRML文件的浏览器。目前有两种类型,一种是插入型,把VRML浏览软件插入到HTML万维网浏览器;另一种是单独的VRML浏览器。.
1.3 多媒体与网络因特网(Internet)是一个通过网络设备把世界各国的计算机相互连接在一起的计算机网络。在这个网络上,使用普通的语言就可以进行相互通信,协同研究,从事商业活动,共享信息资源。现在人们越来越多地使用多媒体进行通信。
因特网的雏形是美国国防部高级研究计划署(Defense Department's Advanced Research Projects Agency,ARPA) 在20世纪60年代末开始筹建的ARPANET网络,它用于在地理上相互独立的军事研究机构和大学之间实时共享计算机数据,现在已经远远地拓宽了它的应用范围。因特网是世界上规模最大、用户最多的计算机网络,是20世纪全球发展最迅速、影响最深远和冲击最大的信息存取和处理工具。
万维网(Web)是在因特网上运行的全球性分布式信息系统,Web是WWW(World Wide Web)的简称。由于它支持文本、图像、声音、影视等数据类型,而且使用超文本、超链接技术把全球范围里的信息链接在一起,所以也称为超媒体环球信息系统。
整个万维网计划是1989年由欧洲高能物理实验室(European Laboratory for Particle Physics)开始研究的,是应用超文本和超媒体技术的典范。随着相关工具软件的普及,万维网在因特网上己吸引越来越多的学校、机构及各行各业的公司竞相投入,以提供多姿多彩的教育、信息和商业服务。万维网正在改变人们进行全球通信的方式。人们接受和使用这种新的全球性的媒体比历史上任何一种通信媒体都快。在过去的几年里,万维网已经聚集有巨大的信息资源,从股票交易到寻找职业,从电子公告板到了解新闻,预看电影,阅读名著、文学评论、音乐欣赏直到玩游戏等,凡是人们能够想到的万维网上几乎都可以找到。
万维网和因特网的关系犹如计算机的硬件平台和软件环境之间的关系。万维网技术是因特网上环球信息系统设计技术上的一个重大突破,是目前最热门的多媒体技术。
1.4 多媒体与光盘存储器光盘(compact disc,CD)存储器在多媒体的发展史上起了相当重要的作用,在网络还不发达的国家里CD是发行多媒体节目的主要手段。由于多媒体的数据量很大,近年来世界上正在开发存储容量比CD大得多的DVD光盘存储器。DVD原名为Digital Video Disc的缩写,意思是“数字影视光盘”,这是为了与VCD(Video CD)相区别。实际上,DVD的应用不仅仅是可以用来存放交互影视节目,同样也可以用来存储其他类型的数据,因此后来把Digital Video Disc更名为Digital Versatile Disc,它的缩写仍然是DVD,Versatile的意思是多才多艺的意思。
DVD盘与我们现在使用的CD盘相比,在形状、尺寸、面积、重量方面都一样,也都是用塑料做衬底的金属盘。现在定义的DVD的存储容量最高可达到17 GB,一片DVD盘的容量相当于25片CD-ROM(650 MB/片)的容量。
CD家族中有很多成员(CD-Audio,CD-ROM,CD-R,Video CD,CD-I,Photo CD等)。与CD类似,DVD家族中目前拟有5名成员,如表1-01所示。
表1-01 DVD与CD的主要成员
DVD(Digital Versatile Disc)
CD(Compact Disk)
主要用途
DVD-ROM
CD-ROM
存储计算机数据、多媒体数据等
DVD-Video
Video-CD
存储影视节目
DVD-Audio
CD-Audio
存储音乐节目
DVD-Recordable
CD-R
存储档案等
DVD-RAM
CD-MO
计算机的存储器
1.5 多媒体的技术研究与应用开发多媒体涉及的技术范围很广,技术很新、研究内容很深,是多种学科和多种技术交叉的领域。目前,多媒体技术的研究和应用开发主要在下列几个方面:
(1) 多媒体数据的表示技术:包括文字、声音、图形、图像、动画、影视等媒体在计算机中的表示方法。由于多媒体的数据量大得惊人,尤其是声音和影视,包括高清晰度数字电视(High Definition Television,HDTV)这类的连续媒体。为克服数据传输通道带宽和存储器容量的限制,投入了大量的人力和物力来开发数据压缩和解压缩技术;人-机接口技术,如语音识别和文本-语音转换(text to speech,TTS)也是多媒体研究中的重要课题;虚拟现实(Virtual Reality,VR)是当今多媒体技术研究中的热点技术之一。
(2) 多媒体创作和编辑工具:使用工具将会大大缩短提供信息的时间。将来人人都要会使用多媒体创作和编辑工具,就像现在我们使用笔和纸那样熟练。
(3) 多媒体数据的存储技术:这包括CD技术,DVD技术等。
(4) 多媒体的应用开发:包括多媒体CD-ROM节目(title)制作,多媒体数据库,环球超媒体信息系统(Web),多目标广播技术(multicasting),影视点播(video on demand,VOD),电视会议(video conferencing),远程教育系统,多媒体信息的检索等。
1.5 练习与思考题
1.1 多媒体是什么?
1.2 超文本的核心思想是什么?超文本系统和超媒体系统有什么差别?
1.3 超媒体是什么?多媒体与超媒体之间有什么关系?
1.4 SGML是什么语言?HTML是什么语言?它们之间有何关系?
1.5 有人认为“因特网就是万维网”,这种看法对不对?为什么?
1.6 多媒体、万维网和因特网之间有何关系?