第 3章 多媒体计算机系统组成
? 多媒体存储技术
? 多媒体功能卡
? 多媒体信息获取与显示设备
? 多媒体个人计算机
? CD-I交互式多媒体系统
? DVI多媒体计算机系统
? VCD与 DVD播放系统
? 多媒体工作站
3.1多媒体存储技术
3.1.1 多媒体信息存储的特点
? 多媒体信息存在和表现的形式
? 正文 包括文字和数据
? 向量图形 图元组成的图形
? 位图图像
? 数字化声音和高保真音响
? 数字化视频
3.1.2 光盘存储原理
? 光存储技术
? 光存储技术的产品化形式是由光盘驱动器
和光盘片组成的光盘驱动系统。
? 驱动器读写头是用半导体激光器和光路系
统组成的光头,记录介质采用磁光材料。
? 光存储技术原理 改变一个存储单元的性质,
使其性质的变化反映出被存储的数据; 识别这
种性质的变化,就可以读出存储数据。
? 光存储单元的性质,例如反射率、反射光极化
方向等均可以改变,它们对应着存储二进制数
据 0(不变 ),1(改变 ),光电检测器能够通过检测
出光强和光极性的变化来识别信息。
? 高能量激光束可以聚焦成约 1微米的光斑,因此
光存储技术比其他存储技术有更高的容量。
光盘系统的特点
? 与硬盘相比,具有可拆卸性; 容量相当; 驱动
器较贵,但盘片便宜; 读写速度慢。
? 与磁带相比,具有容量大、随机存取性强的优
点。
? 激光头与介质无接触,不受环境影响而退磁,
信息保存时间长,可达 30年以上 。
光盘系统技术指标
? 容量 光盘盘片的容量
? 平均存取时间 在光盘上找到需要读写
信息的位置所需时间
? 数据传输率
? 接口标准及格式规范等
存储容量
? 指它所能读写的光盘盘片的容量。
? 光盘容量又分为格式化容量和用户容量,
采用不同的格式和不同驱动器,光盘格式
化后容量不同。
? 一般用户容量比格式化容量要少,因为光
盘还需要存放有关控制、校验等信息。
平均存取时间
? 是在光盘上找到需要读写的信息的位置所
需要的时间。
? 指从计算机向光盘驱动器发出命令,到光
盘驱动器可以接受读写命令为止的时间。
? 一般取光头沿半径移动全程 1/3长度所需要
的时间为平均寻道时间,盘片旋转一周的
一半时间为平均等待时间,两者加上读写
光头稳定时间就是平均存取时间。
数据传输率有多种定义方式 。
? 一种是指从光盘驱动器送出的数据率, 可以
定义为单位时间内光盘的光道上传送的数据
比特数, 这与光盘转速, 存储密度有关 。
? 另一种定义是指控制器与主机间的传输率,
它与接口规范, 控制器内的缓冲器大小有关 。
光盘的分类
? CD-ROM只读光盘
? WORM一次写多次读光盘
? Rewritable可重写光盘
CD-ROM
? 最常用的光盘系统,直径约 12cm,因为它容量
大,约 650MB,价格便宜,市场上颇受用户的
欢迎。
? CD-ROM光盘是由母盘压模制成的,一旦复制
成形,永久不变,用户只能读出信息。
? CD-ROM采用激光调制方式记录信息,将信息
以凹坑和凸区的形式记录在螺旋形光道上。
WORM一次写多次读光盘
? WORM光盘在使用前首先要进行格式化,形成格
式化信息区和逻辑目录区,利用激光照射介质,
使介质变异,利用激光不同的变化,使其产生一
连串排列的“点”,从而完成写的过程。
? 引入文件分配表的概念,在光盘的根目录下面是
用户定义的逻辑目录,逻辑目录对应文件管理区。
? 在逻辑目录建立同时,用户可以根据需要,对其
中重要数据进行加密。
? 一旦写入就不能再更改。
Rewritable可重写光盘
? 可重写光盘或称可擦写光盘是最理想的光盘类
型,也是最有应用前途的光盘类型。它像硬盘
一样可读写,利用浮动磁光头在磁光盘上进行
磁场调制,可进行高速重写磁光记录 。
只读光盘读原理
? 只读光盘上的信息是沿着盘面螺旋形状的
信息轨道以凹坑和凸区的形式记录的。
? 它既可以记录模拟信息 (如 Laser Vision系
统 ),也可以记录数字信号 (如 CD-DA)。
坑深 0.12μm
0.6μm
1.6μm
在螺旋形光道上以凹坑和凸区表示的信息
001000100000100
图 3.1 只读光盘工作原理
在光盘上记录模拟信息
? 模拟信号先进行频率调制 (FM),声音信号加在
经过频率调制的视频信号上,所得到的综合信
号经过双向限幅,再转换成光盘上长度不等的
凹坑和凸区,边缘之间的长度反映了视频信号
频率的高低和声音信号的频率和幅度。
在光盘上写 /读数字信息
? 光道上凹坑或凸区的长度是 0.3微米的整数倍。凹
凸交界的正负跳变沿均代表数字,1”,两个边缘
之间代表数字,0”,,0”的个数是边缘之间长
度决定的。
? 通过光学探测仪器产生光电检测信号,从而读出
,0”、,1”数据。
? 数字信号记录的优点是抗干扰能力强,由于盘片
损坏或变脏而造成的读出错误也容易得到纠正。
EFM编码
? 为了提高读出数据可靠性,减少误读率,存储
数据采用 EFM(Eight to Fourteen Modulation)编
码,即将 1字节的 8位编码为 14位的光轨道位,
并在每 14位之间插入 3位“合并位” 以确保,1”
码间至少有 2个,0”码,但最多有 10个,0”
码。
可重写光盘的擦写原理
? 光盘记录方式可分为两大类,
? 磁光式
? 相变式
磁光式擦写原理
? 当前国际上较流行的是磁光式,该盘普遍采用
玻璃盘基上再加四层膜结构组成,它是以稀
土 —过渡金属非晶体垂直磁化膜作为记录介质
光学膜和保护膜的多层夹心结构。
? 两种磁光写操作方法居里点记录 (稀土 —铁合
金膜介质 )
? 补偿点记录 (稀土 —钴合金膜介质 )
磁光写的过程
? 用激光照射光盘垂直膜面磁化方向上的磁化物质,
并对其垂直磁化。
? 利用磁性物质居里点热磁效应,在某一方向饱和式
磁化,用激光对需要存储信息, 1” 的单元区域加
热,使其温度超过居里点,失去磁性。在盘的另一
面上施加一个外磁场,使被照单元反向磁化,这样
该单元磁化方向与其他未照射单元方向相反,从而
生产一个信息存储状态, 1”,而其他未经照射单
元相当于存储信息, 0” 。
? 信息擦去过程与写过程刚好相反,即恢复原来的磁
化方向。
相变式擦写原理
? 利用记录介质的两个稳态之间的互逆相结构的
变化来实现信息的记录和擦除 。 两种稳态是反
射率高的晶态和反射率低的非晶态 (玻璃态 )。
? 写过程是把记录介质的信息点从晶态转变为非
晶态 。
? 擦过程是写过程的逆过程, 即把激光束照射的
信息点从非晶态恢复到晶态 。
3.1.3 光盘标准
1,光盘发展历史
? 1972年 9月 5日 Philips公司向国际新闻界展示了
长时间播放电视节目的光盘系统,在光盘上
记录的是模拟电视信号 。
? 1978年,SONY生产的影碟机正式投放市场,
光盘的直径为 30厘米,一片双面盘的播放时
间可达 2小时。
? 1979年,Philips公司发表了激光唱机 (compact
disk player)。
光盘的规范和标准
? CD-DA
? CD-ROM
? CD-V(Video)
? 可录 CD
? CD-I
? CD-ROM XA
? Photo-CD
? Video CD
CD-DA
? 1981年制定红皮书, 即 CD-DA (Digital Audio)
激光数字音频光盘的规范 。 这个标准是 CD的
最基本标准 。
CD-ROM
? 1985年制定黄皮书, 经修订, 1988年正式作为
国际标准 ISO9660,1991 年又推出了 ISO
9660Ⅱ 。
CD-V(video)
? 从红皮书发展而来,在影碟机上使用,视频信
息可以输出到电视机。
可录 CD
? 可录 CD(recordable CD)盘的橙皮书标准 。 可录
CD分为两类, 即 CD-MO和 CD-WO。 CD-MO
称为磁光盘, 可重写; CD-WO又称 CD-R,这
种盘一旦用户写入数据就不能抹掉 。
CD-I
? 1987年制定绿皮书规范用于交互式多媒
体 CD-I系统中 。
? 1992年推出第二代 CD-I,可播放交互式
视频图像 。
CD-ROM XA(extended architecture)
? 1988年,Philips,SONY及 Microsoft制定 CD-
ROM扩展结构,1991年又制定 CD-ROM XAⅡ
规范,对应于 ISO9660Ⅱ 。
Photo-CD
? 像片光盘, 1991年 Philips和 KODAK对外发
布 Photo-CD,1992年制定规范 。 用于存放数
字化的静态照片 。
Video CD
? 1993年制定的白皮书规范, 采用 MPEG压缩算法
压缩动态图像 。 它能使 Video CD节目能够在
CD-I,CD-ROM/XA和 Video CD播放机上播放 。
2,CD-ROM的性能指标
(1) 容量 约为 650MB。
(2) 数据传送速率 最初推出为 150KB/S,称为
单速, 后又推出倍速 (300KB/S),四速 (600
KB/S),…, 48X等光驱 。
(3) 存储缓冲器 早期为 64KB,目前常用的为
128 KB或 256KB。
(4) 存取时间 200~ 400ms
(5) 误码率 1/1012~ 1/1016,采用复杂的纠错编
码技术降低了误码率。
(6) 体积光盘驱动器的大小一般为 41mm(H)×
146mm(W)× 206mm(D)
(7) 接口 采用 SCSI接口,IDE接口和 AT总线接口。
接口可以集成在音频板、视频板或主机板上,
也可以是一块单独的板 。
(8) MTBF(mean time between failures) 平均无故
障时间约为 25000小时左右 。
(9) 兼容性 支持 Photo-CD和 CD-ROM XA。
3.光盘的规范及格式
? CD-DA规范及格式
? CD-ROM规范及格式
? CD-I光盘的数据格式
? 激光视盘
CD-DA规范及格式
? CD-DA即激光唱盘,光盘的物理规格为直径
12cm,内径 1.5cm,厚度 0.12cm,重量 14克。这
种光盘常采用常线速 (CLV)伺服方式,逆时针旋
转。
? 其螺旋线光道上等长分段,每段称为一个扇区。
每个扇区都存放定量数据块,并以特定的地址
标记,其单位为“分”、“秒”、“扇区”,
即 1分 =60秒,1秒 =75扇区。
? 光道总长度为 74分,即可存放 74分钟高音质非
压缩的音频信号。
? CD-DA每个扇区的音频数据分为许多称为帧的
单元,每帧共有 33个字节。
? 一帧中每个通道有 6个音频数据, 有左右 2个通
道, 每个通道的样本值是 16位的数据, 共 24个
字节。一帧中有 8个校验字节和 1个“控制与显
示 (C&D)”字节。
? 错误的检测和校正采用的是 CIRC(cross
interleave reed-solomon code)码。
图 3.2 CD-DA帧及扇区格式
C&D
1B
音频数据
12B
校验
4B
音频数据
12B
校验
4B
8位 8位 8位 … 8位
24位 3位 14 3 14 3 14 3 … 14 3
帧 0 帧 1 帧 2 … 帧 97
1扇区
1帧
同步位 合并
位
33字节
EFM调制
588个
通道位
? CD-ROM同样是把光轨道分为等长的扇区,使
用分、秒、扇区的数据编址方法,采用常线速
伺服方式。它与 CD-DA的不同主要在每个扇区
中数据格式的不同。
? CD-ROM光盘有两种格式,Mode1和 Mode2。
Mode1格式
Mode2格式
SYNC
12B
HEADER
4B
USER DATA
2048B
EDC
4B
SPACE
8B
ECC
276B
SYNC
12B
HEADER
4B
USER DATA
2336B
图 3.3 CD-ROM的 Mode1和 Mode2格式
Mode1和 Mode2格式相同之处
? 这两种方式的扇区首部都是 12字节的同步码
(SYNC),其前后为,00H”而中间 10个字节存放
,FFH”数据。紧接着的 4个字节为地址字段,或
称扇区头 (HEADER),它采用分、秒、扇区号的
制式确定地址标号,地址字段中设置了 MODE字
节,指明该扇区是哪种格式
Mode1和 Mode2格式不同之处
? 用户数据量不同。 Model1为 2048个字节,Mode2为
2336个字节。
? 存储数据的类型不同。 Mode1用于存放对错误极为
敏感的数据,如计算机程序等; 而 Mode2用于存放
对错误不太敏感的数据,如声音、图像、图形等。
? Mode2的数据经过 CIRC检验后的误码率为 1/109,
对声音、图像类的数据可以不必做进一步校验;
而要满足计算机数据误码率小于 1/1012的要求,则
应对 Mode1的数据作进一步校验。
Mode1中的容错机制
? 用了 4个字节作为错误检测码 (EDC),采用的
循环冗余校验码 CRC,只能检测是否有错
? 用 276个字节作为错误校正码 (ECC),可以校
正扇区中多个字节错误。
? 通过两级校验,Mode1中数据误码率可以降
到 1/1012。
CD-ROM XA
? 它所定义格式包括与 CD-I格式相同的 FORM1和
FORM2格式,解决了普通 CD-ROM驱动器不能
读 CD-I格式光盘的问题。
? CD-ROM XA的数据格式 (FORM1,FORM2)
SYNC
12B
HEADER
4B
SUBHEADER
8B
USER DATA
2048B
EDC
4 B
ECC
276B
SYNC
12B
HEADER
4B
SUBHEADER
8B
USER DATA
2324B
EDC
4B
图 3.4 CD-ROM XA FORM1和 FORM2格式
? CD-ROM XA在 HEADER后面增加了 8个字节信
息来进一步说明扇区中用户数据,其中存放有数
据类型 (音频、视频、数据等 )格式形式,触发位
(记录开始、文件结束、实时性等 ),数据编码信
息 (ADPCM,CLUT,DYUV等 )。
? 这样 CD-ROM XA驱动器可通过对子头信息的识
别,读出数据区中多种媒体的信息,特别地能正
确读出 CD-I中采用 ADPCM压缩的音频数据。
CD-ROM卷和文件结构
? 卷和文件结构由逻辑块 (512× 2n字节 )和逻辑扇
区 (2048× 2n字节 )、记录、文件、卷、卷集等
多级结构定义。
? 由于 CD-ROM驱动器的平均寻道时间较长,为
了能高速检索 CD-ROM光盘上文件,ISO为 CD-
ROM光盘的文件目录结构规定了路径表
图 3.5 CD-ROM目录 结构和路径表
CD-I光盘的数据格式
? CD-I光盘的数据格式是从 CD-DA和 CD-ROM光
盘格式演变而来的。
? 其扇区格式与 CD-ROM XA相同,它有三个区:
导入区 (Lead-in Area),节目区 (Program Area)和
导出区 (Lead-out Area)。
? CD盘上的信息均采用 EFM记录方式进行记录。
由于光盘原始误码率较高,所以都采用能纠突
发错误的 CIRC码。
? CD-I光盘的导入区 是由若干个空扇区组成的,
这样做的目的是使识别节目区变得容易 。
? CD-I光盘可以有多到 99条光道, 编号为 1~ 99。
? CD-I光盘的导出区 或者是空扇区 (最后一条光
道是 CD-I光道时 )或者是无声的帧 (最后一条光
道是 CD-DA光道 )
图 3.6 CD盘结构
图 3.7 只有 CD-I光道的 CD-I盘结构
导入区 166信息
扇区
盘标记 2250信息
扇区
CD-I数据 导出区
节目区
光道 1
? 含有 CD-DA光道的 CD-I光盘,第一条光道必须是 CD-I光道; 且任一
条 CD-I光盘上的 CD-DA光道必须在 CD-I光道之后。
? 一片 CD-I光盘上的 CD-DA光道可以有一条或多条 CD-DA光道, 但最多
不超过 98条 。 而一条光道的长度可以是 300个扇区 (相当于 4秒 )和
325000个扇区 (相当于最长的超级 HiFi播放 72分钟 )之间的数 。
导入区 166B信
息扇区
盘标记 2250信
息扇区
CD-I数
据
2250信
息扇区
CD-DA 导出区
图 3.8 有 CD-I和 CD-DA光道的 CD-I盘结构
节目区
光道 1 光道 n
CD-DA(n<=99)
? CD-I光盘的导出区或者是空扇区 (最后一条光
道是 CD-I光道时 )或者是无声的帧 (最后一条光
道是 CD-DA光道 )
? CD-I盘上的所有数据都以文件形式存放, 任何
一个文件都可以通过盘上的路径表取出 。
? 每个文件都有文件描述符记录, 存放于文件目
录中 。 文件描述符记录包含有文件名, 文件号,
文件大小, 地址, 拥有者, 属性, 交叉存取因
子, 读取许可权 。
? 文件分为目录文件, 实时文件和标准文件 。
? CD-I的数据以两种专门的数据格式 FORM1和
FORM2记录。如光盘是用 FORM1记录,因为
它有 EDC和 ECC码,CD-I系统利用它们可以获
得误码率小于 1/1013数据。
激光视盘
? 激光视盘也是一种只读光盘, 家用激光视盘又称
为影碟机, 是独立的视频播放设备, 与音响设备
和电视机 (监视器 )相连就可以播放视盘 。
? 计算机可以通过外设接口与视盘播放机相连, 视
盘在多媒体应用形式主要是, 交互式视盘,, 由
计算机控制视盘的播放, 视频帧的寻址和显示 。
? 视盘与前述的几种光盘原理结构一样
? 视盘的型号 大 -12英寸,小 -12CM
? 视盘有两种信息记录格式
常线速 (CLV)
常角速 (CAV)
CLV型视盘
? 扇区长度为常数,以紧凑形式存放信息,每盘
可以存放 60分钟的视频信号。
? 当驱动器从内圈到外圈读盘时,由于内圈和外
圈存放的信息量不同,所以转速也不同。在内
圈可达到每分钟 1800转,在外圈轨道每分钟约
600转。
CAV型视盘
? 以类似于磁盘的方式划分扇区,扇区长度从内圈
到外圈逐渐增加,每盘仅可存放 30分钟视频信号。
? 优点是驱动器读盘时,从内圈到外圈,转速一致,
对 NTSC制式,CAV视盘转速为每分钟 1800转,
对 PAL制式,CAV视盘转速为每分钟 1500转。
? 这种信息存放格式有利于单帧访问、搜索、帧序
列的随机访问等功能,适合于多媒体平台。
Video CD标准
? Video CD标准是目前流行的视频光盘标准,它
描述一个使用 CD格式和 MPEG-1标准的数字电
视播放系统。
? Video CD定义了 MPEG光道的结构,它由
MPEG-Video扇区和 MPEG-Audio扇区组成。光
道上的 Video(电视图像 )和 Audio(声音 )是按
MPEG-1的规定进行编码。
? MPEG-Video扇区和 MPEG-Audio扇区是交错存
放在光道上 。
图 3.9 Video CD结构
… V V V V A V V V V V A V V V V V A V V …
信息包开始码
4B
SCR(系统参
考时钟 )
5B
MUX速率
3B
信息包数据
2312B
信息包开始码
4B
SCR(系统参
考时钟 )
5B
MUX速率
3B
信息包
数据
2292B
00
20B
Video CD光道结构
MPEG Video扇区的一般结构
MPEG Audio扇区的一般结构
4.CD-ROM光盘制作过程
(1) 数据准备
(2) 主盘制作
(3) 复制光盘
图 3.10 CD-ROM光盘制作过程
3.1.4 DVD光盘
? MPEG-2的视频质量是广播级质量,为解决其
MPEG-2数据存储问题,研制了 DVD并于 1995年
完成标准化方案。
? DVD盘片尺寸与 CD相同,容量最高的双层双面
盘可达 17GB。 单面单层 DVD盘能够存储 4.7GB
的数据,存储 133分钟的 MPEG-2视频,其分辨
率与现在电视相同,并配备 Dolby AC-3/MPEG-2
音频质量的声音和不同语言的字幕。
表 3.1 DVD系列标准与 CD系列标准
DVD系列 CD系列
Book A,DVD-ROM CD-ROM
Book B,DVD-Video Video CD
Book C,DVD-Audio CD-Audio
Book D,DVD-Recordable CD-R
Book E,DVD-RAM CD-MO
表 3.2 DVD-Video的规格
数据传输率 可变速率,平均速率为 4.69Mbps,最大速率 10.7Mbps
图像压缩标准 MPEG-2标准
声音标准
NTSC,DolbyAC-3 或 LPCM,可 选 用
MPEG-2 Audio
PAL/SECAM,MPEG MUSICAM 5.1 或
LPCM,可选用 Dolby AC-3
通道数 多达 8个声音通道和 32个字幕通道
? 从外观和尺寸上看, DVD盘和 CD-ROM盘没什么差别, 直
径均为 120mm,厚度为 1.2mm; 新的 DVD播放机能够播放
已有的 CD激光唱片和 VCD。
不同点,
? DVD光道之间的间距由原来的 1.6μm缩小到 0.74μm,而记录
信息的最小凹坑凸区长度由原来的 0.83μm缩小到 0.4μm,这
是 DVD盘存储容量提高到 4.7GB的主要原因 。
? DVD信号的调制方式和错误校正方法也做了相应的修正以适
合高密度的需要, 它采用效率较高的 8比特到 16比特 +(EFM
PLUS)调制方式, DVD校验系统采用更可靠的 RS-PC(Reed
Solomon Product Code)。
? DVD播放机也采用波长更短 (由 780nm减小至 635/650nm)的激
光源来提高聚焦激光束的精度 。
3.2 多媒体功能卡
? 包括视频信号捕捉、压缩、处理、播放的视频
卡,音频卡,VGA与 TV的转换卡,图形加速卡,
光盘接口卡等。
? 通过这些功能卡将计算机与各种外部设备相连,
构成一个制作和播出多媒体系统的工作环境。
? 具有代表性的多媒体功能卡,声音卡, 视频卡
3.2.1 声音卡
? 声音卡或音频卡是处理音频信号的计算机插件,
它是普通计算机向 MPC升级一种重要部件。目
前作为微机必备功能集成在主板上,
? MPC所用声音卡由专用 DSP芯片管理声音的输
入输出和 MIDI操作。音频数据是 8位或 16位的
PCM数据或压缩格式 ADPCM数据。
? 声霸卡 (Sound Blaster,SB)及其特点,
(1) 立体声或单声道声音采样 (ADC)和重放 (DAC);
(2) 采样速率从 4KHz到 44KHz程序可调;
(3) 功能强大的 FM音乐合成芯片 (128种音色 );
(4) MIDI接口和游戏杆端口;
(5) CD-ROM驱动器及接口;
(6) 可选择多种声源 (麦克风, CD唱机, 线路输入 );
(7)内带的混声器芯片可以控制各种数字与模拟音量;
(8)音箱输出接口有功放功能 。
? 随 SB系列卡还带有丰富的软件,主要是,
(1)声音编辑, 录制, 播放, 修改声音;
(2)文本到声音转换 (TTS);
(3)语音识别, 利用 Voice Assist支持用语音控制计算机执行
Windows命令;
(4)调频电子琴, 将计算机变成一台功能齐全的电子琴;
(5)乐曲文件播放, 支持 MIDI和 CMF两种乐曲文件;
(6)软件开发工具, 供二次开发使用 。
? 音频卡主要由下列部件组成,
MIDI输入 /输出 ;
MIDI合成芯片 ;
带有脉冲编码调制电路的数模转换器 ;
压缩芯片 ;
语音合成器 ;
语音识别电路 ;
音频输出或线输出的输出电路等。
? 其结构如书中图 3.11所示。
图 3.11 音频卡的结构框图
图 3.12 数字化声音的获取与处理流程
3.2.2 视频卡
1,C-Cube公司视频卡
? CL550用了 40多万只晶体管集成了 JPEG压缩编码
所需的 DCT/逆向 DCT单元、量化器、可变长编码
器等单元。
? 压缩率可以通过修改量化表和 VLC表的内容来改
变。当执行 JPEG的有损压缩算法时,可按不同的
图像质量、存储器容量、带宽等应用环境来设置
不同的压缩比。
? 压缩比可以从 8,1到 100,1之间任意选择。
? CL550专用芯片上还提供有数字视频接口和直接
与系统总线相连的接口,视频接口支持 8位灰度、
RGB,CMYK及 YUV数字信号的输入和输出。
图 3.13 CL550框图
视频
接口
余弦变
换 /反余
弦变换
量化器
压缩 /
解压缩
Huffman
编码
主机
接口
量化表 解码表
块存储 FIFO 128*13
/
/ / /
/ 控制
地址
数据
11
16 32
18 控制
地址 /数据
压缩时的数据流方向
像素总线接口
PBI 主机总线接口 HBI
CL550编码过程
? 图像像素数据经过像素总线接口 (PBI)输入到 CL550处理器。
? 数字化数值在输入到缓冲单元块存储后,以独立分量存储。
? 每个分量的 8× 8像素点阵数据首先由 DCT单元处理, 之后
DCT系数矩阵根据用户编程选择的量化表, 由量化单元进行
量化处理。
? 在 CL550器件内部的量化矩阵存储区中,可同时存储 4个 64
字长的量化系数矩阵,分别适用于不同的彩色分量。
? 量化后的矩阵被 Z形扫描顺序扫描处理,对直流系数 (DC)和
交流系数 AC分别表示,而后再同时对 DC和 AC两部分共同完
成哈夫曼编码查表处理。
? 哈夫曼编码的结果最终作为 JPEG压缩后的数据传送到主机
总线接口 (HBI),成为最终的处理结果。
CL550解码过程
? 图像解码过程与编码过程相反,JPEG标准格式的压
缩数据输入到哈夫曼解码单元解码,又返回 FIFO区
域等待进行下一步处理。
? 游程编码解码单元从 FIFO区域中读出解码后的数据,
生成交流系数 AC值,并进行 Z形扫描生成 8× 8点阵
格式。而生成的 DC值另做处理。
? 然后进行逆量化和逆 DCT,处理的结果输入到输出
缓冲区中,而后像素总线接口取出这里的视频像素
数据, 按照一定的视频同步时序,输出到像素数据
总线,供显示设备使用。
? 利用其内部的 320阶流水线处理结构,将 JPEG算
法每一操作运算都分解安排到流水线每一阶中。
? CL550-30处理器可以工作在 29.41MHz的时钟频
率,这就使得流水线处理可以在每秒内完成 109
次运算,这样的处理速度应用于 JPEG算法时,
每秒可压缩 14.7M图像像素点。
? CL550-10每秒也可压缩 5M图像像素数据,
CL550-35每秒可压缩 17.5M图像像素数据
C-Cube公司基于 CL550推出静态图像压缩板系列产品
? 可运行基本环境包括 80386 (33MHz主频 )CPU,
ISA或 EISA总线结构,VGA显示卡 (8位,16位或 24
位 ),Windows3.10,4MBRAM,50MB以上硬盘。
? 另外,这些产品可支持多种图像文件格式。
? 许多公司围绕 CL-550设计各种图像板以满足多媒
体系统的应用,如多媒体信息系统,图像处理,
扫描仪,数字摄象机,电视电话,彩色传真等
CL450
C-Cube公司推出 CL450系列产品及 CL680解码器就
是其中较好的产品。
? CL450包括 RISC处理器,Huffman解码器、
DRAM控制器、视频显示控制器等单元,三条总
线是主机总线,DRAM总线、像素总线。
? CL450完全遵从 MPEG标准,能实现 RGB和 YUV
格式的相互转换,支持 NTSC和 PAL制式,能完
成 SIF分辨率 (352× 240,30Hz或 352× 288,25Hz)
的实时解码,并支持视频和音频的同步,可全部
或部分显示解码后图像。
图 3.14 CL450解码器框图
主机接口
编码数据
FIFO栈
HUFFMAN
解码单元
CPU
DRAM控制器
位流缓冲器
帧缓冲器
主机接口
视频接口
数据
控制
数据 地址 控制
数据
控制 控制 地址
视频显示控
制器
DRAM接口
? CL450通过执行宏码完成高层次功能 。 宏码由
C-Cube和硬件提供, 并且把它作为产品一部分 。
在 CL450完全操作之前, 宏码必须由软件装入
CL-450中, C-Cube公司提供的源码供用户在其
目标系统中修改和编译 。
? 应用程序可以两种方式操作 CL450,它们是寄
存器操作方式和宏命令操作方式。 CL450产品
主要面向低成本应用,例如 CD-I系统、视频游
戏、交互式多媒体系统、交互式电视 等。
2,视频采集卡
? 视频采集卡将视频信号连续转换为计算机存储的数
字视频数据, 其典型产品如 Creative公司的视霸卡,
它是具有良好性能的视频处理卡 。
? 其工作原理如下,视频信号源, 摄像机, 录像机
或激光视盘的信号首先经 A/D变换, 通过多制式数
字解码器得到 YUV数据, 然后由视频窗口控制器
对其进行剪裁, 改变比例后存入帧存储器 。 帧存储
器的内容在窗口控制器的控制下, 与 VGA同步信
号或视频编码器的同步信号同步, 再送到 D/A变换
器变成模拟 RGB信号, 同时送到数字式视频编码器
进行视频编码, 最后输出到 VGA监视器及电视或
录像机 。
图 3.15 视频采集卡结构框图
图 3.16 窗口控制器的逻辑框图
? (1) A/D变换和数字解码 ;
? (2) 窗口控制器 ;
? (3) 帧存储器系统;
? (4) 数模变换和距阵变换;
? (5) 视频信号和 VGA信号的叠加 ;
? (6) 数字式多制式视频信号编码部分 。
3.3 多媒体信息获取与显示设备
? 多媒体计算机必须配置必要的外部设备来
完成多媒体信息获取和显示的功能
? 常见有鼠标、光笔、扫描仪、摄像机、触
摸屏、彩色显示器、打印机等设备。
3.3.1 图像获取设备
? 数字化图像获取设备常见的有扫描仪, 数
字照相机等静态图像获取设备和摄像机等
视频图像获取设备。
1,图像数字化
? 自然景物成象后的图像信息以照片或视频记录
介质的形式保存, 这些图像须数字化成计算机
能处理的数字化信息, 才能被多媒体计算机处
理 。
? 对于照片和视频图像来说, 不管是从图像信息
的空间分布和亮度 (颜色 )分布都是连续的, 这
些连续的信息量必须离散化, 离散化的过程即
数字化处理过程, 它应该包括空间位置的离散
和亮度电平的离散化 。
? 步骤,采样,量化,模数变换。
空间采样
? 一幅图像在二维方向上分成 M× N个网格,
每个网格用一个亮度值来表示该区域亮度,
这样一幅图像就离散化为 M× N个亮度值
来表示。这个过程称为图像的采样,其中
M× N称为采样的分辨率,网格的亮度值
即为采样值。
图 3.17 图像的采样
…
N
M
空间采样的分类
? 一维采样用扫描方式 (如传真, 扫描仪等 )把二维
图像转化为一维随时间变化的信号 。 这样得到的
一维行扫描信号经采样实现图像数字化 。
? 二维采样是目前发展的固体摄象器件采用的通用
方法,它把光电转换和采样功能结合起来。固体
摄象器件由 M× N个光敏元件构成,每个光敏元
件对应一个采样点,M× N个光敏元件构成 M× N
个采样点。
量化
? 所谓量化就是把连续的亮度值分为 K个区间, 每个
区间上对应着一个亮度 I。 落于区间 i中的任何亮度
值都以亮度值 Ii表示, 共有 K个不同亮度值 。
? 按照量化区间划分方法,量化可分为均匀量化和
非均匀量化。
区间 1 2 … K
亮度 I1 I2 IK
表 3.3 区间与亮度对应关系
模数变换
? 实现量化的过程称为模数变换, 这个过程一般
采用 PCM量化器来实现, PCM量化是均匀量化 。
? 非均匀量化一方面可利用 PCM量化的结果, 根
据信号特性处理为非均匀量化的数据;另一方
面也可以利用专门的非均匀量化器来实现 。
? 另外,还要考虑图像数据采样过程中产生的失
真和噪声,包括叠加噪声,孔径效应及插入噪
声等。
2.图像扫描仪
? 20世纪 80年代中期出现的光机电一体化高科技产品 。
? 基本原理是将反映图像特征的光信号转换成计算机
可接受的电信号 。
? 工作过程 – CCD,光电转换。
? 图像扫描仪是最常用的静态图像输入设备。
? 它往往配置大量的管理和控制扫描过程软件及文字
识别、排版、图文数据库等软件,使扫描仪提供很
强图文信息获取能力。
? 扫描仪还提供设置扫描区域、分辨率、亮度、图像
深度等参数,扫描后图像还可进一步处理。
图像扫描仪的种类,
? 平板式
? 手持式
? 滚动式
3.电视摄像机
? 电视摄象机由摄象镜头管, 同步信号发生电路,
偏转电路, 放大电路, 电源等部分组成 。
? 来自被摄物体的光通过光学系统在摄象管的靶
上形成光学图像, 这个光学图像经摄象管转换
成电信号, 以视频信号方式输出被摄图像 。
? 彩色图像摄取重要的是分离出三基色信号, 利
用滤色片, 分色镜或棱镜等把光分解成三基色 。
? 最新产品不用电子管作光电转换, 用电荷耦合
器件 CCD等固态摄象器件, 这种器件具有体积
小, 重量轻, 省电, 寿命长, 可靠性高等优点 。
3.3.2 显示设备
? 多媒体计算机系统中信息显示 的设备主要有 PC机
的显示系统。包括两部分:显示器,显示适配器 。
? 显示适配器由寄存器, 视频存储器和控制电路三
部分组成, 其中视频存储器包括显示帧缓存 RAM
和存放 BIOS的 ROM。 显示适配器可以是一块插入
PC总线的扩展卡或集成在主板上 。
? 显示器与显示适配器相配。主要有两 类,即多同
步显示器和平面直角显示器
? 从扫描频率角度来分,显示器主要有固定扫描频
率与可变扫描频率两种。
3.3.3 触摸屏
? 触摸屏最早出现于 20 世纪 70年代,90年代随着多媒体应用
得到成熟和推广。
? 触摸屏包括 3个部分,传感器; 控制部件; 驱动程序。
? 触摸屏的分类 (按工作原理 ),
红外线触摸屏
电阻式触摸屏
电容式触摸屏
表面声波技术
底座式矢量压力测力触摸屏
等。
1.触摸屏技术
( 1)红外线触摸屏
? 工作原理
? 红外触摸屏有内置式和外挂式两种
( 2)电阻式触摸屏
? 电阻式触摸屏感应器是一块覆盖电阻性栅格的玻璃,
再在上面蒙上一层涂有导电涂层并有特殊模压凸缘的
聚脂薄膜 。
? 凸缘避免其表面的涂层与玻璃的涂层接触 。 控制器向
玻璃 4角加有稳定的 5伏电压, 并读取导电层的电压值 。
? 当屏幕被触摸时, 压力使聚脂薄膜凹陷而碰到玻璃,
导电层接触 。 控制器向玻璃的两个邻角加电压, 并把
对面两个角接地, 于是电阻栅格使玻璃片上形成从矩
形的一边到另一边线性变化的电压阶梯, 控制器从两
个方向测出触摸点的电压值, 从而计算出触摸的精确
位置 。
( 3)电容式触摸屏
? 这种触摸屏由模拟感应器和智能双向控制器组成 。
? 感应器是块透明的玻璃, 表面有导电涂层, 其上覆盖
一层保护性玻璃外层 。
? 它工作时在感应器边缘的电极产生分布的电压场, 用
手指或其他导电体触摸 导电涂层时, 电容改变, 电压
场变化, 控制器检测这些变化, 从而确定触摸的位置 。
控制器把数字化的位置数据传到主机, 以实现人机的
交互 。
? 电容式触摸屏的感应器安装在监视器内部,外部与普
通监视器一样,可靠性较高。
( 4)表面声波触摸屏
? 表面声波是应变能仅集中在物体表面传播的弹性波 。
? SAW触摸屏在一片玻璃的每个角上装有两个发射器和
两个接收器,一系列的声波反射器被嵌进玻璃中,沿
着两面从顶至底穿过玻璃。发射器朝一个方向发射
5MHz的短脉冲。当脉冲离开一角后,就会不断地被
每个反射器反射回来一部分声波。
? 当触摸玻璃的某点就阻碍了脉冲能量通过那点反射到
达接收机,于是从接收的脉冲信号中就见到一段缺口。
脉冲起点至下跌点间的时间长度就确定了触摸点的坐
标。控制器通过互换两对发射器和接收器,就可测出
触摸在 X及 Y方向的坐标。
( 5)矢量压力测力触摸屏
? 这种触摸屏的原理是在 CRT外面盖上一块四角
装有应力计的平板玻璃。
? 当玻璃受到压力时,应力计就会出现电压或电
阻等电气特性的变化。压力越重,变化值就越
大。每个角记录这些变化。
? 控制器读取每个角的记录值,并计算触压位置。
这种触摸屏分辨率较低 。
2.触摸屏的支持软件
? DOS设备驱动程序
? 仿真程序 -MOUSE仿真
? 软件辅助开发工具
图 3.18 触摸屏的支持软件
3.4 多媒体个人计算机
? 所谓多媒体个人机 ( MPC)就是具有多媒体处
理功能的个人计算机。
? MPC配置特点,
(1) 一个功能强大, 速度快的 CPU;
(2) 大容量的存储器空间;
(3) 高分辨率显示接口与设备;
(4) 可处理音响的接口与设备;
(5) 可处理图像的接口与设备;
(6) 可存放大量数据的配置等 。
? MPC配置 (扩充 )
(1) 光盘驱动器
(2) 音频卡
(3) 视频卡
(4) 扫描卡
(5) 打印机接口
(6) 交互控制接口
(7) 网络接口
(8) 图形加速卡
其他多媒体计算机
? Macintosh多媒体计算机
? Amiga多媒体 个人计算机
3.5 CD-I交互式多媒体系统
? CD-I系统是家用交互式多媒体系统,它是 Philips
公司和 Sony公司于 1986年 4月联合推出的一种电视
计算机或称 Smart TV系统。
? 该系统把各种多媒体信息存放在容量为 650MB的
只读光盘上,用户可通过 CD-I系统读取光盘的内
容来进行演播,光盘的数据使用 CD-I格式存放。
? CD-I的正式商品于 1991年面市,用户可以交互式
地把家用电视机和计算机相连,通过鼠标器、操
纵杆、遥控器等装置选择人们感兴趣的视听节目
进行播放,是一种较好多媒体 系统产品 。
1,CD-I基本 系统结构
CD-I基本系统主要有 5部分构成,
(1) 音频处理子系统
(2) 视频处理子系统
(3) 多任务的操作系统
(4) CD播放机
(5) 微处理器、存储器、键盘、定位装置和 CSD字体模块
图 3.19 CD-I基本系统结构
音频处理
子系统
视频处理
子系统
存取
控制器
RAM 定位
装置
键盘
选件
ROM
CD-RTOS
CSD字体
CD-DA
控制器
CD-I
接口 MPU
DMA
控制器
NVRAM 时钟日历
CD播放机
RGB视频信号 左通道 右通道
数据 控制信号 数据和控制
BUS
2,CD-I音频子系统
? CD-I基本系统有 4种标准音质的运行方式和一
种非实时的语音音质运行方式。
? CD-I除继承 CD-DA超级高保真音质运行方式外,
还有 A,B,C三个音质等级的运行方式。 A级
相当于 Laser Vision音质,B级相当于 FM调频广
播的音质,C级相当于 AM调幅广播的音质。这
4种音质的语音为实时的语音。
表 3.4 CD-I音频方式
级别 采样率
(KHZ)
位数 /
样本
频率响
应 (KHZ)
数据率
(B/s)
通道
数
数据流
百分数
播放时
间 (小时 )
CD-DA PCM
超级 HiFi
44.1 16 20 17110
0
1立体
声
100% 1
CD-I
ADPCM
A
(LV)
37.8 8 17 85100 2立体
声
50% 2
42500 4单通
道
25% 4
B
(FM)
37.8 4 17 42500 4立体
声
25% 4
21300 8单通
道
12.5% 8
C
(AM)
18.9 4 8.5 21300 8立体
声
12.5% 8
10600 16单
通道
6.25% 16
? 非实时语音音质是文本到语音编码转换而成的。
? CD-I有两种接口用来辅助编码这种音频信息,它
们是上层接口和下层接口。上层接口是处理器默
认的字符集,下层接口是对 8位 PCM数据进行实
时解码。这两种接口之间转换由微处理器控制。
? 声音数据的解码和控制是由 CD-I音频处理器来完
成的。
? CD-I音频处理器的组成
(1) 解码器 ADPCM。
(2) 音频处理单元 。
(3) 特技处理器及声音输出 。
(4) CD-I接口单元 。
(5) 音频信号存储器 。
(6) 控制器 。
图 3.20 音频处理器子系统
3,CD-I视频子系统
? CD-I视频处理子系统的功能是把 CD-I光盘上
的数字化视频信号通过存储和控制进行实时
解码、颜色切换、重叠控制,经过混合处理
而产生 RGB信号输出。
图 3.21 CD-I视频处理子系统
系
统
总
线
存储体 0
(RAM)
存取控制器
存储体 1
(RAM)
实时解
码器 0
实时解
码器 1
颜色
切换
重叠
控制
平
面
重
叠
像
素
保
存
混
合
器
图像影响因素
背景外部视频 DYUV
CLUT
RL
DYUV
CLUT
RL
RGB
RGB
RGB
RGB
平面 A
平面 B
模拟
视频压缩与解码原理
(1) 一维的 DYUV编码 自然图像
图 3.22 DYUV图像编码
(2) RGB5,5,5编码 高质量图形
图 3.23 RGB5,5,5编码
DU
4位
DY1
4位
DU
4位
DY2
4位
T
1位
Red
5位
Green
高 2位 低 3位
Blue
5位
(3) CLUT编码 动画
8位 CLUT
地址
0 7位 CLUT
地址
4位 CLUT
地址
4位 CLUT
地址
图 3.24 7位 CLUT地址
(4) 一维行程编码 动画
0
1位
3位 CLUT
地址
0 3位 CLUT
1位 地址
行程长度 (8位 )
0
1位
3位 CLUT
地址
1
1位
3位 CLUT
地址
图 3.25 RL图像编码
0
1位
7位 CLUT地址
0
1位
7位 CLUT地址 行程长度 (8位 )
RL7
RL3
? CD-I图像是由 4个图像平面合成的。平面 1是一个
16× 16像素的彩色游标平面,平面 2和平面 3是全屏
幕图像平面,平面 4是背景平面。在软件控制下,这
些平面上的图可以按各种要求叠加生成一幅画面显
示。
观
看
方
向
背景平面
全屏幕图像平面
游标平面
1
2
3
4
图 3.26 CD-I的图像平面
多媒体 系统 结构
多媒体硬件
多媒体驱动程序
多媒体系统软件
多媒体应用软件
多媒体驱动程序接口
多媒体开发与创作工具
CD-RTOS特点
CD-I有自己专用的实时操作系统 CD-RTOS,它
源于高性能的 OS-9实时操作系统,是用 68000
汇编语言写成的。
? CD-RTOS是多任务实时操作系统 。
? CD-RTOS的结构是模块化结构 。
? CD-RTOS有设备独立的 I/O接口 。
? CD-RTOS能够处理多级树形结构的目录 。
? CD-RTOS是中断驱动的系统。
CD-RTOS的构成
(1) CD-RTOS内核
(2) 系统相关库
(3) 接口和管理程序
(4) 设备驱动程序
(5) 系统状态描述符 CSD
(6) 文件保护模块 FPM
(7) 初始化和系统启动过程
图 3.27 CD-RTOS的结构框图
初始化
CSD
FPM
应用相关库
系统运行
时钟
应用相关库
应用程序
UCM PFM CD FM NRF
键盘
驱动
定位
驱动
音频
驱动
视频
驱动
CD
驱动
CD-RTOS
内核
3.6 DVI多媒体计算机系统
3.6.1 概述
? DVI技术最早是由美国 David Sanaoff研究中心研究
开发的交互式数字视频装置,这项技术研究成功
后被 GE公司购买,后又被 Intel买到手。
? Intel和 IBM公司联合开发,于 1989年在美国计算
机博览会推出第 1代产品 Action Media750
? 1991年推出第 2代产品 Action MediaⅡ, 在 Comdex
一举获得了最佳多媒体产品奖和最佳展示奖。
Intel公司已将成功的 DVI多媒体系统做到一个母板
上,并要把 DVI技术集成在一个芯片上。
? DVI多媒体计算机系统特点,
(1) 提供一种全数字化的方法。
(2) 先进的视频压缩技术 。
(3) 声音压缩技术。
(4) 合成图形 。
3.6.2 DVI系统结构及其工作原理
1,DVI系统结构
? 第一代 DVI系统 (DVIⅠ )由 3块插板组成,DVI视频
板,DVI音频板及 DVI多功能板。
? 1991年推出的改进的 DVI系统 (DVIⅡ )将上述 3块板
集成在一个板上,视频、音频的获取部分也都装在
上面,仅占一个 IBM PC标准插槽,为用户提供了方
便。
? Intel将系统外围逻辑电路集成为 3个门阵列电路即
82750H主机接口门阵列,82750LV VRAM/SCSI/
Capture门阵列,82750LA音频子系统接口门阵列。
? 其他设备包括 1~16MBVRAM视频处理器、音
频信号处理器,D/A转换器及模拟滤波器和
DVI总线。
? DVIⅠ 的核心部件是视频像素处理器 82750PA
和视频显示处理器 82750DA,DVIⅡ 将这两个
芯片升级为 82750PB和 82750DB,使运算速度
提高了一倍。
图 3.28 DVI II型系统结构原理图
2.视频处理子系统
? DVIⅠ 型中, 82750PA像素处理速度为 12.5MIPS,它采用微
码编程, 可以高速执行像素处理的多种算法 。 82750DA是显
示处理器, 它和 82750PA并行工作 。 当视频像素处理器绘制
和管理视频 RAM中的位映射图时, 显示处理器就把这个结果
显示在视频屏幕上 。
? DVIⅡ 型中,视频子系统的关键芯片由 82750PB和 82750DB
分别取代 82750PA和 82750DA。 82750PB是具有较宽指令字
长 (48位 )的快速微码处理器,在 25 MHz主频下,运行速度达
25MIPS。 由于指令字长,且不同字段分别可以实现不同的控
制和操作,提高了并行操作的功能,因此像素处理器的操作
速度达 100 MIPS。 高速和微操作像素处理器特别适合图像处
理和各种运算。
3.音频处理子系统
? 在 DVIⅠ 型系统中,音频处理子系统是以 TI公
司的 TMS-320C10数字信号处理器 (DSP)做为专
用音响处理器。
? 经过 TMS-320C10音响协处理器输出通道的数
字化音响输出信号,送到两个 14位 D/A转换器
转换为模拟信号,再经过两个可编程带宽滤波
器进行滤波,由左右两个通道输出,可产生较
好的立体声音响效果。
? DVIⅡ 型系统中音频子系统由数字信号处
理器 AD2105来实现,通过它完成音响信
号的压缩和解压缩任务。
? DVI系统中采用了 ADPCM算法把 16位的
采样数据编码成 4位码。 DSP芯片还能控
制音量、采样速率的变化,从 VRAM中
抽取压缩编码数据,将解压缩的音频数
据输出送到 D/A转换器,通过滤波后输出。
4,DVI总线和接口
? 在 DVIⅠ 型系统中, 各子系统通过 PC总线相连, 专
门有一个 DVI多功能板, 它由 3个功能模块组成:
其一是 CD-ROM接口控制器 ; 其二是扩展内存模
块 ; 最后一个是两路操纵杆控制器接口 。
? 在 DVIⅡ 型系统中, 把原 DVIⅠ 型中外围逻辑电路
合并成三个门阵列电路, 分别是 82750LH主机接口
门阵列, 82750LV VRAM/SCSI Capture接口门阵列
和 82750LA音频子系统接口门阵列 。 系统中数据通
信通道是具有多路开关的 32位数据和地址总线, 也
称为, DVI总线, 。
CD-ROM控制器
? 在 DVIⅠ 型系统中, CD-ROM控制器是为 Sony
CDU-100B型 CD-ROM驱动器而设计的, 也适
用于其他兼容产品 。
? DVIⅡ 型系统中, VRAM/SCSI/Capture门阵包
括了一个 SCSI接口, 这个接口可用于支持单个
CD-ROM驱动器, 作为压缩编码视频和音频数
据源 。 DVIⅡ 不需要外部扩展卡就能支持 CD-
ROM驱动器 。
以 DVIⅡ 多媒体硬件系统具有下述特点,
①采用了高速专用视频处理器 i750B,具有实时处
理视频功能;
② DVI总线保证了高速传输;
③外围逻辑集成到 3个门阵列,Action MediaⅡ 体
积缩小;
④外围接口设计方便了用户 。
3.6.3 DVI软件开发环境
? 1989年推出的第一代 DVI系统软件是基于 DOS
环境,采用了层次结构模型,具有模块化特点,
其核心是 AVSS(Audio Video Support System)。
? Intel和 IBM开发第二代 DVI系统中采用基于
Windows的 DVI系统软件,其核心为音频 /视频
内核 AVK(Audio/Video Kernel),AVK能在不同
的操作系统支撑环境下工作,而且为了实时响
应,能够最少地依赖主机 CPU。
1.音频视频子系统 AVSS
? 应用层
? 高层次接口 DVI标准
? 高层次模块低层次接口 DVI标准
? 驱动器接口模块
? 系统 RAM接口模块
? 硬件
图 3.29 DVI I型系统软件层次结构
? 最下层是 DVI系统硬件。
? 硬件之上和硬件直接打交道的软件是驱动程序,
驱动程序模块包括视频驱动程序、音频驱动程
序以及多功能板驱动程序。
? 驱动程序模块层之上是驱动程序接口模块层 。
它 DVI系统中共有 4个驱动程序接口模块,① 微
码接口模块; ② 视频接口模块; ③ 多功能接口
模块; ④ 音响接口模块 。
? 驱动程序接口模块层之上是应用支持层, 它
主要包括两个高层次的软件包即一个图形软
件包 [ Gr], 一个音频视频支持软件 AVSS。
? 最高层是应用层, 它可以提供大量的应用程
序 。 对其支持的 DVI高层接口提供了多媒体
编辑制作工具及创作语言, 方便了应用软件
的开发 。
AVSS概念模型
效果处理单元
演播单元
Bright Cont Color Tint skew
监视器 Hook例程
L
R
图 3.30 超级 VCR模型
AVSS/RTX工作原理
? AVSS概念模型称之为超级 VCR模型 。
? 演播单元就是 AVSS功能的具体体现 。
? 效果处理单元实际上是图形库功能的集合 。
? 钩挂 (Hook)例程是把专用图形添加到视频的特
殊调用工具 。
AVSS数据流
AVSS采用 3个并行的操作来播放数字视频,它们都作
为 RTX的任务,
? 输入任务,它将一帧压缩视频读进内存 ;
? 解码任务,它请求像素处理器对该帧视频进行还原 ;
? 显示任务,它将还原后的视频帧在计算机显示器上
显示。
这些任务必须每秒执行 30次,以保证演播连续流畅。
图 3.31 AVSS的数据流程
输入任务 存储设备 压缩数据 缓冲区
解码任务
解码位图矩阵
显示任务
监视器
AVSS的任务调度 RTX
? RTX的首要任务是为 AVSS提供 CPU资源,使运
动视频播放连续畅通。
? 具体做法是给任务分配特定的优先数,并查明在
其执行循环期间应发出的事件等待时间。
? RTX优先级的范围是从 0~ 15,0为最高优先级,
15为最低优先级。 AVSS输入任务、解码任务、
显示任务的运动优先级分别为 3,4,5。
? RTX调度是周期性地被激活,它基于主计时器中
断,调度任务是,ready”表为其优先顺序导向的。
AVSS/RTX性能评价
? 表明了把电视的真实感与计算机的交互性相结
合是可行的,对以后许多多媒体系统开发影响
很大,系统具有的交互图形效果和音频信号流
的动态混频都超越了 VCR功能限制。
? AVSS/RTX是基于 DOS环境开发的,没有留出
扩展接口,可移植性和可扩充性很差,RTX的
任务调度依靠主机 CPU。 因此 RTX调度技术需
改进。上述问题在第二代 DVI系统软件都得到
了合理的解决。
2,基于窗口系统环境的 AVK
? AVK的概念模型,
多媒体系统软件的核心是 AVK,其概念模型是
“数字视频制作演播器”。
? 数字式制作演播器主要的组成部分是:模拟设
备接口,显示管理器,采样器,效果处理器以
及音频 /视频混合器等 。
图 3.32 多媒体数字式制作演播器
模拟量 I/O接口 主文件接口 应用程序
模拟接口 采样器 数据流管理区
显示
管理器 音频 /视频混合器
效果
处理器
视频 音频 文件 程序控制
和通告
物理
通道
逻辑
通道
数字式制作演播室
? DVIⅡ 系统概念模型是, 数字视频制作演播器, 。
这种模型要求多媒体技术模拟现代电视制作演
播室,由特定硬件完成各项功能,并使应用开
发者具有同实际演播室一样的创作自由度。
? 一个典型的制作演播器应包括混合器,磁带,
监视系统,特技处理器以及为了记录、修改和
播放视频和音频信息联在一起的其他设备。
? 数字式制作演播器主要组成部分,
(1) 模拟接口
(2) 显示系统
(3) 采样器
(4) 数据流控制器
(5) 效果处理器
(6) 混合器
图 3.33 AVK系统的结构
应用程序接口 API
AVL
音频 / 视频库
AVD
音频 /视频驱动器
DVI硬件
微码引擎
AVK
AVK的数据流
? AVK对数据流处理有两方面优点:一方面是从
解压缩位映射阵列分离显示的位映射允许插入
拷贝和改变比例尺的操作,它也允许改变窗口
的视频效果。另一方面由于 DVI硬件具有更多
的功能,多个视频窗口能够同时显示在屏幕上 。
? 当对于相同的显示位映射数据执行拷贝和变换
比例尺操作时,为每个视频数据流定位压缩编
码数据缓冲区和解压缩阵列数据。而 AVSS结
构是使用单个位映射阵列用于解压缩和显示。
图 3.34 AVK数据流程图
存储设备
压缩解码数据缓冲器
输入
任务
解压缩
任务
显示
任务
拷贝改
变比例
显示位映射
解压缩位映射阵列
监视器
AVK的实时任务调度工作过程
? AVK微码子程序集合执行实时的任务调度,其主要
组成部分是调度器 (DoMotion),缓冲区 /数据流处理
任务,命令表处理任务及周期处理任务等。
? 当视频数据流正在播放时,DoMotion在主命令表处
理任务和缓冲区 /数据流处理任务之间循环。
? 通过主命令表和设置队列执行微码功能来完成微程
序控制。
? 周期处理任务调用队列集函数,并且用队列集函数
从主机传送命令到主命令表或命令表数据流,这样
就允许主机传送指令到 82750PB像素处理器。 AVK
协处理器用 82750PB,由 DoMotion执行实时任务调
度。
图 3.35 AVK的实时任务调度
DVI图像格式及压缩算法
? 静态图像处理,
静态图像压缩的算法有 JPEG和行程算法 。
? 视频图像压缩,
DVI技术采用两种视频图像压缩算法, 即 PLV
和 RTV算法。
3.7 VCD与 DVD播放系统
? VCD播放系统
? DVD播放系统
3.7.1 VCD播放系统
1,VCD播放机的基本结构
? VCD播放机是基于 MPEG-1标准的交互视频播
放系统,它有两种形式,
(1) 使用 PC机构成的播放系统,它是在 PC机加上 MPEG
解压卡或解压软件升级而成;
(2) VCD播放机加上电视机构成。
? VCD播放机 3个核心部件,
(1) CD驱动器, 或称 CD加载器;
(2) MPEG解码器;
(3) 微控制器 。
图 3.36 典型的 VCD播放机结构
2,VCD播放机的基本功能
(1) 支持 VCD2.0标准的播放控制功能 。
(2) 可把 NTSC制电视转换成 PAL制电视 。
(3)播放不太清洁或者缺陷不大的 VCD盘时不会产生断续图
像, C-Cube称之为 ClearView技术 。
(4) 支持单盘和多盘加载器 。
(5)支持下列 CD盘格式, VCD2.0,VCD1.1,CD-DA,卡拉
OK-CD1.0,CD-I。
(6)支持的播放特性有, 1/2,1/4,1/8和 1/16的播放速度 ; 快
速向前播放 ; 按时间搜索 。
(7)卡拉 OK功能 。
3.7.2 DVD播放系统
? 与 VCD播放系统相差不大 。
? 主要有下列部分组成,
(1) DVD盘读出机构 ;
(2) DVD-DSP;
(3) 数字声音 /视频解码器 MPEG-2;
(4) 微处理器。
图 3.37 DVD播放系统的结构
3.8 多媒体工作站
工作站是市场上一种功能很强的小型计算机系
统一般特点是,
? 采用 UNIX操作系统 ;
? 具有 GUI接口 ;
? 很强的图形图像处理功能 。
相对于传统的工作站一般处理离散的媒体信息,
多媒体工作站设计成为能同时处理离散和连
续媒体信息的工作站系统。
3.8.1 多媒体工作站系统结构
? 主存和具有自主控制器的二级存储器 ;
? 用于实时数据处理通用处理器 ;
? 处理离散媒体信息标准处理器 ;
? 面向图形, 音频和视频媒体的专用处理器 (例
如包含一个 DVI处理器的微码解压算法 );
? 图形和视频适配器;
? 通信适配器 ( 如 ATM主接口 ) 。
图 3.38 SGI工作站体系结构
系统处理器 实时处理器 N
图形处理
(选件)
I/O处理器
实时处理器 1
存储器
磁盘 I/O
网络 I/O
时钟中断 分离的处理器
限时处理
Sync BUS
MP Link BUS
Sync BUS
……
1.总线
? 在多媒体工作站内,除了一条数据总线外数据
将在能够提供时间保证的第二条总线上传送。
? 总线可划分为系统总线和外围总线。系统总线
诸如 ISA,EISA,Microchannel,Q-bus和
VME-bus,仅支持有限的连续数据传输。外围
总线诸如 SCSI,是面向连续媒体的数据传输开
发的。
2.多媒体设备
? 主要的外围设备是必要的输入输出设备。这些
设备大多数是电子消费品,具有低廉的价格。
麦克风,耳机及喇叭,摄象机即为典型的实例。
? 计算机的视频接口必须兼容大多数通用的视频
技术 /标准 。 除了 CRT监视器,越来越多的终端
使用彩色 LCD技术 。
3.主存
? 音频和视频数据在一个数字系统的不同部件间复
制 。 复制操作使用系统软件具备的面向连续媒体
的存储管理功能 。 这种存储管理需要有效的主存,
除了 ROM,PROM,EPROM和部分静态存储元
件, 廉价的动态存储模块尤其需要 。
? 工作站中数据复制由总线控制方法或 CPU执行,
但使用前一个方法并不总是可能的 。 大多数情况
下, 复制操作由 CPU执行 。
4,二级存储器
? 二级存储器及其控制器的主要要求分别是高存储
容量和低访问时间。
? 一方面为了得到高存储容量,为 CD-DA定义了
CLV技术,CLV保证了在一个较长的平均访问时
间内整个光盘数据密度为常数。
? 另一方面,为了保证实时性须降低平均访问时间,
应采用 CAV技术。由于时间要求更重要,具有
CAV系统比具有 CLV系统更适用于多媒体系统。
? 对二级存储器进一步的需求廉价高容量,并且能
将离散的和连续的媒体存储在一起。
5.处理器
? 在一个多媒体工作站中, 必要的工作分布在不
同的处理器, 但这并不意味着所有多媒体工作
站必须是多处理机系统 。 这些处理器面向不同
的任务设计 。
? 将来的多媒体系统由多个通用处理机组成, 每
个处理机将 DSP性能与 CPU性能结合在一起 。
根据应用的要求, 这些单元面向离散或连续媒
体的专用的处理进行配置 。 因此, 这会有可能
提供一种多媒体工作站, 它根据应用的要求定
做处理器 。
6.操作系统
? 在多媒体工作站可能在面向离散数据计算和连
续数据处理区分。这些处理可能运行在独立的
处理器上。
? 提供了一个合适的操作系统,也许仅有一个处
理器也能根据面向离散数据和连续数据处理之
间的要求进行共享。
3.8.2 典型的多媒体工作站
O2工作站
? 工作站系统硬件
? 操作系统与应用软件
本章小结
? 首先介绍了多媒体光盘存储技术,叙述光盘的读
写原理、类型、规格、格式及制作方法。
? 多媒体功能卡是构成多媒体系统的关键部件,本
章以典型的产品为例讨论视频卡、音频卡和专用
多媒体功能芯片的原理和功能。
? 输入输出设备是系统的重要配置,本章也简要介
绍了扫描仪、显示器、触摸屏等设备的工作原理。
? 多媒体计算机系统一般分为 3种类型,MPC,专用
多媒体系统和多媒体工作站,本章后面几节介绍
了它们的代表性系统或产品。
? 多媒体存储技术
? 多媒体功能卡
? 多媒体信息获取与显示设备
? 多媒体个人计算机
? CD-I交互式多媒体系统
? DVI多媒体计算机系统
? VCD与 DVD播放系统
? 多媒体工作站
3.1多媒体存储技术
3.1.1 多媒体信息存储的特点
? 多媒体信息存在和表现的形式
? 正文 包括文字和数据
? 向量图形 图元组成的图形
? 位图图像
? 数字化声音和高保真音响
? 数字化视频
3.1.2 光盘存储原理
? 光存储技术
? 光存储技术的产品化形式是由光盘驱动器
和光盘片组成的光盘驱动系统。
? 驱动器读写头是用半导体激光器和光路系
统组成的光头,记录介质采用磁光材料。
? 光存储技术原理 改变一个存储单元的性质,
使其性质的变化反映出被存储的数据; 识别这
种性质的变化,就可以读出存储数据。
? 光存储单元的性质,例如反射率、反射光极化
方向等均可以改变,它们对应着存储二进制数
据 0(不变 ),1(改变 ),光电检测器能够通过检测
出光强和光极性的变化来识别信息。
? 高能量激光束可以聚焦成约 1微米的光斑,因此
光存储技术比其他存储技术有更高的容量。
光盘系统的特点
? 与硬盘相比,具有可拆卸性; 容量相当; 驱动
器较贵,但盘片便宜; 读写速度慢。
? 与磁带相比,具有容量大、随机存取性强的优
点。
? 激光头与介质无接触,不受环境影响而退磁,
信息保存时间长,可达 30年以上 。
光盘系统技术指标
? 容量 光盘盘片的容量
? 平均存取时间 在光盘上找到需要读写
信息的位置所需时间
? 数据传输率
? 接口标准及格式规范等
存储容量
? 指它所能读写的光盘盘片的容量。
? 光盘容量又分为格式化容量和用户容量,
采用不同的格式和不同驱动器,光盘格式
化后容量不同。
? 一般用户容量比格式化容量要少,因为光
盘还需要存放有关控制、校验等信息。
平均存取时间
? 是在光盘上找到需要读写的信息的位置所
需要的时间。
? 指从计算机向光盘驱动器发出命令,到光
盘驱动器可以接受读写命令为止的时间。
? 一般取光头沿半径移动全程 1/3长度所需要
的时间为平均寻道时间,盘片旋转一周的
一半时间为平均等待时间,两者加上读写
光头稳定时间就是平均存取时间。
数据传输率有多种定义方式 。
? 一种是指从光盘驱动器送出的数据率, 可以
定义为单位时间内光盘的光道上传送的数据
比特数, 这与光盘转速, 存储密度有关 。
? 另一种定义是指控制器与主机间的传输率,
它与接口规范, 控制器内的缓冲器大小有关 。
光盘的分类
? CD-ROM只读光盘
? WORM一次写多次读光盘
? Rewritable可重写光盘
CD-ROM
? 最常用的光盘系统,直径约 12cm,因为它容量
大,约 650MB,价格便宜,市场上颇受用户的
欢迎。
? CD-ROM光盘是由母盘压模制成的,一旦复制
成形,永久不变,用户只能读出信息。
? CD-ROM采用激光调制方式记录信息,将信息
以凹坑和凸区的形式记录在螺旋形光道上。
WORM一次写多次读光盘
? WORM光盘在使用前首先要进行格式化,形成格
式化信息区和逻辑目录区,利用激光照射介质,
使介质变异,利用激光不同的变化,使其产生一
连串排列的“点”,从而完成写的过程。
? 引入文件分配表的概念,在光盘的根目录下面是
用户定义的逻辑目录,逻辑目录对应文件管理区。
? 在逻辑目录建立同时,用户可以根据需要,对其
中重要数据进行加密。
? 一旦写入就不能再更改。
Rewritable可重写光盘
? 可重写光盘或称可擦写光盘是最理想的光盘类
型,也是最有应用前途的光盘类型。它像硬盘
一样可读写,利用浮动磁光头在磁光盘上进行
磁场调制,可进行高速重写磁光记录 。
只读光盘读原理
? 只读光盘上的信息是沿着盘面螺旋形状的
信息轨道以凹坑和凸区的形式记录的。
? 它既可以记录模拟信息 (如 Laser Vision系
统 ),也可以记录数字信号 (如 CD-DA)。
坑深 0.12μm
0.6μm
1.6μm
在螺旋形光道上以凹坑和凸区表示的信息
001000100000100
图 3.1 只读光盘工作原理
在光盘上记录模拟信息
? 模拟信号先进行频率调制 (FM),声音信号加在
经过频率调制的视频信号上,所得到的综合信
号经过双向限幅,再转换成光盘上长度不等的
凹坑和凸区,边缘之间的长度反映了视频信号
频率的高低和声音信号的频率和幅度。
在光盘上写 /读数字信息
? 光道上凹坑或凸区的长度是 0.3微米的整数倍。凹
凸交界的正负跳变沿均代表数字,1”,两个边缘
之间代表数字,0”,,0”的个数是边缘之间长
度决定的。
? 通过光学探测仪器产生光电检测信号,从而读出
,0”、,1”数据。
? 数字信号记录的优点是抗干扰能力强,由于盘片
损坏或变脏而造成的读出错误也容易得到纠正。
EFM编码
? 为了提高读出数据可靠性,减少误读率,存储
数据采用 EFM(Eight to Fourteen Modulation)编
码,即将 1字节的 8位编码为 14位的光轨道位,
并在每 14位之间插入 3位“合并位” 以确保,1”
码间至少有 2个,0”码,但最多有 10个,0”
码。
可重写光盘的擦写原理
? 光盘记录方式可分为两大类,
? 磁光式
? 相变式
磁光式擦写原理
? 当前国际上较流行的是磁光式,该盘普遍采用
玻璃盘基上再加四层膜结构组成,它是以稀
土 —过渡金属非晶体垂直磁化膜作为记录介质
光学膜和保护膜的多层夹心结构。
? 两种磁光写操作方法居里点记录 (稀土 —铁合
金膜介质 )
? 补偿点记录 (稀土 —钴合金膜介质 )
磁光写的过程
? 用激光照射光盘垂直膜面磁化方向上的磁化物质,
并对其垂直磁化。
? 利用磁性物质居里点热磁效应,在某一方向饱和式
磁化,用激光对需要存储信息, 1” 的单元区域加
热,使其温度超过居里点,失去磁性。在盘的另一
面上施加一个外磁场,使被照单元反向磁化,这样
该单元磁化方向与其他未照射单元方向相反,从而
生产一个信息存储状态, 1”,而其他未经照射单
元相当于存储信息, 0” 。
? 信息擦去过程与写过程刚好相反,即恢复原来的磁
化方向。
相变式擦写原理
? 利用记录介质的两个稳态之间的互逆相结构的
变化来实现信息的记录和擦除 。 两种稳态是反
射率高的晶态和反射率低的非晶态 (玻璃态 )。
? 写过程是把记录介质的信息点从晶态转变为非
晶态 。
? 擦过程是写过程的逆过程, 即把激光束照射的
信息点从非晶态恢复到晶态 。
3.1.3 光盘标准
1,光盘发展历史
? 1972年 9月 5日 Philips公司向国际新闻界展示了
长时间播放电视节目的光盘系统,在光盘上
记录的是模拟电视信号 。
? 1978年,SONY生产的影碟机正式投放市场,
光盘的直径为 30厘米,一片双面盘的播放时
间可达 2小时。
? 1979年,Philips公司发表了激光唱机 (compact
disk player)。
光盘的规范和标准
? CD-DA
? CD-ROM
? CD-V(Video)
? 可录 CD
? CD-I
? CD-ROM XA
? Photo-CD
? Video CD
CD-DA
? 1981年制定红皮书, 即 CD-DA (Digital Audio)
激光数字音频光盘的规范 。 这个标准是 CD的
最基本标准 。
CD-ROM
? 1985年制定黄皮书, 经修订, 1988年正式作为
国际标准 ISO9660,1991 年又推出了 ISO
9660Ⅱ 。
CD-V(video)
? 从红皮书发展而来,在影碟机上使用,视频信
息可以输出到电视机。
可录 CD
? 可录 CD(recordable CD)盘的橙皮书标准 。 可录
CD分为两类, 即 CD-MO和 CD-WO。 CD-MO
称为磁光盘, 可重写; CD-WO又称 CD-R,这
种盘一旦用户写入数据就不能抹掉 。
CD-I
? 1987年制定绿皮书规范用于交互式多媒
体 CD-I系统中 。
? 1992年推出第二代 CD-I,可播放交互式
视频图像 。
CD-ROM XA(extended architecture)
? 1988年,Philips,SONY及 Microsoft制定 CD-
ROM扩展结构,1991年又制定 CD-ROM XAⅡ
规范,对应于 ISO9660Ⅱ 。
Photo-CD
? 像片光盘, 1991年 Philips和 KODAK对外发
布 Photo-CD,1992年制定规范 。 用于存放数
字化的静态照片 。
Video CD
? 1993年制定的白皮书规范, 采用 MPEG压缩算法
压缩动态图像 。 它能使 Video CD节目能够在
CD-I,CD-ROM/XA和 Video CD播放机上播放 。
2,CD-ROM的性能指标
(1) 容量 约为 650MB。
(2) 数据传送速率 最初推出为 150KB/S,称为
单速, 后又推出倍速 (300KB/S),四速 (600
KB/S),…, 48X等光驱 。
(3) 存储缓冲器 早期为 64KB,目前常用的为
128 KB或 256KB。
(4) 存取时间 200~ 400ms
(5) 误码率 1/1012~ 1/1016,采用复杂的纠错编
码技术降低了误码率。
(6) 体积光盘驱动器的大小一般为 41mm(H)×
146mm(W)× 206mm(D)
(7) 接口 采用 SCSI接口,IDE接口和 AT总线接口。
接口可以集成在音频板、视频板或主机板上,
也可以是一块单独的板 。
(8) MTBF(mean time between failures) 平均无故
障时间约为 25000小时左右 。
(9) 兼容性 支持 Photo-CD和 CD-ROM XA。
3.光盘的规范及格式
? CD-DA规范及格式
? CD-ROM规范及格式
? CD-I光盘的数据格式
? 激光视盘
CD-DA规范及格式
? CD-DA即激光唱盘,光盘的物理规格为直径
12cm,内径 1.5cm,厚度 0.12cm,重量 14克。这
种光盘常采用常线速 (CLV)伺服方式,逆时针旋
转。
? 其螺旋线光道上等长分段,每段称为一个扇区。
每个扇区都存放定量数据块,并以特定的地址
标记,其单位为“分”、“秒”、“扇区”,
即 1分 =60秒,1秒 =75扇区。
? 光道总长度为 74分,即可存放 74分钟高音质非
压缩的音频信号。
? CD-DA每个扇区的音频数据分为许多称为帧的
单元,每帧共有 33个字节。
? 一帧中每个通道有 6个音频数据, 有左右 2个通
道, 每个通道的样本值是 16位的数据, 共 24个
字节。一帧中有 8个校验字节和 1个“控制与显
示 (C&D)”字节。
? 错误的检测和校正采用的是 CIRC(cross
interleave reed-solomon code)码。
图 3.2 CD-DA帧及扇区格式
C&D
1B
音频数据
12B
校验
4B
音频数据
12B
校验
4B
8位 8位 8位 … 8位
24位 3位 14 3 14 3 14 3 … 14 3
帧 0 帧 1 帧 2 … 帧 97
1扇区
1帧
同步位 合并
位
33字节
EFM调制
588个
通道位
? CD-ROM同样是把光轨道分为等长的扇区,使
用分、秒、扇区的数据编址方法,采用常线速
伺服方式。它与 CD-DA的不同主要在每个扇区
中数据格式的不同。
? CD-ROM光盘有两种格式,Mode1和 Mode2。
Mode1格式
Mode2格式
SYNC
12B
HEADER
4B
USER DATA
2048B
EDC
4B
SPACE
8B
ECC
276B
SYNC
12B
HEADER
4B
USER DATA
2336B
图 3.3 CD-ROM的 Mode1和 Mode2格式
Mode1和 Mode2格式相同之处
? 这两种方式的扇区首部都是 12字节的同步码
(SYNC),其前后为,00H”而中间 10个字节存放
,FFH”数据。紧接着的 4个字节为地址字段,或
称扇区头 (HEADER),它采用分、秒、扇区号的
制式确定地址标号,地址字段中设置了 MODE字
节,指明该扇区是哪种格式
Mode1和 Mode2格式不同之处
? 用户数据量不同。 Model1为 2048个字节,Mode2为
2336个字节。
? 存储数据的类型不同。 Mode1用于存放对错误极为
敏感的数据,如计算机程序等; 而 Mode2用于存放
对错误不太敏感的数据,如声音、图像、图形等。
? Mode2的数据经过 CIRC检验后的误码率为 1/109,
对声音、图像类的数据可以不必做进一步校验;
而要满足计算机数据误码率小于 1/1012的要求,则
应对 Mode1的数据作进一步校验。
Mode1中的容错机制
? 用了 4个字节作为错误检测码 (EDC),采用的
循环冗余校验码 CRC,只能检测是否有错
? 用 276个字节作为错误校正码 (ECC),可以校
正扇区中多个字节错误。
? 通过两级校验,Mode1中数据误码率可以降
到 1/1012。
CD-ROM XA
? 它所定义格式包括与 CD-I格式相同的 FORM1和
FORM2格式,解决了普通 CD-ROM驱动器不能
读 CD-I格式光盘的问题。
? CD-ROM XA的数据格式 (FORM1,FORM2)
SYNC
12B
HEADER
4B
SUBHEADER
8B
USER DATA
2048B
EDC
4 B
ECC
276B
SYNC
12B
HEADER
4B
SUBHEADER
8B
USER DATA
2324B
EDC
4B
图 3.4 CD-ROM XA FORM1和 FORM2格式
? CD-ROM XA在 HEADER后面增加了 8个字节信
息来进一步说明扇区中用户数据,其中存放有数
据类型 (音频、视频、数据等 )格式形式,触发位
(记录开始、文件结束、实时性等 ),数据编码信
息 (ADPCM,CLUT,DYUV等 )。
? 这样 CD-ROM XA驱动器可通过对子头信息的识
别,读出数据区中多种媒体的信息,特别地能正
确读出 CD-I中采用 ADPCM压缩的音频数据。
CD-ROM卷和文件结构
? 卷和文件结构由逻辑块 (512× 2n字节 )和逻辑扇
区 (2048× 2n字节 )、记录、文件、卷、卷集等
多级结构定义。
? 由于 CD-ROM驱动器的平均寻道时间较长,为
了能高速检索 CD-ROM光盘上文件,ISO为 CD-
ROM光盘的文件目录结构规定了路径表
图 3.5 CD-ROM目录 结构和路径表
CD-I光盘的数据格式
? CD-I光盘的数据格式是从 CD-DA和 CD-ROM光
盘格式演变而来的。
? 其扇区格式与 CD-ROM XA相同,它有三个区:
导入区 (Lead-in Area),节目区 (Program Area)和
导出区 (Lead-out Area)。
? CD盘上的信息均采用 EFM记录方式进行记录。
由于光盘原始误码率较高,所以都采用能纠突
发错误的 CIRC码。
? CD-I光盘的导入区 是由若干个空扇区组成的,
这样做的目的是使识别节目区变得容易 。
? CD-I光盘可以有多到 99条光道, 编号为 1~ 99。
? CD-I光盘的导出区 或者是空扇区 (最后一条光
道是 CD-I光道时 )或者是无声的帧 (最后一条光
道是 CD-DA光道 )
图 3.6 CD盘结构
图 3.7 只有 CD-I光道的 CD-I盘结构
导入区 166信息
扇区
盘标记 2250信息
扇区
CD-I数据 导出区
节目区
光道 1
? 含有 CD-DA光道的 CD-I光盘,第一条光道必须是 CD-I光道; 且任一
条 CD-I光盘上的 CD-DA光道必须在 CD-I光道之后。
? 一片 CD-I光盘上的 CD-DA光道可以有一条或多条 CD-DA光道, 但最多
不超过 98条 。 而一条光道的长度可以是 300个扇区 (相当于 4秒 )和
325000个扇区 (相当于最长的超级 HiFi播放 72分钟 )之间的数 。
导入区 166B信
息扇区
盘标记 2250信
息扇区
CD-I数
据
2250信
息扇区
CD-DA 导出区
图 3.8 有 CD-I和 CD-DA光道的 CD-I盘结构
节目区
光道 1 光道 n
CD-DA(n<=99)
? CD-I光盘的导出区或者是空扇区 (最后一条光
道是 CD-I光道时 )或者是无声的帧 (最后一条光
道是 CD-DA光道 )
? CD-I盘上的所有数据都以文件形式存放, 任何
一个文件都可以通过盘上的路径表取出 。
? 每个文件都有文件描述符记录, 存放于文件目
录中 。 文件描述符记录包含有文件名, 文件号,
文件大小, 地址, 拥有者, 属性, 交叉存取因
子, 读取许可权 。
? 文件分为目录文件, 实时文件和标准文件 。
? CD-I的数据以两种专门的数据格式 FORM1和
FORM2记录。如光盘是用 FORM1记录,因为
它有 EDC和 ECC码,CD-I系统利用它们可以获
得误码率小于 1/1013数据。
激光视盘
? 激光视盘也是一种只读光盘, 家用激光视盘又称
为影碟机, 是独立的视频播放设备, 与音响设备
和电视机 (监视器 )相连就可以播放视盘 。
? 计算机可以通过外设接口与视盘播放机相连, 视
盘在多媒体应用形式主要是, 交互式视盘,, 由
计算机控制视盘的播放, 视频帧的寻址和显示 。
? 视盘与前述的几种光盘原理结构一样
? 视盘的型号 大 -12英寸,小 -12CM
? 视盘有两种信息记录格式
常线速 (CLV)
常角速 (CAV)
CLV型视盘
? 扇区长度为常数,以紧凑形式存放信息,每盘
可以存放 60分钟的视频信号。
? 当驱动器从内圈到外圈读盘时,由于内圈和外
圈存放的信息量不同,所以转速也不同。在内
圈可达到每分钟 1800转,在外圈轨道每分钟约
600转。
CAV型视盘
? 以类似于磁盘的方式划分扇区,扇区长度从内圈
到外圈逐渐增加,每盘仅可存放 30分钟视频信号。
? 优点是驱动器读盘时,从内圈到外圈,转速一致,
对 NTSC制式,CAV视盘转速为每分钟 1800转,
对 PAL制式,CAV视盘转速为每分钟 1500转。
? 这种信息存放格式有利于单帧访问、搜索、帧序
列的随机访问等功能,适合于多媒体平台。
Video CD标准
? Video CD标准是目前流行的视频光盘标准,它
描述一个使用 CD格式和 MPEG-1标准的数字电
视播放系统。
? Video CD定义了 MPEG光道的结构,它由
MPEG-Video扇区和 MPEG-Audio扇区组成。光
道上的 Video(电视图像 )和 Audio(声音 )是按
MPEG-1的规定进行编码。
? MPEG-Video扇区和 MPEG-Audio扇区是交错存
放在光道上 。
图 3.9 Video CD结构
… V V V V A V V V V V A V V V V V A V V …
信息包开始码
4B
SCR(系统参
考时钟 )
5B
MUX速率
3B
信息包数据
2312B
信息包开始码
4B
SCR(系统参
考时钟 )
5B
MUX速率
3B
信息包
数据
2292B
00
20B
Video CD光道结构
MPEG Video扇区的一般结构
MPEG Audio扇区的一般结构
4.CD-ROM光盘制作过程
(1) 数据准备
(2) 主盘制作
(3) 复制光盘
图 3.10 CD-ROM光盘制作过程
3.1.4 DVD光盘
? MPEG-2的视频质量是广播级质量,为解决其
MPEG-2数据存储问题,研制了 DVD并于 1995年
完成标准化方案。
? DVD盘片尺寸与 CD相同,容量最高的双层双面
盘可达 17GB。 单面单层 DVD盘能够存储 4.7GB
的数据,存储 133分钟的 MPEG-2视频,其分辨
率与现在电视相同,并配备 Dolby AC-3/MPEG-2
音频质量的声音和不同语言的字幕。
表 3.1 DVD系列标准与 CD系列标准
DVD系列 CD系列
Book A,DVD-ROM CD-ROM
Book B,DVD-Video Video CD
Book C,DVD-Audio CD-Audio
Book D,DVD-Recordable CD-R
Book E,DVD-RAM CD-MO
表 3.2 DVD-Video的规格
数据传输率 可变速率,平均速率为 4.69Mbps,最大速率 10.7Mbps
图像压缩标准 MPEG-2标准
声音标准
NTSC,DolbyAC-3 或 LPCM,可 选 用
MPEG-2 Audio
PAL/SECAM,MPEG MUSICAM 5.1 或
LPCM,可选用 Dolby AC-3
通道数 多达 8个声音通道和 32个字幕通道
? 从外观和尺寸上看, DVD盘和 CD-ROM盘没什么差别, 直
径均为 120mm,厚度为 1.2mm; 新的 DVD播放机能够播放
已有的 CD激光唱片和 VCD。
不同点,
? DVD光道之间的间距由原来的 1.6μm缩小到 0.74μm,而记录
信息的最小凹坑凸区长度由原来的 0.83μm缩小到 0.4μm,这
是 DVD盘存储容量提高到 4.7GB的主要原因 。
? DVD信号的调制方式和错误校正方法也做了相应的修正以适
合高密度的需要, 它采用效率较高的 8比特到 16比特 +(EFM
PLUS)调制方式, DVD校验系统采用更可靠的 RS-PC(Reed
Solomon Product Code)。
? DVD播放机也采用波长更短 (由 780nm减小至 635/650nm)的激
光源来提高聚焦激光束的精度 。
3.2 多媒体功能卡
? 包括视频信号捕捉、压缩、处理、播放的视频
卡,音频卡,VGA与 TV的转换卡,图形加速卡,
光盘接口卡等。
? 通过这些功能卡将计算机与各种外部设备相连,
构成一个制作和播出多媒体系统的工作环境。
? 具有代表性的多媒体功能卡,声音卡, 视频卡
3.2.1 声音卡
? 声音卡或音频卡是处理音频信号的计算机插件,
它是普通计算机向 MPC升级一种重要部件。目
前作为微机必备功能集成在主板上,
? MPC所用声音卡由专用 DSP芯片管理声音的输
入输出和 MIDI操作。音频数据是 8位或 16位的
PCM数据或压缩格式 ADPCM数据。
? 声霸卡 (Sound Blaster,SB)及其特点,
(1) 立体声或单声道声音采样 (ADC)和重放 (DAC);
(2) 采样速率从 4KHz到 44KHz程序可调;
(3) 功能强大的 FM音乐合成芯片 (128种音色 );
(4) MIDI接口和游戏杆端口;
(5) CD-ROM驱动器及接口;
(6) 可选择多种声源 (麦克风, CD唱机, 线路输入 );
(7)内带的混声器芯片可以控制各种数字与模拟音量;
(8)音箱输出接口有功放功能 。
? 随 SB系列卡还带有丰富的软件,主要是,
(1)声音编辑, 录制, 播放, 修改声音;
(2)文本到声音转换 (TTS);
(3)语音识别, 利用 Voice Assist支持用语音控制计算机执行
Windows命令;
(4)调频电子琴, 将计算机变成一台功能齐全的电子琴;
(5)乐曲文件播放, 支持 MIDI和 CMF两种乐曲文件;
(6)软件开发工具, 供二次开发使用 。
? 音频卡主要由下列部件组成,
MIDI输入 /输出 ;
MIDI合成芯片 ;
带有脉冲编码调制电路的数模转换器 ;
压缩芯片 ;
语音合成器 ;
语音识别电路 ;
音频输出或线输出的输出电路等。
? 其结构如书中图 3.11所示。
图 3.11 音频卡的结构框图
图 3.12 数字化声音的获取与处理流程
3.2.2 视频卡
1,C-Cube公司视频卡
? CL550用了 40多万只晶体管集成了 JPEG压缩编码
所需的 DCT/逆向 DCT单元、量化器、可变长编码
器等单元。
? 压缩率可以通过修改量化表和 VLC表的内容来改
变。当执行 JPEG的有损压缩算法时,可按不同的
图像质量、存储器容量、带宽等应用环境来设置
不同的压缩比。
? 压缩比可以从 8,1到 100,1之间任意选择。
? CL550专用芯片上还提供有数字视频接口和直接
与系统总线相连的接口,视频接口支持 8位灰度、
RGB,CMYK及 YUV数字信号的输入和输出。
图 3.13 CL550框图
视频
接口
余弦变
换 /反余
弦变换
量化器
压缩 /
解压缩
Huffman
编码
主机
接口
量化表 解码表
块存储 FIFO 128*13
/
/ / /
/ 控制
地址
数据
11
16 32
18 控制
地址 /数据
压缩时的数据流方向
像素总线接口
PBI 主机总线接口 HBI
CL550编码过程
? 图像像素数据经过像素总线接口 (PBI)输入到 CL550处理器。
? 数字化数值在输入到缓冲单元块存储后,以独立分量存储。
? 每个分量的 8× 8像素点阵数据首先由 DCT单元处理, 之后
DCT系数矩阵根据用户编程选择的量化表, 由量化单元进行
量化处理。
? 在 CL550器件内部的量化矩阵存储区中,可同时存储 4个 64
字长的量化系数矩阵,分别适用于不同的彩色分量。
? 量化后的矩阵被 Z形扫描顺序扫描处理,对直流系数 (DC)和
交流系数 AC分别表示,而后再同时对 DC和 AC两部分共同完
成哈夫曼编码查表处理。
? 哈夫曼编码的结果最终作为 JPEG压缩后的数据传送到主机
总线接口 (HBI),成为最终的处理结果。
CL550解码过程
? 图像解码过程与编码过程相反,JPEG标准格式的压
缩数据输入到哈夫曼解码单元解码,又返回 FIFO区
域等待进行下一步处理。
? 游程编码解码单元从 FIFO区域中读出解码后的数据,
生成交流系数 AC值,并进行 Z形扫描生成 8× 8点阵
格式。而生成的 DC值另做处理。
? 然后进行逆量化和逆 DCT,处理的结果输入到输出
缓冲区中,而后像素总线接口取出这里的视频像素
数据, 按照一定的视频同步时序,输出到像素数据
总线,供显示设备使用。
? 利用其内部的 320阶流水线处理结构,将 JPEG算
法每一操作运算都分解安排到流水线每一阶中。
? CL550-30处理器可以工作在 29.41MHz的时钟频
率,这就使得流水线处理可以在每秒内完成 109
次运算,这样的处理速度应用于 JPEG算法时,
每秒可压缩 14.7M图像像素点。
? CL550-10每秒也可压缩 5M图像像素数据,
CL550-35每秒可压缩 17.5M图像像素数据
C-Cube公司基于 CL550推出静态图像压缩板系列产品
? 可运行基本环境包括 80386 (33MHz主频 )CPU,
ISA或 EISA总线结构,VGA显示卡 (8位,16位或 24
位 ),Windows3.10,4MBRAM,50MB以上硬盘。
? 另外,这些产品可支持多种图像文件格式。
? 许多公司围绕 CL-550设计各种图像板以满足多媒
体系统的应用,如多媒体信息系统,图像处理,
扫描仪,数字摄象机,电视电话,彩色传真等
CL450
C-Cube公司推出 CL450系列产品及 CL680解码器就
是其中较好的产品。
? CL450包括 RISC处理器,Huffman解码器、
DRAM控制器、视频显示控制器等单元,三条总
线是主机总线,DRAM总线、像素总线。
? CL450完全遵从 MPEG标准,能实现 RGB和 YUV
格式的相互转换,支持 NTSC和 PAL制式,能完
成 SIF分辨率 (352× 240,30Hz或 352× 288,25Hz)
的实时解码,并支持视频和音频的同步,可全部
或部分显示解码后图像。
图 3.14 CL450解码器框图
主机接口
编码数据
FIFO栈
HUFFMAN
解码单元
CPU
DRAM控制器
位流缓冲器
帧缓冲器
主机接口
视频接口
数据
控制
数据 地址 控制
数据
控制 控制 地址
视频显示控
制器
DRAM接口
? CL450通过执行宏码完成高层次功能 。 宏码由
C-Cube和硬件提供, 并且把它作为产品一部分 。
在 CL450完全操作之前, 宏码必须由软件装入
CL-450中, C-Cube公司提供的源码供用户在其
目标系统中修改和编译 。
? 应用程序可以两种方式操作 CL450,它们是寄
存器操作方式和宏命令操作方式。 CL450产品
主要面向低成本应用,例如 CD-I系统、视频游
戏、交互式多媒体系统、交互式电视 等。
2,视频采集卡
? 视频采集卡将视频信号连续转换为计算机存储的数
字视频数据, 其典型产品如 Creative公司的视霸卡,
它是具有良好性能的视频处理卡 。
? 其工作原理如下,视频信号源, 摄像机, 录像机
或激光视盘的信号首先经 A/D变换, 通过多制式数
字解码器得到 YUV数据, 然后由视频窗口控制器
对其进行剪裁, 改变比例后存入帧存储器 。 帧存储
器的内容在窗口控制器的控制下, 与 VGA同步信
号或视频编码器的同步信号同步, 再送到 D/A变换
器变成模拟 RGB信号, 同时送到数字式视频编码器
进行视频编码, 最后输出到 VGA监视器及电视或
录像机 。
图 3.15 视频采集卡结构框图
图 3.16 窗口控制器的逻辑框图
? (1) A/D变换和数字解码 ;
? (2) 窗口控制器 ;
? (3) 帧存储器系统;
? (4) 数模变换和距阵变换;
? (5) 视频信号和 VGA信号的叠加 ;
? (6) 数字式多制式视频信号编码部分 。
3.3 多媒体信息获取与显示设备
? 多媒体计算机必须配置必要的外部设备来
完成多媒体信息获取和显示的功能
? 常见有鼠标、光笔、扫描仪、摄像机、触
摸屏、彩色显示器、打印机等设备。
3.3.1 图像获取设备
? 数字化图像获取设备常见的有扫描仪, 数
字照相机等静态图像获取设备和摄像机等
视频图像获取设备。
1,图像数字化
? 自然景物成象后的图像信息以照片或视频记录
介质的形式保存, 这些图像须数字化成计算机
能处理的数字化信息, 才能被多媒体计算机处
理 。
? 对于照片和视频图像来说, 不管是从图像信息
的空间分布和亮度 (颜色 )分布都是连续的, 这
些连续的信息量必须离散化, 离散化的过程即
数字化处理过程, 它应该包括空间位置的离散
和亮度电平的离散化 。
? 步骤,采样,量化,模数变换。
空间采样
? 一幅图像在二维方向上分成 M× N个网格,
每个网格用一个亮度值来表示该区域亮度,
这样一幅图像就离散化为 M× N个亮度值
来表示。这个过程称为图像的采样,其中
M× N称为采样的分辨率,网格的亮度值
即为采样值。
图 3.17 图像的采样
…
N
M
空间采样的分类
? 一维采样用扫描方式 (如传真, 扫描仪等 )把二维
图像转化为一维随时间变化的信号 。 这样得到的
一维行扫描信号经采样实现图像数字化 。
? 二维采样是目前发展的固体摄象器件采用的通用
方法,它把光电转换和采样功能结合起来。固体
摄象器件由 M× N个光敏元件构成,每个光敏元
件对应一个采样点,M× N个光敏元件构成 M× N
个采样点。
量化
? 所谓量化就是把连续的亮度值分为 K个区间, 每个
区间上对应着一个亮度 I。 落于区间 i中的任何亮度
值都以亮度值 Ii表示, 共有 K个不同亮度值 。
? 按照量化区间划分方法,量化可分为均匀量化和
非均匀量化。
区间 1 2 … K
亮度 I1 I2 IK
表 3.3 区间与亮度对应关系
模数变换
? 实现量化的过程称为模数变换, 这个过程一般
采用 PCM量化器来实现, PCM量化是均匀量化 。
? 非均匀量化一方面可利用 PCM量化的结果, 根
据信号特性处理为非均匀量化的数据;另一方
面也可以利用专门的非均匀量化器来实现 。
? 另外,还要考虑图像数据采样过程中产生的失
真和噪声,包括叠加噪声,孔径效应及插入噪
声等。
2.图像扫描仪
? 20世纪 80年代中期出现的光机电一体化高科技产品 。
? 基本原理是将反映图像特征的光信号转换成计算机
可接受的电信号 。
? 工作过程 – CCD,光电转换。
? 图像扫描仪是最常用的静态图像输入设备。
? 它往往配置大量的管理和控制扫描过程软件及文字
识别、排版、图文数据库等软件,使扫描仪提供很
强图文信息获取能力。
? 扫描仪还提供设置扫描区域、分辨率、亮度、图像
深度等参数,扫描后图像还可进一步处理。
图像扫描仪的种类,
? 平板式
? 手持式
? 滚动式
3.电视摄像机
? 电视摄象机由摄象镜头管, 同步信号发生电路,
偏转电路, 放大电路, 电源等部分组成 。
? 来自被摄物体的光通过光学系统在摄象管的靶
上形成光学图像, 这个光学图像经摄象管转换
成电信号, 以视频信号方式输出被摄图像 。
? 彩色图像摄取重要的是分离出三基色信号, 利
用滤色片, 分色镜或棱镜等把光分解成三基色 。
? 最新产品不用电子管作光电转换, 用电荷耦合
器件 CCD等固态摄象器件, 这种器件具有体积
小, 重量轻, 省电, 寿命长, 可靠性高等优点 。
3.3.2 显示设备
? 多媒体计算机系统中信息显示 的设备主要有 PC机
的显示系统。包括两部分:显示器,显示适配器 。
? 显示适配器由寄存器, 视频存储器和控制电路三
部分组成, 其中视频存储器包括显示帧缓存 RAM
和存放 BIOS的 ROM。 显示适配器可以是一块插入
PC总线的扩展卡或集成在主板上 。
? 显示器与显示适配器相配。主要有两 类,即多同
步显示器和平面直角显示器
? 从扫描频率角度来分,显示器主要有固定扫描频
率与可变扫描频率两种。
3.3.3 触摸屏
? 触摸屏最早出现于 20 世纪 70年代,90年代随着多媒体应用
得到成熟和推广。
? 触摸屏包括 3个部分,传感器; 控制部件; 驱动程序。
? 触摸屏的分类 (按工作原理 ),
红外线触摸屏
电阻式触摸屏
电容式触摸屏
表面声波技术
底座式矢量压力测力触摸屏
等。
1.触摸屏技术
( 1)红外线触摸屏
? 工作原理
? 红外触摸屏有内置式和外挂式两种
( 2)电阻式触摸屏
? 电阻式触摸屏感应器是一块覆盖电阻性栅格的玻璃,
再在上面蒙上一层涂有导电涂层并有特殊模压凸缘的
聚脂薄膜 。
? 凸缘避免其表面的涂层与玻璃的涂层接触 。 控制器向
玻璃 4角加有稳定的 5伏电压, 并读取导电层的电压值 。
? 当屏幕被触摸时, 压力使聚脂薄膜凹陷而碰到玻璃,
导电层接触 。 控制器向玻璃的两个邻角加电压, 并把
对面两个角接地, 于是电阻栅格使玻璃片上形成从矩
形的一边到另一边线性变化的电压阶梯, 控制器从两
个方向测出触摸点的电压值, 从而计算出触摸的精确
位置 。
( 3)电容式触摸屏
? 这种触摸屏由模拟感应器和智能双向控制器组成 。
? 感应器是块透明的玻璃, 表面有导电涂层, 其上覆盖
一层保护性玻璃外层 。
? 它工作时在感应器边缘的电极产生分布的电压场, 用
手指或其他导电体触摸 导电涂层时, 电容改变, 电压
场变化, 控制器检测这些变化, 从而确定触摸的位置 。
控制器把数字化的位置数据传到主机, 以实现人机的
交互 。
? 电容式触摸屏的感应器安装在监视器内部,外部与普
通监视器一样,可靠性较高。
( 4)表面声波触摸屏
? 表面声波是应变能仅集中在物体表面传播的弹性波 。
? SAW触摸屏在一片玻璃的每个角上装有两个发射器和
两个接收器,一系列的声波反射器被嵌进玻璃中,沿
着两面从顶至底穿过玻璃。发射器朝一个方向发射
5MHz的短脉冲。当脉冲离开一角后,就会不断地被
每个反射器反射回来一部分声波。
? 当触摸玻璃的某点就阻碍了脉冲能量通过那点反射到
达接收机,于是从接收的脉冲信号中就见到一段缺口。
脉冲起点至下跌点间的时间长度就确定了触摸点的坐
标。控制器通过互换两对发射器和接收器,就可测出
触摸在 X及 Y方向的坐标。
( 5)矢量压力测力触摸屏
? 这种触摸屏的原理是在 CRT外面盖上一块四角
装有应力计的平板玻璃。
? 当玻璃受到压力时,应力计就会出现电压或电
阻等电气特性的变化。压力越重,变化值就越
大。每个角记录这些变化。
? 控制器读取每个角的记录值,并计算触压位置。
这种触摸屏分辨率较低 。
2.触摸屏的支持软件
? DOS设备驱动程序
? 仿真程序 -MOUSE仿真
? 软件辅助开发工具
图 3.18 触摸屏的支持软件
3.4 多媒体个人计算机
? 所谓多媒体个人机 ( MPC)就是具有多媒体处
理功能的个人计算机。
? MPC配置特点,
(1) 一个功能强大, 速度快的 CPU;
(2) 大容量的存储器空间;
(3) 高分辨率显示接口与设备;
(4) 可处理音响的接口与设备;
(5) 可处理图像的接口与设备;
(6) 可存放大量数据的配置等 。
? MPC配置 (扩充 )
(1) 光盘驱动器
(2) 音频卡
(3) 视频卡
(4) 扫描卡
(5) 打印机接口
(6) 交互控制接口
(7) 网络接口
(8) 图形加速卡
其他多媒体计算机
? Macintosh多媒体计算机
? Amiga多媒体 个人计算机
3.5 CD-I交互式多媒体系统
? CD-I系统是家用交互式多媒体系统,它是 Philips
公司和 Sony公司于 1986年 4月联合推出的一种电视
计算机或称 Smart TV系统。
? 该系统把各种多媒体信息存放在容量为 650MB的
只读光盘上,用户可通过 CD-I系统读取光盘的内
容来进行演播,光盘的数据使用 CD-I格式存放。
? CD-I的正式商品于 1991年面市,用户可以交互式
地把家用电视机和计算机相连,通过鼠标器、操
纵杆、遥控器等装置选择人们感兴趣的视听节目
进行播放,是一种较好多媒体 系统产品 。
1,CD-I基本 系统结构
CD-I基本系统主要有 5部分构成,
(1) 音频处理子系统
(2) 视频处理子系统
(3) 多任务的操作系统
(4) CD播放机
(5) 微处理器、存储器、键盘、定位装置和 CSD字体模块
图 3.19 CD-I基本系统结构
音频处理
子系统
视频处理
子系统
存取
控制器
RAM 定位
装置
键盘
选件
ROM
CD-RTOS
CSD字体
CD-DA
控制器
CD-I
接口 MPU
DMA
控制器
NVRAM 时钟日历
CD播放机
RGB视频信号 左通道 右通道
数据 控制信号 数据和控制
BUS
2,CD-I音频子系统
? CD-I基本系统有 4种标准音质的运行方式和一
种非实时的语音音质运行方式。
? CD-I除继承 CD-DA超级高保真音质运行方式外,
还有 A,B,C三个音质等级的运行方式。 A级
相当于 Laser Vision音质,B级相当于 FM调频广
播的音质,C级相当于 AM调幅广播的音质。这
4种音质的语音为实时的语音。
表 3.4 CD-I音频方式
级别 采样率
(KHZ)
位数 /
样本
频率响
应 (KHZ)
数据率
(B/s)
通道
数
数据流
百分数
播放时
间 (小时 )
CD-DA PCM
超级 HiFi
44.1 16 20 17110
0
1立体
声
100% 1
CD-I
ADPCM
A
(LV)
37.8 8 17 85100 2立体
声
50% 2
42500 4单通
道
25% 4
B
(FM)
37.8 4 17 42500 4立体
声
25% 4
21300 8单通
道
12.5% 8
C
(AM)
18.9 4 8.5 21300 8立体
声
12.5% 8
10600 16单
通道
6.25% 16
? 非实时语音音质是文本到语音编码转换而成的。
? CD-I有两种接口用来辅助编码这种音频信息,它
们是上层接口和下层接口。上层接口是处理器默
认的字符集,下层接口是对 8位 PCM数据进行实
时解码。这两种接口之间转换由微处理器控制。
? 声音数据的解码和控制是由 CD-I音频处理器来完
成的。
? CD-I音频处理器的组成
(1) 解码器 ADPCM。
(2) 音频处理单元 。
(3) 特技处理器及声音输出 。
(4) CD-I接口单元 。
(5) 音频信号存储器 。
(6) 控制器 。
图 3.20 音频处理器子系统
3,CD-I视频子系统
? CD-I视频处理子系统的功能是把 CD-I光盘上
的数字化视频信号通过存储和控制进行实时
解码、颜色切换、重叠控制,经过混合处理
而产生 RGB信号输出。
图 3.21 CD-I视频处理子系统
系
统
总
线
存储体 0
(RAM)
存取控制器
存储体 1
(RAM)
实时解
码器 0
实时解
码器 1
颜色
切换
重叠
控制
平
面
重
叠
像
素
保
存
混
合
器
图像影响因素
背景外部视频 DYUV
CLUT
RL
DYUV
CLUT
RL
RGB
RGB
RGB
RGB
平面 A
平面 B
模拟
视频压缩与解码原理
(1) 一维的 DYUV编码 自然图像
图 3.22 DYUV图像编码
(2) RGB5,5,5编码 高质量图形
图 3.23 RGB5,5,5编码
DU
4位
DY1
4位
DU
4位
DY2
4位
T
1位
Red
5位
Green
高 2位 低 3位
Blue
5位
(3) CLUT编码 动画
8位 CLUT
地址
0 7位 CLUT
地址
4位 CLUT
地址
4位 CLUT
地址
图 3.24 7位 CLUT地址
(4) 一维行程编码 动画
0
1位
3位 CLUT
地址
0 3位 CLUT
1位 地址
行程长度 (8位 )
0
1位
3位 CLUT
地址
1
1位
3位 CLUT
地址
图 3.25 RL图像编码
0
1位
7位 CLUT地址
0
1位
7位 CLUT地址 行程长度 (8位 )
RL7
RL3
? CD-I图像是由 4个图像平面合成的。平面 1是一个
16× 16像素的彩色游标平面,平面 2和平面 3是全屏
幕图像平面,平面 4是背景平面。在软件控制下,这
些平面上的图可以按各种要求叠加生成一幅画面显
示。
观
看
方
向
背景平面
全屏幕图像平面
游标平面
1
2
3
4
图 3.26 CD-I的图像平面
多媒体 系统 结构
多媒体硬件
多媒体驱动程序
多媒体系统软件
多媒体应用软件
多媒体驱动程序接口
多媒体开发与创作工具
CD-RTOS特点
CD-I有自己专用的实时操作系统 CD-RTOS,它
源于高性能的 OS-9实时操作系统,是用 68000
汇编语言写成的。
? CD-RTOS是多任务实时操作系统 。
? CD-RTOS的结构是模块化结构 。
? CD-RTOS有设备独立的 I/O接口 。
? CD-RTOS能够处理多级树形结构的目录 。
? CD-RTOS是中断驱动的系统。
CD-RTOS的构成
(1) CD-RTOS内核
(2) 系统相关库
(3) 接口和管理程序
(4) 设备驱动程序
(5) 系统状态描述符 CSD
(6) 文件保护模块 FPM
(7) 初始化和系统启动过程
图 3.27 CD-RTOS的结构框图
初始化
CSD
FPM
应用相关库
系统运行
时钟
应用相关库
应用程序
UCM PFM CD FM NRF
键盘
驱动
定位
驱动
音频
驱动
视频
驱动
CD
驱动
CD-RTOS
内核
3.6 DVI多媒体计算机系统
3.6.1 概述
? DVI技术最早是由美国 David Sanaoff研究中心研究
开发的交互式数字视频装置,这项技术研究成功
后被 GE公司购买,后又被 Intel买到手。
? Intel和 IBM公司联合开发,于 1989年在美国计算
机博览会推出第 1代产品 Action Media750
? 1991年推出第 2代产品 Action MediaⅡ, 在 Comdex
一举获得了最佳多媒体产品奖和最佳展示奖。
Intel公司已将成功的 DVI多媒体系统做到一个母板
上,并要把 DVI技术集成在一个芯片上。
? DVI多媒体计算机系统特点,
(1) 提供一种全数字化的方法。
(2) 先进的视频压缩技术 。
(3) 声音压缩技术。
(4) 合成图形 。
3.6.2 DVI系统结构及其工作原理
1,DVI系统结构
? 第一代 DVI系统 (DVIⅠ )由 3块插板组成,DVI视频
板,DVI音频板及 DVI多功能板。
? 1991年推出的改进的 DVI系统 (DVIⅡ )将上述 3块板
集成在一个板上,视频、音频的获取部分也都装在
上面,仅占一个 IBM PC标准插槽,为用户提供了方
便。
? Intel将系统外围逻辑电路集成为 3个门阵列电路即
82750H主机接口门阵列,82750LV VRAM/SCSI/
Capture门阵列,82750LA音频子系统接口门阵列。
? 其他设备包括 1~16MBVRAM视频处理器、音
频信号处理器,D/A转换器及模拟滤波器和
DVI总线。
? DVIⅠ 的核心部件是视频像素处理器 82750PA
和视频显示处理器 82750DA,DVIⅡ 将这两个
芯片升级为 82750PB和 82750DB,使运算速度
提高了一倍。
图 3.28 DVI II型系统结构原理图
2.视频处理子系统
? DVIⅠ 型中, 82750PA像素处理速度为 12.5MIPS,它采用微
码编程, 可以高速执行像素处理的多种算法 。 82750DA是显
示处理器, 它和 82750PA并行工作 。 当视频像素处理器绘制
和管理视频 RAM中的位映射图时, 显示处理器就把这个结果
显示在视频屏幕上 。
? DVIⅡ 型中,视频子系统的关键芯片由 82750PB和 82750DB
分别取代 82750PA和 82750DA。 82750PB是具有较宽指令字
长 (48位 )的快速微码处理器,在 25 MHz主频下,运行速度达
25MIPS。 由于指令字长,且不同字段分别可以实现不同的控
制和操作,提高了并行操作的功能,因此像素处理器的操作
速度达 100 MIPS。 高速和微操作像素处理器特别适合图像处
理和各种运算。
3.音频处理子系统
? 在 DVIⅠ 型系统中,音频处理子系统是以 TI公
司的 TMS-320C10数字信号处理器 (DSP)做为专
用音响处理器。
? 经过 TMS-320C10音响协处理器输出通道的数
字化音响输出信号,送到两个 14位 D/A转换器
转换为模拟信号,再经过两个可编程带宽滤波
器进行滤波,由左右两个通道输出,可产生较
好的立体声音响效果。
? DVIⅡ 型系统中音频子系统由数字信号处
理器 AD2105来实现,通过它完成音响信
号的压缩和解压缩任务。
? DVI系统中采用了 ADPCM算法把 16位的
采样数据编码成 4位码。 DSP芯片还能控
制音量、采样速率的变化,从 VRAM中
抽取压缩编码数据,将解压缩的音频数
据输出送到 D/A转换器,通过滤波后输出。
4,DVI总线和接口
? 在 DVIⅠ 型系统中, 各子系统通过 PC总线相连, 专
门有一个 DVI多功能板, 它由 3个功能模块组成:
其一是 CD-ROM接口控制器 ; 其二是扩展内存模
块 ; 最后一个是两路操纵杆控制器接口 。
? 在 DVIⅡ 型系统中, 把原 DVIⅠ 型中外围逻辑电路
合并成三个门阵列电路, 分别是 82750LH主机接口
门阵列, 82750LV VRAM/SCSI Capture接口门阵列
和 82750LA音频子系统接口门阵列 。 系统中数据通
信通道是具有多路开关的 32位数据和地址总线, 也
称为, DVI总线, 。
CD-ROM控制器
? 在 DVIⅠ 型系统中, CD-ROM控制器是为 Sony
CDU-100B型 CD-ROM驱动器而设计的, 也适
用于其他兼容产品 。
? DVIⅡ 型系统中, VRAM/SCSI/Capture门阵包
括了一个 SCSI接口, 这个接口可用于支持单个
CD-ROM驱动器, 作为压缩编码视频和音频数
据源 。 DVIⅡ 不需要外部扩展卡就能支持 CD-
ROM驱动器 。
以 DVIⅡ 多媒体硬件系统具有下述特点,
①采用了高速专用视频处理器 i750B,具有实时处
理视频功能;
② DVI总线保证了高速传输;
③外围逻辑集成到 3个门阵列,Action MediaⅡ 体
积缩小;
④外围接口设计方便了用户 。
3.6.3 DVI软件开发环境
? 1989年推出的第一代 DVI系统软件是基于 DOS
环境,采用了层次结构模型,具有模块化特点,
其核心是 AVSS(Audio Video Support System)。
? Intel和 IBM开发第二代 DVI系统中采用基于
Windows的 DVI系统软件,其核心为音频 /视频
内核 AVK(Audio/Video Kernel),AVK能在不同
的操作系统支撑环境下工作,而且为了实时响
应,能够最少地依赖主机 CPU。
1.音频视频子系统 AVSS
? 应用层
? 高层次接口 DVI标准
? 高层次模块低层次接口 DVI标准
? 驱动器接口模块
? 系统 RAM接口模块
? 硬件
图 3.29 DVI I型系统软件层次结构
? 最下层是 DVI系统硬件。
? 硬件之上和硬件直接打交道的软件是驱动程序,
驱动程序模块包括视频驱动程序、音频驱动程
序以及多功能板驱动程序。
? 驱动程序模块层之上是驱动程序接口模块层 。
它 DVI系统中共有 4个驱动程序接口模块,① 微
码接口模块; ② 视频接口模块; ③ 多功能接口
模块; ④ 音响接口模块 。
? 驱动程序接口模块层之上是应用支持层, 它
主要包括两个高层次的软件包即一个图形软
件包 [ Gr], 一个音频视频支持软件 AVSS。
? 最高层是应用层, 它可以提供大量的应用程
序 。 对其支持的 DVI高层接口提供了多媒体
编辑制作工具及创作语言, 方便了应用软件
的开发 。
AVSS概念模型
效果处理单元
演播单元
Bright Cont Color Tint skew
监视器 Hook例程
L
R
图 3.30 超级 VCR模型
AVSS/RTX工作原理
? AVSS概念模型称之为超级 VCR模型 。
? 演播单元就是 AVSS功能的具体体现 。
? 效果处理单元实际上是图形库功能的集合 。
? 钩挂 (Hook)例程是把专用图形添加到视频的特
殊调用工具 。
AVSS数据流
AVSS采用 3个并行的操作来播放数字视频,它们都作
为 RTX的任务,
? 输入任务,它将一帧压缩视频读进内存 ;
? 解码任务,它请求像素处理器对该帧视频进行还原 ;
? 显示任务,它将还原后的视频帧在计算机显示器上
显示。
这些任务必须每秒执行 30次,以保证演播连续流畅。
图 3.31 AVSS的数据流程
输入任务 存储设备 压缩数据 缓冲区
解码任务
解码位图矩阵
显示任务
监视器
AVSS的任务调度 RTX
? RTX的首要任务是为 AVSS提供 CPU资源,使运
动视频播放连续畅通。
? 具体做法是给任务分配特定的优先数,并查明在
其执行循环期间应发出的事件等待时间。
? RTX优先级的范围是从 0~ 15,0为最高优先级,
15为最低优先级。 AVSS输入任务、解码任务、
显示任务的运动优先级分别为 3,4,5。
? RTX调度是周期性地被激活,它基于主计时器中
断,调度任务是,ready”表为其优先顺序导向的。
AVSS/RTX性能评价
? 表明了把电视的真实感与计算机的交互性相结
合是可行的,对以后许多多媒体系统开发影响
很大,系统具有的交互图形效果和音频信号流
的动态混频都超越了 VCR功能限制。
? AVSS/RTX是基于 DOS环境开发的,没有留出
扩展接口,可移植性和可扩充性很差,RTX的
任务调度依靠主机 CPU。 因此 RTX调度技术需
改进。上述问题在第二代 DVI系统软件都得到
了合理的解决。
2,基于窗口系统环境的 AVK
? AVK的概念模型,
多媒体系统软件的核心是 AVK,其概念模型是
“数字视频制作演播器”。
? 数字式制作演播器主要的组成部分是:模拟设
备接口,显示管理器,采样器,效果处理器以
及音频 /视频混合器等 。
图 3.32 多媒体数字式制作演播器
模拟量 I/O接口 主文件接口 应用程序
模拟接口 采样器 数据流管理区
显示
管理器 音频 /视频混合器
效果
处理器
视频 音频 文件 程序控制
和通告
物理
通道
逻辑
通道
数字式制作演播室
? DVIⅡ 系统概念模型是, 数字视频制作演播器, 。
这种模型要求多媒体技术模拟现代电视制作演
播室,由特定硬件完成各项功能,并使应用开
发者具有同实际演播室一样的创作自由度。
? 一个典型的制作演播器应包括混合器,磁带,
监视系统,特技处理器以及为了记录、修改和
播放视频和音频信息联在一起的其他设备。
? 数字式制作演播器主要组成部分,
(1) 模拟接口
(2) 显示系统
(3) 采样器
(4) 数据流控制器
(5) 效果处理器
(6) 混合器
图 3.33 AVK系统的结构
应用程序接口 API
AVL
音频 / 视频库
AVD
音频 /视频驱动器
DVI硬件
微码引擎
AVK
AVK的数据流
? AVK对数据流处理有两方面优点:一方面是从
解压缩位映射阵列分离显示的位映射允许插入
拷贝和改变比例尺的操作,它也允许改变窗口
的视频效果。另一方面由于 DVI硬件具有更多
的功能,多个视频窗口能够同时显示在屏幕上 。
? 当对于相同的显示位映射数据执行拷贝和变换
比例尺操作时,为每个视频数据流定位压缩编
码数据缓冲区和解压缩阵列数据。而 AVSS结
构是使用单个位映射阵列用于解压缩和显示。
图 3.34 AVK数据流程图
存储设备
压缩解码数据缓冲器
输入
任务
解压缩
任务
显示
任务
拷贝改
变比例
显示位映射
解压缩位映射阵列
监视器
AVK的实时任务调度工作过程
? AVK微码子程序集合执行实时的任务调度,其主要
组成部分是调度器 (DoMotion),缓冲区 /数据流处理
任务,命令表处理任务及周期处理任务等。
? 当视频数据流正在播放时,DoMotion在主命令表处
理任务和缓冲区 /数据流处理任务之间循环。
? 通过主命令表和设置队列执行微码功能来完成微程
序控制。
? 周期处理任务调用队列集函数,并且用队列集函数
从主机传送命令到主命令表或命令表数据流,这样
就允许主机传送指令到 82750PB像素处理器。 AVK
协处理器用 82750PB,由 DoMotion执行实时任务调
度。
图 3.35 AVK的实时任务调度
DVI图像格式及压缩算法
? 静态图像处理,
静态图像压缩的算法有 JPEG和行程算法 。
? 视频图像压缩,
DVI技术采用两种视频图像压缩算法, 即 PLV
和 RTV算法。
3.7 VCD与 DVD播放系统
? VCD播放系统
? DVD播放系统
3.7.1 VCD播放系统
1,VCD播放机的基本结构
? VCD播放机是基于 MPEG-1标准的交互视频播
放系统,它有两种形式,
(1) 使用 PC机构成的播放系统,它是在 PC机加上 MPEG
解压卡或解压软件升级而成;
(2) VCD播放机加上电视机构成。
? VCD播放机 3个核心部件,
(1) CD驱动器, 或称 CD加载器;
(2) MPEG解码器;
(3) 微控制器 。
图 3.36 典型的 VCD播放机结构
2,VCD播放机的基本功能
(1) 支持 VCD2.0标准的播放控制功能 。
(2) 可把 NTSC制电视转换成 PAL制电视 。
(3)播放不太清洁或者缺陷不大的 VCD盘时不会产生断续图
像, C-Cube称之为 ClearView技术 。
(4) 支持单盘和多盘加载器 。
(5)支持下列 CD盘格式, VCD2.0,VCD1.1,CD-DA,卡拉
OK-CD1.0,CD-I。
(6)支持的播放特性有, 1/2,1/4,1/8和 1/16的播放速度 ; 快
速向前播放 ; 按时间搜索 。
(7)卡拉 OK功能 。
3.7.2 DVD播放系统
? 与 VCD播放系统相差不大 。
? 主要有下列部分组成,
(1) DVD盘读出机构 ;
(2) DVD-DSP;
(3) 数字声音 /视频解码器 MPEG-2;
(4) 微处理器。
图 3.37 DVD播放系统的结构
3.8 多媒体工作站
工作站是市场上一种功能很强的小型计算机系
统一般特点是,
? 采用 UNIX操作系统 ;
? 具有 GUI接口 ;
? 很强的图形图像处理功能 。
相对于传统的工作站一般处理离散的媒体信息,
多媒体工作站设计成为能同时处理离散和连
续媒体信息的工作站系统。
3.8.1 多媒体工作站系统结构
? 主存和具有自主控制器的二级存储器 ;
? 用于实时数据处理通用处理器 ;
? 处理离散媒体信息标准处理器 ;
? 面向图形, 音频和视频媒体的专用处理器 (例
如包含一个 DVI处理器的微码解压算法 );
? 图形和视频适配器;
? 通信适配器 ( 如 ATM主接口 ) 。
图 3.38 SGI工作站体系结构
系统处理器 实时处理器 N
图形处理
(选件)
I/O处理器
实时处理器 1
存储器
磁盘 I/O
网络 I/O
时钟中断 分离的处理器
限时处理
Sync BUS
MP Link BUS
Sync BUS
……
1.总线
? 在多媒体工作站内,除了一条数据总线外数据
将在能够提供时间保证的第二条总线上传送。
? 总线可划分为系统总线和外围总线。系统总线
诸如 ISA,EISA,Microchannel,Q-bus和
VME-bus,仅支持有限的连续数据传输。外围
总线诸如 SCSI,是面向连续媒体的数据传输开
发的。
2.多媒体设备
? 主要的外围设备是必要的输入输出设备。这些
设备大多数是电子消费品,具有低廉的价格。
麦克风,耳机及喇叭,摄象机即为典型的实例。
? 计算机的视频接口必须兼容大多数通用的视频
技术 /标准 。 除了 CRT监视器,越来越多的终端
使用彩色 LCD技术 。
3.主存
? 音频和视频数据在一个数字系统的不同部件间复
制 。 复制操作使用系统软件具备的面向连续媒体
的存储管理功能 。 这种存储管理需要有效的主存,
除了 ROM,PROM,EPROM和部分静态存储元
件, 廉价的动态存储模块尤其需要 。
? 工作站中数据复制由总线控制方法或 CPU执行,
但使用前一个方法并不总是可能的 。 大多数情况
下, 复制操作由 CPU执行 。
4,二级存储器
? 二级存储器及其控制器的主要要求分别是高存储
容量和低访问时间。
? 一方面为了得到高存储容量,为 CD-DA定义了
CLV技术,CLV保证了在一个较长的平均访问时
间内整个光盘数据密度为常数。
? 另一方面,为了保证实时性须降低平均访问时间,
应采用 CAV技术。由于时间要求更重要,具有
CAV系统比具有 CLV系统更适用于多媒体系统。
? 对二级存储器进一步的需求廉价高容量,并且能
将离散的和连续的媒体存储在一起。
5.处理器
? 在一个多媒体工作站中, 必要的工作分布在不
同的处理器, 但这并不意味着所有多媒体工作
站必须是多处理机系统 。 这些处理器面向不同
的任务设计 。
? 将来的多媒体系统由多个通用处理机组成, 每
个处理机将 DSP性能与 CPU性能结合在一起 。
根据应用的要求, 这些单元面向离散或连续媒
体的专用的处理进行配置 。 因此, 这会有可能
提供一种多媒体工作站, 它根据应用的要求定
做处理器 。
6.操作系统
? 在多媒体工作站可能在面向离散数据计算和连
续数据处理区分。这些处理可能运行在独立的
处理器上。
? 提供了一个合适的操作系统,也许仅有一个处
理器也能根据面向离散数据和连续数据处理之
间的要求进行共享。
3.8.2 典型的多媒体工作站
O2工作站
? 工作站系统硬件
? 操作系统与应用软件
本章小结
? 首先介绍了多媒体光盘存储技术,叙述光盘的读
写原理、类型、规格、格式及制作方法。
? 多媒体功能卡是构成多媒体系统的关键部件,本
章以典型的产品为例讨论视频卡、音频卡和专用
多媒体功能芯片的原理和功能。
? 输入输出设备是系统的重要配置,本章也简要介
绍了扫描仪、显示器、触摸屏等设备的工作原理。
? 多媒体计算机系统一般分为 3种类型,MPC,专用
多媒体系统和多媒体工作站,本章后面几节介绍
了它们的代表性系统或产品。