回顾,编码字符集
1.字符 (character) 记录语言的符号
2.编码字符集 (coded character set)
按某种规则编码的有序集合。两个重要的属性,
? 字汇 (repertoire),编码字符集中有哪些字符
? 编码规则,如何确定每个字符的代码
3.码长, 字符代码的长度。它决定了代码空间的大小
定长码, 7位,8位,双字节,4字节
可变长码,单-双- 4字节码
11月 6日
1.稳定的 西文 字符编码
ASCII 与 ISO2022
2.多变的 汉字 编码
我国汉字编码的国家标准,
GB2312-80
GBK-95
GB18030-2000
全球统一编码系列,
ISO2022
UCS/Unicode(UTF-8)
要点,
?字符集
?编码及码长
?向下兼容
00 FF
00
FF
27484
汉字
GB2312-80
GB18030-2000
GBK
CJK汉字字汇
兼 容
兼容
UCS/Unicode
ISO 646
ISO 2022
兼 容
兼容
映射
00 FF
00
FF
20902
汉字
00 FF
00
FF
6763
汉字
文本 按一定格式组织起来的、具有相关性的字符流。
字符,是文本的细胞,计算机中用二进制表示。
字符集与其编码,计算机信息处理的基础。
文本展现
(阅读器)
文本处理
(文本处理软件) 文本生成
其他
媒体
电子
文本
文本编辑
(编辑器) 格式化的电子文本




计算机对文本的处理流程图
回顾
文本的准备
文本信息的输入,P90
文本的编辑( 使文本内容正确,版面清晰整齐、美观大方 ),
对字, 词, 句, 段落进行添加, 删除, 修改等操作;
字的处理:设置字体, 字号, 字的排列方向, 间距, 颜色, 效果等;
段落的处理:设置行距, 段间距, 段缩进, 对称方式等;
页面布局处理:设置页边距, 每页行列数, 分栏, 页眉, 页脚等 。
自动识别输入
自动文字识别
印刷体识别
手写体识别
文本信息的输入
人工输入
自动文字识别
键盘输入
联机手写输入
语音输入
文本处理 (Text Processing)
对文本中包含的文字信息进行 深层次 的分析、加工和处理。
(例如对字、词、短语、句子、篇章的检查、统计、识别、
转换、压缩、存储、检索、分析、理解和生成等 )
翻译 (Translation)
文摘生成
Summarizing
释义 (Paraphrase)
摘要、关键字
相同含义但
不同的表达
相同含义但
不同的语种
多文档自动综述
Question-Answering
自动分类
提问
回答
综述
文档分类
文本过滤 /文本检索 文档
文本的分类
按是否格式化分,
简单文本 (plain text) / 丰富格式文本 (rich text)
按结构分,
线性文本 / 超文本 (hypertext)
按是否可执行来分,
静态文本 / 动态文本 / 主动文档
A B C D
E F G H
a1
a2
b2 c2
f1
d1
c1
b1
e1
g1
h1
应用举例
实验 12“利用 HTML标记语言制作网页”
文本处理软件
( 1)面向 通信 的文本处理软件,
Outlook Express
( 2) 面向 办公 的文本处理软件,
MS Word,WPS2000
( 3) 面向 印刷出版 的文本处理软件,
, 飞腾, 排版软件,PageMaker,PDF Writer
( 4) 面向 网络信息发布和电子出版的 文本处理软件,
FrontPage,PDF Writer
文本的输出
(阅读、浏览与打印 )
过程,
对文本的格式描述进行解释
生成文字和图表的映像( bitmap)
传送到显示器或打印机输出
两种文本阅读器 /浏览器,
嵌入 在文本编辑 (处理 )软件中,如微软的 Word,
独立 的软件:如 Adobe公司的 Acrobat Reader,
微软公司的 IE等。
输出过程中字形的生成
过程,
1.先根据字符的 字体 确定相应的 字型库 ( Font),
2.再按该字符的代码从字库中取出该字符的 形状描述信息
3.然后按形状描述信息 生成字形,并按照字号大小及有关
属性将字形作必要的变换,
4.最后将得到的字形 放置 在页面的指定 位置 处。
两种不同的字库,
1.点阵描述 (习题 )
2.轮廓描述
汉字编码小结 3





汉字 机内码,
GB2312--80 区位码,机内码
GBK内码
GB18030--2000码






数字多媒体的引言
回顾与猜想 (待解决的问题 )
? 物理量 ---数字化 (A/D)
? 编码 (效率,码长,通用,标准 …,.)
? 量大 (压缩 /解压缩 )
? 信息处理 (深加工 )
? 相关的设备 (完成各种功能 )
(IO设备,高速接口,与 Memory,硬盘,CPU的关系 )
3.3 图象与图形
? 数字图像按其生成方法分为 两 类,
1.通过数字化设备 获取 的图像,
(取样图像、点阵图像、位图图像 )
以下简称 图像 ( Image);
2.计算机 合成 的图像,称为矢量图形,
或简称图形( graphics);
? 两者在外观上很难区分
? 两者有许多不同的属性,一般需
要使用不同的软件进行处理
一、图象的获取过程
? 图象的获取设备:扫描仪,数码相机
取 样 模拟图像 量 化
量 化
量 化




分 色
二、图象的表示与压缩
Black and
white
image
1.图象表示方法与主要参数
①黑白图象的表示
② 灰度图象的表示
Gray scale
image
③ 彩色图象的表示




绿







R
G
B
图象的主要参数,
1.图象大小(分辨率):水平,垂直
2.位平面数目:彩色图象 >=3个,黑白等 1个
3.颜色空间的类型,RGB/CMYK…
3.像素深度,
表示像数各种颜色分量的二进制位数和。
问题,
一幅 1024*768的真彩屏幕,其空间为多少字节?
图象数据的压缩
数据压缩的 必要 性
数据压缩的 可能 性
数据压缩的 两种类型,
无损压缩
有损压缩
压缩编码 方法的评价,
压缩倍数的大小 (与图象质量的关系? )
重建图像的质量(有损压缩时)
压缩算法的复杂程度
实质,
?数据表示的 3原则
?高效?
?专利?
?标准?
图像压缩编码的国际标准
JPEG
JPEG2000/JP2
常用的图像文件
要求,
熟悉常用的图象文件名
了解它们有什么特性和适用的场合
名称 压缩编码方法 性质 典型应用 开发组织 / 公司
B M P R LC 无损 W in d o w s 应用程序 M icr o s o f t
TIF R LC,LZ W 无损 d es k to p p u b lis h in g A ld u s, M icr o s o f t
G I F LZW 无损 I n ter n et C o m p u S er v e
J P EG DCT, H u f f m an 无损 / 有损 I n ter n et,数码相机等 I S O /IE C
J P 2 小波变换,算术编码 无损 / 有损 I n ter n et,数码相机等 I S O /IE C
下面有详细讲解
BMP图像文件
1.微软公司提出, 在 Windows操作系统下使用的一
种标准图像格式,
2.支持单色, 16色, 256色, 真彩色图像,
3.一个文件存放一幅图像, 可以使用 RLC进行无损
压缩, 也可不压缩图像数据,
4.非压缩的 BMP文件是一种通用的图像文件格式,
几乎所有 Windows 应用软件都能支持 。
TIF图像文件
1.是一种工业标准,有许多图像图形应用软件支持
这种文件格式,
2.大量使用于扫描仪和桌面出版,
3.使用 RLC,LZW等方法对图像数据进行无损压缩。
4.支持单色、彩色图像。
GIF 图像
1.颜色数较少(不超过 256色),文件特别小,压缩
比可调,适合网络传输。
2.由于颜色数量受到限制,GIF更适合用来做插图、
剪贴画等,用于色彩数要求不高的场合。
3.GIF图象具有 累进显示 功能。
4.GIF89a格式能够支持 透明背景 ( JPEG不支持) 。
5.目前网页上有大量的静态与 动态 GIF图象 ( 20%)。
6.属 COMPUSERVE公司
GIF图像数据的交叉存储
行号 像 素 交插遍次
0 …………………………………… 1
1 …………………………………… 4
2 …………………………………… 3 3 …………………………………… 4
4 …………………………………… 2 5 …………………………………… 4
6 …………………………………… 3 7 …………………………………… 4
8 …………………………………… 1 9 …………………………………… 4
10 …………………………………… 3 11 …………………………………… 4
12 …………………………………… 2 13 …………………………………… 4
14 …………………………………… 3 15 …………………………………… 4
16 …………………………………… 1 17 …………………………………… 4
18 …………………………………… 3
GIF图像的累进显示
GIF图像的累进显示
GIF支持透明背景
? GIF 图象 中 的 某种色彩, 在浏览器 显示该 图像时被
忽略 而 不被显示出来。
? 效果是 使图像浮 现 在页面上,增强 了网页的 外观 。
?例
ANIMATED GIF
将数张图片存成一个文件,从而形成动画效果
1 打开第 1张图片; 2 插入其他的图片 ;
3调整每张图片显示的时间 ; 4设定重复次数 ; 5 放入网页
奔马图片
小结:图象数据的压缩
数据压缩的 必要 性
数据压缩的 可能 性
数据压缩的 两种类型,
无损压缩
有损压缩
压缩编码 方法的评价,
压缩倍数的大小 (与图象质量的关系? )
重建图像的质量(有损压缩时)
压缩算法的复杂程度
实质,
?数据表示的 3原则
?高效?
?专利?
?标准?
小结:常用的图像文件
要求,
熟悉常用的图象文件名
了解它们有什么特性和适用的场合
名称 压缩编码方法 性质 典型应用 开发组织 / 公司
B M P R LC 无损 W in d o w s 应用程序 M icr o s o f t
TIF R LC,LZ W 无损 d es k to p p u b lis h in g A ld u s, M icr o s o f t
G I F LZW 无损 I n ter n et C o m p u S er v e
J P EG DCT, H u f f m an 无损 / 有损 I n ter n et,数码相机等 I S O /IE C
J P 2 小波变换,算术编码 无损 / 有损 I n ter n et,数码相机等 I S O /IE C
三、数字图象处理
内容,
去噪,增强,复原,提取特征,压缩,存储,检索等
主要目的,
(1) 提高图像的 视感质量 。
(2) 图像复原与重建 。 P105 图 3-14
(3) 图像分析 。 图像的分类, 识别, 理解或解释 。
(4)图像数据的变换、编码和数据压缩,
以便存储和传输。
(5) 图像的管理, 检索, 以及图像内容与知识产权
的保护等 。
数字图像的应用
(1) 图像通信 。 包括图像传输, 电视电话, 电视
会议等 。
(2) 遥感 。
(3) 医疗诊断 。
(4) 工业生产中的应用 。 如产品质量检测, 生产
过程的自动控制等 。
(5) 机器人视觉 。
(6) 军事, 公安, 档案管理等其他方面的应用 。
常用 (通用 )图像编辑软件
微软公司 画图软件 (paint),可查看和编辑处
理,jpg,.gif 或,bmp图像。
微软公司 imaging for windows
Microsoft Photo Editor
Ulead system 的 PhotoImpact
ACD System公司的 ACDSee32
Adobe PhotoShop
四、什么是计算机图形 (graphics)
使用算法或几何要素 (如点、线、面、体的位置、形状和大
小 )及表面材料的性质,在计算机中对景物和形体(无论
是真实的还是假想的)进行描述 (modeling),
需要显示时,计算机根据观察者的位置及光线的设定,生成
该景物的图象。
建模 / 造型
( M o d e li n g )
景物形状的
模型 ( m o d e l)
景物形状的
视图
绘 制
( R e n d e r in g )
( I m a g e S yn th e s is )
形体与景物的建模方法
线











几何造
型技术
过程模
型技术



















合成图像 (graphics)的绘制
从景物的模型生成具有高度真实感的该景物
的图像,此即所谓的图像绘制
( rendering),也称为图像合成( image
synthesis)。
图像绘制的过程包括如下处理,































景物

模型
景物

图像
Rendering Pipeline
计算机图形的应用
(1) 计算机辅助设计和辅助制造 (CAD/ CAM)。
(2) 利用计算机生成各种地形图, 交通图, 天气图,
海洋图, 石油开采图等 。
(3) 作战指挥和军事训练 。
(4) 计算机 动画 和计算机艺术 。
(5) 其它:电子出版, 数据处理, 工业监控, 辅助
教学, 软件工程等 。
矢量绘图软件
专业绘图软件,
AutoCAD
MAPInfo,ARCInfo
办公与事务处理、平面设计、电子出版等领域,
Corel公司的 CorelDraw,
Adobe 公司的 Illustrator,
Macromedia公司的 FreeHand,
微软公司的 Microsoft Visio等
内嵌的绘图软件
计算机图形的标准
图形软件(编程语言)标准,
1.国际标准,
二维图形标准 GKS,
三维图形的国际标准是 GKS-3D,PHIGS,
2.工业标准,
OpenGL,微软公司的 Direct-3D。
3.图形数据交换标准,
国际标准,CGM,WebCGM,SVG和 STEP,
公司标准,Autodesk公司的 DXF,
Microsoft公司的 WMF等。
接口 3
绘图仪
现有
终端
接口 1
接口 2
未来
终端
应用程序
图形
软件包
元文件
读写程序
驱动
程序
驱动
程序
图形
元文件
总结
什么是数字媒体?
“媒体, 指的是信息的各种表示形式(如数值、文字、
图象、声音、视频等)
数字媒体就是数值、文字、声音、图像等的二进制
数字表示
数字媒体是随着计算机功能的不断增强、计算机应
用的不断深入而发展起来的
2 种不同类型的数字媒体
自然媒体 (使用数字化方法从现实世界获取的媒体 )
? 合成媒体 (使用计算机制作的媒体 )
Model
(description)
采用特定符号 (语言 ) 表示的文
本,合成语音,MIDI,图形,动画
Modeling
(describing)
人工交
互方式
命令语
言方式
rendering 人可以感知的形式
声 波
光波

温度
检测与
转换器



数字化 数字自
然媒体
取样声音,扫描
图像,数字视频
数字媒体技术的内容
媒体
编辑
媒体
编辑
媒体
编辑
媒体
编辑
多媒体作
品 (文档 )
媒体消费
媒体
集成
文本
图像
音频
视频
网络
媒体通信 媒体
准备
媒体
准备
媒体
准备
媒体
准备
(文本 )
(图象 )
(音频 )
(视频 )
(浏览、检索、播放、交易 )
数字媒
体的表

多媒体
文档的
表示
为什么要学习数字媒体?
1.数字媒体是各种计算机应用的处理对象,也是网络传
输对象。不了解, 对象,,就不能透彻地理解计算机
和网络的工作原理。
2.进一步理解计算机的工作原理
3.更好地理解常用工具软件的操作原理
4.扩大知识面,了解更多的计算机应用
5.为各个专业和学科进一步学习、使用计算机打下必要
的基础
本章的学习目标与要求
1 熟悉二进制的特点,掌握整数和实数在计算机内的表示方
法,了解数值计算的应用。
2 理解 GB2312,GBK和 GB18030三种汉字编码标准的内容、
关系与应用,熟悉中文文本准备的方法,掌握常用文本编
辑与处理软件的功能与应用。
3 懂得数字图像获取的原理与方法,熟悉图像在计算机中的
表示,初步了解数字图像处理的内容与应用,大体明白计
算机图形的生成过程及应用。
4 掌握声音获取的方法与设备,熟悉波形声音在计算机中的
表示、标准与应用,初步了解语音合成和音乐合成的过程
与应用。
5 了解数字视频的获取方法与设备,熟悉视频压缩编码的几
种标准及其应用,初步懂得计算机动画的制作过程。
本章总结
2.1 计算机组成与分类
2.2 CPU的结构与原理
2.3 PC机的组成
2.4 常用输入设备
2.5 常用输出设备
2.6 外存储器 习题 P73
关于实习