第二章 基本概念
贾 永 红
武汉大学
第二章
讲解内容
1,图像数字化概念、数字化参数对图像质量的影响,数
字化器性能评价
2,图像灰度直方图的基本概念、计算,性质及其应用
3.数字图像处理算法形式与数据结构
4.图像图像文件格式与特征
重点, 图像数字化、图像灰度直方图和图像文件 BMP格式
难点, 图像数字化、直方图应用、图像分层结构数据
教学法, 灵活应用示例法、启发式、提问法等
目的,
1,熟悉本章基本概念和图像处理算法形式,了解图像的特
征;
2.重点掌握图像数字化图像灰度直方图的基本概念及应用、
图像数据结构与特征
2.2 成象模型
f(x,y)---理想成像面坐标点( x,y) 的亮度
i(x,y)---照度分量
r(x,y)---反射分量,则
f(x,y)= i(x,y)× r(x,y)
其中, 0< i(x,y)< ∞, 0 <r(x,y)<1
3-D客观场景到 2-D
成像平面的中心投影。
物方点空间坐标与对应
的像方点坐标满足 几何
透视变换关系(共线条
件) 。
2.3图像数字化
图像数字化 是将一幅画面转化成计算机能处理的形式 —
— 数字图像的过程。
模拟图像 数字图像 正方形点阵
具体来说,就是把一幅图画分割成如图 2.3.1所示
的一个个小区域( 像元 或 像素 ),并将各小区域 灰度用整数
来表示,形成一幅点阵式的数字图像。它包括采样和量化两
个过程。像素的位置和灰度就是像素的属性。
2.3.1采样
将空间上连续的图像变换成离散点的操作称为 采样 。
采样间隔和采样孔径的大小是两个很重要的参数。
当对图像进行实际的抽样时,怎样选择各抽样点的
间隔是个非常重要的问题。关于这一点,图像包含何种
程度的细微的浓淡变化,取决于希望忠实反映图像的程
度。
不同形状的采样孔径
2.3.2量化
经采样图像被分割成空间上离散的像素,但其灰度是连续
的,还不能用计算机进行处理。
将像素灰度转换成离散的整数值的过程叫 量化 。
表示 像 素明暗程度的整数称为像素的 灰度级 (或 灰度值 或
灰度 )。
一幅数字图像中不同灰度级的个数称为灰度级数,用 G表
示。
采样方式,有缝、无缝和重迭
一般来说,, g就是表示存储图像像素灰度
值所需的比特位数 。
若一幅数字图像的量化灰度级数 G=256=28级, 灰
度取值范围一般是 0~255的整数, 由于用 8bit就能表示灰
度图像像素的灰度值, 因此常称 8 bit 量化 。
从视觉效果来看, 采用大于或等于 6比特位量化的
灰度图像, 视觉上就能令人满意 。
一幅大小为 M× N,灰度级数为 G的图像所需的存储
空间, 即图像的 数据量, 大小为
M× N× g ( bit)
gG 2?
灰度级数就代表一幅数字图像的层次。 图像数据
的实际层次越多视觉效果就越好。
数字图像根据灰度级数的差异可分为:黑白图像、灰度图
像和彩色图像。
黑白图像
图像的每个像素只能是黑或白,没有中间的过渡,故又称
为二值图像。二值图像的像素值为 0或 1。
例如
?
?
?
?
?
?
?
?
?
?
?
011
100
001
I
灰度图像
灰度图像是指灰度级数大于 2的图像。但它不包含彩
色信息。
彩色图像
彩色图像是指每个像素由 R,G,B分量构成的图像,
其中 R,B,G是由不同的灰度级来描述。
?
?
?
?
?
?
?
?
?
?
?
002 5 5
8002 5 5
2 4 02 4 02 5 5
R
?
?
?
?
?
?
?
?
?
?
?
02 5 50
1 6 02 5 52 5 5
801 6 00
G
?
?
?
?
?
?
?
?
?
?
?
2 5 52 5 52 5 5
2 4 000
1 6 0800
B
?
?
?
?
?
?
?
?
?
?
?
1 0 02 2 02 5 0
1 8 0501 2 0
2 0 01 5 00
I
2.3.3 量化参数与数字化图像间的关系
数字化方式可分为均匀采样, 量化和非均匀采样, 量化 。
所谓, 均匀,, 指的是采样, 量化为等间隔方式 。 图像
数字化一般采用均匀采样和均匀量化方式 。
非均匀采样是根据图象细节的丰富程度改变采样间距 。
细节丰富的地方, 采样间距小, 否则间距大 。
非均匀量化是对图像层次少的区域采用间隔大量化, 而
对图像层次丰富的区域采用间隔小量化 。
采用非均匀采样与量化, 均会使问题复杂化, 因此很少
采用 。
图像的质量
1.平均亮度
2.对比度
是 指 一 幅 图象中灰度 反差 的大 小。
对比度 =最 大亮度 /最小 亮度
3.清晰度
由图像边缘灰度
变化的速度来描述。
4.分解力或分辨率
一般来说,采
样间隔越大,所得
图像像素数越少,
空间分辨率低,质
量差,严重时出现
像素呈块状的国际
棋盘效应;
采样间隔越小,
所得图像像素数越
多,空间分辨率高,
图像质量好,但数
据量大 。
量化等级越多, 所
得图像层次越丰富, 灰
度分辨率高, 图像质量
好, 但数据量大;
量化等级越少, 图
像层次欠丰富, 灰度分
辨率低, 会出现假轮廓
现象, 图像质量变差,
但数据量小 。
但在极少数情况下
对固定图像大小时, 减
少灰度级能改善质量,
产生这种情况的最可能
原因是减少灰度级一般
会增加图像的对比度 。
例如对细节比较丰富的
图像数字化 。
2.3.4 数字化器
数字化器必须能够将图像划分为若干像素并分别给它们地
址,能够度量每一像素的灰度并量化为整数,能够将这些整数
写入存储设备。
一、数字化器组成
A,采样孔, 保证单独观测特定的像素而不受其它部分的影响。
B,图像扫描机构, 使采样孔按预先确定的方式在图像上移动。
C,光传感器, 通过采样孔测量图像的每一个像素的亮度。
D,量化器, 将传感器输出的连续量转化为整数值。
E,输出存储体, 将像素灰度值存储起来。它可以是固态存储
器,或磁盘等。
常用的数字化器是扫描仪、数码相机和数码摄像机。
二、扫描仪工作原理
扫描仪是图像输入的常用设备。其工作步骤是,
1.将欲扫描的原稿正面朝下铺在扫描仪的玻璃板上 ;
2.启动扫描仪驱动程序后,安装在扫描仪内部的可移动光源
通过机械传动机构在控制电路的控制下带动装着光学系统和
CCD的扫描头与图稿进行相对运动来完成扫描。
3.照射到原稿上的光线经反射后穿过一个很窄的缝隙,形成
横向光带,又经过一组反光镜,由光学透镜聚焦并进入分光镜
,经过棱镜和红绿蓝三色滤色镜得到的 RGB三条彩色光带,分
别照到各自的 CCD上,CCD将 RGB光带转变为模拟电子信号,
该信号又被 A/D变换器转变为数字
电子信号。
4.将数字电子信号传送
至计算机存储起来。
扫描仪的类型有很多种,按扫描仪所扫描对象来划分,可
分为反射式和透射式两种。根据其组成结构,扫描仪可分为手
持式、平板式和滚筒式等几种。
手持式扫描仪
这种扫描仪诞生于 1987年,是当年使用比较广泛的扫描仪
品种,最大扫描宽度为 105mm,用手推动,完成扫描工作,
也有个别产品采用电动方式在纸面上移动,称为自走式扫描仪。
手持式扫描仪扫描幅面太窄,难于操作和捕获精确图像,
扫描效果也很差。 1995 ~1996年,各扫描仪厂家相继停止生
产这一产品,手持式扫描仪退出了历史的舞台
鼓式扫描仪
又称为滚筒式扫描仪 。 鼓式扫描仪是专业印刷排版领域应用
最广泛的产品 。
滚筒式扫描仪的结构特殊, 它的工作原理是把原图贴放在一
个有机玻璃滚筒上, 让滚筒以一定的速率围绕一个光电系统旋
转, 探头中的亮光源发射出的光线通过细小的锥形光圈照射在
原图上, 一个像素一个像素地进行采样 。
这种扫描仪的光学分辨率高、色
深高、动态范围宽,而且输出的图
像普遍具有色彩还原逼真、阴影区
细节丰富、放大效果优良等特点。
但它的体积大,价格也很高。
平台式扫描仪
又称平板式扫描仪、台式扫描仪,这种扫描仪诞生于
1984年,是目前扫描仪的主流产品。
它的扫描区域为一块透明的平板玻璃,将原图放在这
块玻璃平板上,光源系统通过一个传动机构作水平移动,
发射出的光线照射在原图上,经反射或透射后,由接收系
统接收并生成模拟信号,再通过 A/ D转换成数字信号,直
接传送到电脑,由电脑进行相应的处理,完成扫描过程。
平板式扫描仪的扫描速度、精度、质量很好,已得到了很
好的普及。
图像数字化器的性能评价项目
项 目
内 容
空间分辨率
单位尺寸能够采样的像素数 。 由采样孔径与间距的大
小和可变范围决定 。
灰 (色 )度分
辨率
量化为多少等级 (位深度 ),颜色数 (色深度 )
图像大小
仪器允许扫描的最大图幅
量测特征
数字化器所测量和量化的实际物理参数及精度
扫描速度
采样数据的传输速度
噪声
数字化器的噪声水平 (应当使噪声小于图像内的反差 )
其他
黑白 /彩色, 价格,操作性能等
2.4图像灰度直方图
2.4.1 概念
一, 定义
灰度直方图反映的是一幅图像中各灰度级像素出现
的频率。以灰度级为横坐标,纵坐标为灰度级的频率,
绘制频率同灰度级的关系图就是灰度直方图。它是图像
的一个重要特征,反映了图像灰度分布的情况。
下图是一幅图像的灰度直方图。
频率的计算式为
灰度图像的直方图
彩色图像的分波段直方图
0
1
3
2
1
3
2
1
0
5
7
6
2
5
6
7
1
6
0
6
3
5
1
2
2
6
7
5
3
6
5
0
3
2
2
7
2
4
1
6
2
2
5
6
2
7
6
0
1
2
3
2
1
2
1
2
3
1
2
3
1
2
2
1
v0=5/64
v1=12/64
v2=18/64
v3=8/64
v4=1/64
v5=5/64
v6=8/64
v7=5/64
i
vi
二、计算
该图像像元总数为 8*8=64,i=[0,7]
2.4.2 直方图的性质
① 灰度直方图只能反映图像的灰度分布情况, 而不能反
映图像像素的位置,即丢失了像素的位置信息 。
② 一幅图像对应唯一的灰度直方图, 反之不成立 。 不同
的图像可对应相同的直方图 。 图 2.4.2给出了一个不同
的图像具有相同直方图的例子 。
图 2.4.2 不同的图像具有相同直方图
③ 一幅图像分成多个区域, 多个区域的直方图之和即为
原图像的直方图 。
2.4.3 直方图的应用
① 用于判断图像量化是否恰当
(a) 恰当量化 (b)未能有效利用 (c)超过了动态范围
图 2.4.4直方图用于判断量化是否恰当
② 用于确定图像二值化的阈值
?
?
?
?
?
?
Tyxf
Tyxf
yxg
),(1
),(0
),(
具有二峰性的灰度图象
③ 当影像上目标的灰度值比其它部分灰度值大或者灰度
区间已知时, 可利用直方图统计图像中物体的面积 。
A= (2.4-3)
④ 计算图像信息量 H( 熵 )
( 2.4-4)
??Ti ivn
??
?
??
1
0
2lo g
L
i
ii PPH
2.5图像处理算法的形式
2.5.1图像处理基本功能的形式
按图像处理的输出形式, 图像处理的基本功能可分
为三种形式 。
1) 单幅图像 → 单幅图像,如图 2.5.1(a)。
2) 多幅图像 → 单幅图像,如图 2.5.1(b)。
3) 单 ( 或多 ) 幅图像 → 数字或符号等, 如图 2.5.1(c)。
2.5.2图像处理的几种具体算法
1.局部处理
邻域
对于任一像素( i,j),该像素周围
的像素构成的集合 {( i+p,j+q),p,q取
合适的整数 },叫做该像素的 邻域 。如图
2.5.2( a)。
常用的邻域如图 2.5.2( b),(c),分
别表示中心像素的 4-邻域,8-邻域 。
图 2.5.2 像素的邻域
局部处理
对输入图像 IP( i,j) 处理时,某一输出像素 JP(i,j)值
由输入图像像素( i,j)及其邻域 N(IP(i,j))中的像素值确定。
这种处理称为 局部处理 。
局部处理的计算表达式为
) ) ),(((),( jiIPNjiJP N??
例如 对一幅图象采用 3× 3模板进行卷积运算。
点处理
在局部处理中, 当输出值 JP(i,j)仅与 IP(i,j)有关, 则称
为 点处理, 如图 2.5.5。
点处理的计算表达式为,
)25.2()),((),( ?? jiIPjiJP p?
图 2.5.5 点处理
大局处理
在局部处理中, 输出像素 JP(i,j)的值取决于输入图
像大范围或全部像素的值, 这种处理称为 大局处理 。 如
图2 5.6。
其计算表达式为,
)35.2())),(((),( ?? jiIPGjiJP
G?
图 2.5.6 大局处理
2.迭代处理
反复对图像进行某种运算直至满足给定的条件,从
而得到输出图像的处理形式称为迭代处理。如 2.5.7图像
的细化处理过程。
3.跟踪处理
选择满足适当条件的像素作为起始像素,检查输入
图像和已得到的输出结果,求出下一步应该处理的像素,
进行规定的处理,然后决定是继续处理下面的像素,还
是终止处理。这种处理形式称为跟踪处理。
4.位置不变处理和位置可变处理
输出像素 JP(i,j)的值的计算方法与像素的位置 (i,j)
无关的处理称为 位置不变处理 或 位移不变处理 。
随位置不同计算方法也不同的处理称为 位置可变处
理 或 位移可变处理 。
5.窗口处理和模板处理
对图像的处理, 一般采用对整个画面进行处理, 但
也有只对画面中特定的部分进行处 理的情况 。 这种处理
方式的代表有窗口处理和模板处理 。
图 2.5.8窗口处理
单独对图像中选定的矩形
区域内的像素进行处理的方式
叫做 窗口处理
模板:任意形状的区域;
模板平面:一个和处理图像
相同大小的二维数组,
用来存储模板信息。一
般是一幅二值图像;
模板处理:边参照模板平面
边对图象进行某种操作。
希望单独处理任意形状的区域时,可采用模板处理。
若模板成矩形区域,则与窗口处理具有相同的效果,但
窗口处理与模板处理不同之处是后者必须设置一个模板平面。
2.6 图像的数据结构与特征
2.6.1 图像的数据结构
1.组合方式
组合方式是一个字长存放多个像素灰度值的方式 。 它能起
到节省内存的作用, 但导致计算量增加, 使处理程序复杂 。
解压
压缩
组合方式
图像处理
2.比特面方式
按比特位存取像素,即将所有像素的相同比特位用一个
二维数组表示,形成比特面。 n个比特位的灰度图像采用比特
面方式存取就有 n个比特面。这种结构能充分利用内存空间,
便于比特面之间的逻辑运算,但对灰度图像处理耗时多。
n-1 2 1 0
锥形结构 是对 2k× 2k个像素形成的
图像,看成是分辨率不同的 k+1幅图像的
层次集合,即 20× 20→2 k× 2k。 但 20× 20
不具有反映输入图像的信息。
如图 2.6.1所示,从输入图像 I0开始,
依序产生像素数纵横都按 1/2递减的一幅
一幅的图像 I1,I2,…I k。 此时,作为图
像 Ii的各像素的值,就是它前一个图像 Ii-1
的相应的 2× 2像素的平均值 (一般采用平
均值,但也可以采用能表示 2× 2像素的
性质的某个值 )确定。
3.分层结构
由原始图像开始依次构成像素数愈来愈少的一幅幅图
像,就能使数据表示具有分层性,其代表有锥形 (金字塔 )
结构。
处理具有这种结构的数据时,首先对像素数少的图像
进行处理,然后根据需要,进到下面的像素数多的图像的
对应位置,使用较丰富的信息进行处理。同只对原始图像
进行处理的场合相比,这种先对粗图像进行处理,并限定
应该仔细进行处理的范围,再进行精处理的方法,可使处
理的效率得到提高。
4.树结构
对于如图所示的一幅二值
图像的行、列接连不断地二等
分,如果图像被分割部分中的
全体像素都变成具有相同的特
征时,这一部分则不再分割。
用这种方法,可以把图像用树结构 (4叉树 )表示。这
可以用在特征提取和信息压缩等方面。
5.多重图像数据存储
在获取的彩色图像 ( 红, 绿, 兰 ) 或多波段图像中, 每
个像素包含着多个图像的信息 。 对这类图像数据的处理, 以
多谱图像为例, 有下列三种存储方式,
① 逐波段存储, 分波段处理时采用;
② 逐行存储, 行扫描记录设备采用;
③ 逐像素存储, 用于分类 。
2.6.2 图像文件格式
按不同的方式进行组织或存储数字图像像素的灰度, 就得到不同格式
的图像文件 。 图像文件按其格式的不同具有相应的扩展名 。 常见的图像
文件格式按扩展名分为,RAW格式, BMP格式, TGA格式, PCX格式, GIF格
式, TIFF格式等 。
1.RAW格式
它是将像素按行列号顺序存储在文件中。这种文件只含有图像像
素数据,不含有信息头,因此,在读图像时,需要事先知道图像大小
(矩阵大小)。它是最简单的一种图像文件格式。
2.BMP格式
由以下四个部分组成
1) 14字节的文件头 ;
2) 40字节的信息头 ;
3) 8字节的颜色定义;
4)位图数据。
1)位图文件头 BITMAPFILEHEADER
它的结构如下,
typedef struct tagBITMAPFILEHEADER{
WORD bfType; /*指定文件类型, 必须是 0x424D,即字符串, BM” */
DWORD bfSize; /*指定文件大小 */
WORD bfReserved1;为 /*保留字 */
WORD bfReserved2; /*保留字 */
DWORD bfOffBits;为 /*文件头到实际的位图数据的偏移字节数 * /
}BITMAPFILEHEADER,FAR *LPBITMAPFILEHEADER;
该结构的长度是固定的,为 14个字节 。
2)位图信息头 BITMAPINFOHEADER
结构的长度为 40个节, 其结构如下,
typedef struct tagBITMAPINFOHEADER{
DWORD bfSize; /* 指定这个结构的大小, 为 40个字节
LONG biWidth; /*指定图像的宽度, 单位是像素
LONG biHeight; /*指定图像的高度, 单位是像素;
WORD biPlanes; /*必须是 1
WORD biBitCount; /*指定表示颜色位数, 1(黑白 )8( 256色 ), 24( 真彩色 )
DWORD biCompression; /*指定是否压缩,分别为 BI_RGB,BI_RLE4,BI_RLE8
DWORD biSizeImage; /*指定实际的位图数据占用的字节数 。
LONG biXPelsPerMeter; /*指定目标设备的水平分辨率
LONG biYPersPerMeter; /*指定目标设备的垂直分辨率
DWORD biClrUsed; /*指定本图像实际用到的颜色数
DWORD biClrImportant; /*指定本图像中重要的颜色数
}BITMAPINFOHEADER,FAR *LPBITMAPINFOHEADER;
3)palette( 调色板)
调色板实际上是一个数组,数组中每个元素的类型为一个 RGBQUAD
结构,占 4个字节。结构定义如下,
typedef struct tagRGBQUAD{
BYTE rgbBlue;
BYTE rgbGreen;
BYTE rgbRed;
BYTE rgbReserved;
}RGBQUAD;
有些位图,比如真彩色图,没有调色板。他们的位图信息头后直
接是位图数据。
4)位图数据
它分两种情况:对于用到调色板的位图,图像数据就是该像素
颜色在调色板中的索引值;对于真彩色图,图像数据就是实际的 R、
G,B值。
对于 2色位图,用 1位就可以表示该像素的颜色,因此一个
字节可以表示 8个像素;
对于 16色位图,用 4位可以表示一个像素的颜色,所以 1个
字节可以表示 2个像素;
对于 256色位图,一个字节刚好表示一个像素;
a) 位图是 1,4,8位时,有调色板 。
R G B
对于真彩色图,3个字节才能表示 1个像素,
b) 位图是 24位(真彩色)时,无调色板
Rn
Gn
Bn
,
R2
G2
B2
R1
G1
B1
2.7 图像的特征
1,图像的特征
1)自然特征
① 光谱特征
② 几何特征
③ 时相特征
2) 人工特征
① 直方图特征
②灰度边缘特征
③ 线、角点、纹理特征
图像的特征有很多,按提取特征的范围大小又可分为,
①点特征
仅由各个像素就能决定的性质。如单色图像中的灰度值、
彩色图像中的红 (R),绿 (G),蓝 (B)成分的值。
②局部特征
在小邻域内所具有的性质,如线和边缘的强度、方向、密
度和统计量 (平均值、方差等 )等。
③区域特征
在图像内的对象物 (一般是指与该区域外部有区别的具有
一定性质的区域 )内的点或者局部的特征分布,或者统计量,以
及区域的几何特征 (面积、形状 )等。
④整体特征
整个图像作为一个区域看待时的统计性质和结构特征等。
图 2.6.3图像的特征提取
2,特征提取
获取图像特征信息的操作称作特征提取。它作为模式
识别、图像理解或信息量压缩的基础是很重要的。通过特
征提取,可以获得特征构成的图像(称作特征图像)和特
征参数。
图 2.6.4 特征空间聚类
3.特征空间
把从图像提取的 m个特征量 y1,y 2,…, ym,用 m维的向
量 Y= [y1 y2…y m]t表示称为特征向量。另外,对应于各特征
量的 m维空间叫做特征空间。