数字图像与处理技术
图像由人的视觉来感知的,通过人眼感知到最多的就是图像的轮廓和色彩。人们对色彩的感知有着特殊的敏感性,色彩本身的独特表现力可以唤起人们各种不同的情感联想,所产生的美感魅力往往更为直接。
-
色彩的基本要素: 色相、亮度、饱和度
-
图像的颜色模式:位图、灰度、索引、RGB、CMYK、Lab、HBS
-
图像的分类:位图与矢量图
-
图像的基本属性:分辨率、像素深度、真伪彩色
-
图像的数字化:采样、量化、压缩编码
-
图像的保存与传送是以文件形式进行的
图像的技术基础
图像颜色的构成
1.色彩基础
色彩是通过光被人的视觉系统所感知的,感知的颜色是由光的波长所决定的。可见光波长在0.38~0.76µm之间,波长从小到大对应的光谱颜色分别是紫、蓝、青、绿、黄、橙、红。
纯颜色通常使用光的波长来定义,其波长定义的颜色称作光谱色。自然界中大多数光不是单一波长的纯色光,而是由许多不同波长的光混合而成的。
本身不发光的物体,都会或多或少地吸收投于其上的光,也都会或多或少地反射投于其上的光。不发光物体的颜色取决于这个物体对可见光进行选择性的吸收和反射后的结果。
【色彩基本要素】色相、亮度和饱和度,这也是色彩的三个属性。人眼看到的任一彩色光都是这三个属性的综合效果。
- 色相(或色调,Hue):是指一种颜色区别于其他颜色的最基本和最显著的特征,它反映了颜色的种类,如红、橙、黄、绿、蓝、紫等色彩分别表示颜色的种类。
- 亮度(Brightness):是人眼对明暗程度的感觉。亮度与光的能量成正比,它是单位面积上所接收的光强,通常以百分比度量,取值0~100%,0%为暗,100%为亮。
- 饱和度(Saturation):是指色彩的纯净程度,由单色光中掺入的白光亮的相对大小决定,取值为0~100%。单色光的色饱和度为100%。饱和度越高说明颜色越纯,加入白光后其饱和度会下降。
2. 图像的色彩模式
- 【位图模式】位图模式就是黑白模式,每个像素的颜色值仅占1bit,它只能用黑色和白色来表示图像。只有灰度模式可以转换为位图模式。所以,一般的彩色图像需要先转换为灰度模式才能接着转换为位图模式。
- 【灰度模式】灰度模式可以表现从黑到白的整个系列灰色色调。 在灰度颜色模式中,每个像素需要8bit的空间来记录它的颜色值,可以产生28=256级灰度(0表示黑色,255表示白色),即每个像素有一个在0~255之间的灰度值。
- 【索引模式】索引模式使用256 种颜色来表示图像。当一幅RGB或者CMYK的图像转化为索引模式时,将建立一个256色的颜色查阅表来存储此图像所用到的颜色。因此,索引模式的图像所占存储空间较小,但是图像质量不高,适用于多媒体动画和网页图像制作。
- 【RGB颜色模式】RGB颜色模式以R(红)、G(绿)和B(蓝) 三种颜色作为原色,其产生颜色的方法称为加色法。没有光时为黑色,加入R、G、B色光并以各种不同的相对强度综合起来产生颜色,当三基色的光强都达到最大时就产生了白色。
- 【CMYK模式】CMYK色彩模式是针对印刷而设计的一种色彩模式。该模式以红、绿、蓝三色的补色青(Cyan)、品红(Magenta)、黄(Yellow)为原色。CMYK模式为减色法。任何一种颜色都可用三种基本颜料(油墨)按一定比例混合得到。但是,由于颜料的成分不纯,100%的品红、青色、黄色油墨结合只能形成深棕色,为了弥补黑色调的不足,额外增加了一个黑色(blacK),所以又写成CMYK。
- 【Lab模式】Lab模式是通过A、B两个色调参数和一个光强度来控制色彩的。A、B可以通过-128至+128之间的数值变化来调整色相,其中A为由绿到红的光谱变化,B为由蓝到黄的光谱变化;光强度可以在0-100范围内调节。当RGB和CMYK模式互换时,需要先转为Lab模式,才能减少转换过程中的损耗。
- 【HSB模式】 HSB模式使用色彩的基本要素色相、亮度和饱和度。只有在色彩编辑时才可以看到这种颜色模式。色相是按圆周方向0360°位置度量;径向表示饱和度,从中心逐渐向边缘递增的,用0100%度量。亮度通常是从下向上由0~100%来度量。
图像的分类
在计算机中,表达所生成的图像分为两种类型:矢量图与位图(点阵图)。
1. 位图
位图是连续色调图像最常用的电子媒介。像素是构成位图的最小单元,每个像素都有其特定的位置信息和颜色信息。位图的获取通常依靠扫描仪、数码照相机和摄像机等设备,把图像信号变成数字图像数据,也可以通过设计软件生成。
位图的特点:
(1)位图是以像素为基础建立的信息体。
(2)位图的缩放会产生失真。放大位图时会产生锯齿效果。此时可以看见构成图像的单个元素。
(3)位图文件占据的存储空间比较大。位图文件存储的是图像各个像素的位置和颜色信息,像素密度越大、颜色阶调越丰富,则图像越清晰,相应的存储容量也就越大。
(4)显示速度快。
2. 矢量图
矢量图是用一系列计算机指令来描述和记录的图像。矢量图可以分解为一系列由点、线、面等组成的子图。在图形软件中,计算机指令用来描述对象的位置、维数、形状、大小、颜色等特征参数。
矢量图的特点:
(1)矢量图是以造型特征及其相关参数为基础建立的信息体,描述了对象的形体特征,难以表现色彩层次丰富的逼真图像效果。
(2)缩放或旋转不会引起失真。
(3)文件数据量小。矢量图是对各种图像进行模型化,然后使用计算机指令集合来描述图像的,因此数据量较小。
(4)不易描述复杂图。当图像很复杂时,计算机需要花费很长的时间去执行绘图指令,才能把图像显示出来。
常用的矢量图软件有AutoCAD、CoreDraw、Illustrator等。AutoCAD适合绘制机械图和电路图等。CoreDraw和Illustrator用于插画创作。
矢量图和位图之间可以用软件进行转换。由矢量图转换成位图时采用光栅化技术,这种转换相对容易。由位图转换成矢量图时采用跟踪技术,这种技术在实际应用中难以实现。
图像的基本属性
位图是由像素构成的,像素的密度和像素的颜色信息直接影响图像的质量。描述一幅图像需要使用图像的属性,图像的属性包含分辨率、像素深度、真伪彩色等。
1. 分辨率
(1)图像分辨率
数字图像是由一定数量的像素构成的。图像分辨率是指组成一幅图像的像素密度,用每英寸图像包含的像素数(Pixel Per Inch,PPI)表示。对同一幅图像,图像分辨率越高,图像的像素数越多,图像质量越好,反之图像质量越差。
(2)显示分辨率
显示分辨率是指显示屏上能够显示出的像素数量。 例如,显示分辨率为1024×768表示显示屏分成768行(垂直分辨率),每行显示1024个像素,整个显示屏就含有786432个像素点。屏幕能够显示的像素越多,说明显示设备的分辨率越高,显示的图像质量也就越高。
(3)打印分辨率
打印分辨率是每英寸打印纸上可以打印出的墨点数量,用DPI(Dot Per Inch)来表示。打印设备的分辨率在360dpi至2400dpi之间。打印分辨率越大,表明图像输出的墨点越小,输出的图像效果就越精细。
2. 像素深度
像素深度(也称颜色深度)是指存储每个像素的色彩(或灰度)所用的二进制位数。像素深度决定彩色图像可以使用的最多颜色数目,或者确定灰度图像的灰度级数。较大的像素深度意味着数字图像具有较多的可用颜色和较精确的颜色表示。一幅RGB模式的彩色图像,每个RGB分量用8bit表示,也就是像素的深度为24,每个像素可以是224=16777216种颜色中的一种。
3. 真彩、伪彩、直接色
(1)真彩色
真彩色是指在组成一幅彩色图像的每个像素值中,有RGB三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。例如用RGB(5:5:5)表示的彩色图像,RGB各用5bit,用RGB分量大小的值直接确定3个基色的强度,这样得到的彩色是真实的原图彩色。
真彩色图通常是指RGB(8:8:8),即图像的颜色数等于224,也常称为全彩色(full color)图像。
显示器上显示的颜色就不一定是真彩色。要得到真彩色图像,需要有真彩色显示适配器,目前的普通PC机上的VGA适配器很难得到真彩色图像。
(2)伪彩色
伪彩色图像的含义是,每个像素的颜色不是由每个基色分量的数值直接决定的,而是把像素值当作彩色查找表(color lookup table)的表项入口地址,去查找一个显示图像时使用的RGB强度值,用查找出的RGB强度值产生的彩色称为伪彩色。
由于伪彩色图像中保存的不是各个像素的彩色信息,而是具有代表性的颜色编号,每一编号对应一种颜色,图像的数据量就会因此减少,这对彩色图像的传播非常有利。
(3)直接色
每个像素值分成RGB分量,每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度,用变换后得到的RGB强度值产生的彩色称为直接色。直接色的特点是可以对每个基色进行变换。
数字化图像
现实世界中的照片、画报及图纸等图像信号在空间和灰度或颜色上是连续的函数,要在计算机中处理图像,必须先将其进行数字化转换。
图像的数字化过程分为采样、量化和编码三个步骤。
1、 采样
图像在二维空间上的离散化称为采样。图像经过采样后的离散点称为样点(像素)。采样的实质就是用若干个点来描述一幅图像,就是将空间上连续的图像在水平和垂直两个方向上等间距地分割成矩形网状结构,这样,一幅图像就被采样成有限个像素点所构成的集合,所形成的微小方格称为像素点。图像经过采样后,由 M×N个像素描述,像素的位置用(x,y)坐标定位。
在图像采样时,采样间隔大小的选取很重要,它决定了采样后的图像是否能真实地反映原图像。采样的密度决定了图像的分辨率。一般来说,原图像中的画面越复杂、色彩越丰富,采样间隔就应该越小,采样的点数就越多,图像质量就越好。
2 、图像的量化
把图像采样后所得的各像素的灰度或色彩值离散化,称为图像的量化。通常用L位二进制数描述灰度或色彩值,量化级数为2L。一般可采用8、16或24bit量化位数,较高的量化位数意味着像素具有较多的可用颜色和较精确的颜色表示,越能真实地反映原有图像的颜色,但得到的数字图像的容量也越大。
一幅灰度照片,它在水平与垂直方向上都是连续的。通过沿水平和垂直方向的等间隔采样,可得到一个M×N的离散样本,每个样本点的取值代表该像素的灰度(亮度)。对灰度进行量化,使其取值变为有限个可能值,经过这样的采样和量化得到的图像称为数字图像。只要水平与垂直方向采样点数足够多,量化位数足够大,则数字图像的质量与原始图像相比就毫不逊色。
图像数字化后, 用二维数组表示。
3 、压缩编码
编码的作用:一是采用一定的格式来记录图像数据;二是由于数字化后得到的图像数据量巨大,必须采用一定的编码技术来压缩数据,以减少存储空间,提高图像传输效率。
常见的图像压缩编码有行程编码、赫夫曼编码、LZW编码、预测编码、变换编码、小波编码、人工神经网络等。20世纪90年代后,已制定一系列静止和活动图像编码的国际标准,主要有JPEG标准、MPEG标准、H.261等。
数字图像文件格式
图像的保存与传送是以文件形式进行的。由于编码算法不同,导致数据存放格式也有所不同。
常用的位图文件格式
- GIF格式
图像交换格式GIF( Graphics Interchange Format )是CompuServe公司在1987年制订的,文件以.gif为扩展名。GIF格式最多只支持256种颜色的图像,并支持图像透明像素。
GIF允许图像进行交错处理。采用隔行存放的GIF图像,在图像显示时隔行显示图像数据。在因特网上显示一个尺寸较大的图像时,交错处理的方法是分成4遍来扫描的。该方法每隔8行显示一次数据,并会逐渐填补其间的空隙。首先将看到整幅图像的概貌,然后图像逐渐显示清晰,感觉上其显示速度要比其他图像快。
GIF89a版本通过图形控制扩展(Graphics Control Extension)块支持简单的动画,其特点是在一个GIF文件中可以存储多幅图像,并能以默认的顺序显示,形成连续播放的动画效果。 - JPEG格式
JPEG文件以JPG为扩展名。JPEG是一个通用的图像压缩标准,该标准由联合图像专家组(Joint Photographic Experts Group)制定,适用于各种计算机系统。JPEG利用人眼的一些特定局限性获得了很高的压缩率。它主要用于存储颜色变化的信息,特别是亮度变化。
JPEG具有调节图像质量的功能,允许用户设定需要的图像质量等级。若选择低质量,则压缩比率大,文件数据占用的空间就小。 - PNG格式
PNG(Portable Network Graphics)是1996年由W3C所制定的Web标准图片格式,文件以.png为扩展名。
PNG格式支持透明效果,可以为图像定义256个透明层次,使得彩色图像的边缘能与任何背景平滑地融合,从而消除锯齿边缘。PNG格式并不仅限于256色,它同时提供24位和48位真彩色图像支持。PNG能够提供比GIF小30%的无损压缩图像文件。 - TIFF格式
TIFF(Tagged Image File Format)是一个广为应用的位图文件格式,文件以tif或tiff为扩展名。TIFF格式可以制作质量非常高的图像,因而经常用于出版印刷。
该格式支持CMYK、RGB、Lab等多种图像色彩模式;支持Alpha通道;Photoshop可以在TIFF文件中存储图层;它是一个跨平台的图像文件格式,可在应用程序和计算机平台之间交换文件;TIFF文件可以是不压缩的,此时文件体积较大,也可以是压缩的,支持多种压缩方式。 - BMP格式
BMP(Bitmap)文件是Windows操作系统的标准文件格式,文件以.bmp为扩展名。它为Windows应用程序所支持。
这种格式的特点是,包含的图像信息较丰富,几乎不进行压缩,文件所占用的空间很大。 - PICT格式
PICT格式在Macintosh计算机(苹果机)的图形应用程序和排版程序中使用很广泛。它是在应用程序间转换文件的中间格式。如果要将图像保存成一种能够在Mac系统上打开的格式,选择PICT格式要比JPEG格式好,因为它打开的速度更快。 - PSD格式
PSD是Photoshop图像处理软件的专用文件格式,文件扩展名为.psd,可以支持图层、通道、蒙板和不同色彩模式的各种图像,是一种非压缩的文件保存格式。
PSD文件可以保留所有原始信息以及编辑信息,文件容量会很大。它被作为Photoshop图像处理软件的主文件,由该主文件再去生成各种输出所要求的其它格式文件。
常见的矢量图文件格式
- WMF格式
WMF格式是Windows系统中常见的一种图元文件格式,由Microsoft公司在1990年制订。
它具有文件短小、图案造型化的特点,整个图形常由各个独立的组成部分拼接而成,但其图形往往较为粗糙,所占的磁盘空间比其它任何格式的图形文件都要小得多,并且只能在Microsoft Office中调用编辑。 - EMF格式
EMF是由Microsoft公司开发的Windows 32位扩展图元文件格式。其总体设计目标是弥补WMF文件格式的不足,使得图元文件更加易于使用。 - EPS格式
EPS是Encapsulated PostScript的缩写,是跨平台的标准格式,扩展名在Windows平台上是eps,在Macintosh平台上是epsf,主要用于矢量图像和光栅图像的存储。几乎每个绘画程序都允许保存EPS文档,它为文件交换带来很大方便。
EPS格式采用 PostScript语言进行描述,PostScript图形打印机上能打印出高品质的图像。 - AI格式
AI文件是一种矢量图形文件,适用于Adobe公司的Illustrator软件的输出格式。AI文件是一种分层文件,用户可以对图形内所存在的层进行操作,可在任何尺寸大小下按最高分辨率输出。 - DXF格式
DXF是用于制图软件AutoCAD与其他软件之间进行CAD数据交换的文件格式,在表现图形的大小方面十分精确。DXF文件是由很多代码和值组成的,它是以二进制格式保存的,分为ASCII格式和二进制格式。两种格式的区别在于占用空间大小不同。