数字图像处理的基础知识

2018-11-28 本文已影响33人有苦向瓜诉说

图像是人们生活中生活体验最丰富的部分，但图像究竟是什么呢？对于图像的理解可以分为两个方面，“图”是物体透射光或者反射光的分布，“像”是人的视觉系统接受图后在大脑形成的印象或认识。通俗的说，“图”是客观存在的事物，“像”是一种人为的感受。

而数字图像处理是用计算机来处理图像，PS软件的使用，手机拍照美颜，人脸识别等等，都需要利用数字图像处理的知识来解决。

图像的形成

自然界的图像是模拟形式的，计算机无法直接处理，需要将自然界中的图像进行数字化处理之后，再传给计算机来处理。

数字化就是将模拟图像转化为数字图像的过程，包括扫描、采样、量化三个步骤。采样就是对图像空间的离散化处理，将图像分成一个一个的小像素，而量化就是对图像幅值的离散化处理，使图像像素的数值与有限数值范围中的某一个相对应。而采样点数和量化级数会直接影响分辨率，采样点数越多，量化级数越高，则图像分辨率越高，图像越清晰，但存储图像所需要的空间也就越大，这需要根据不同的情况来选择不同的分辨率，例如微信等软件发送图片时便可自己选择原图或者是压缩后的图片。

如下图所示，选择原图发送则图片体积大，发送慢，但更清晰。

image.png

图像的表示

图像数字化之后在计算机中其实就是一个数字矩阵，通常有三种表示形式，灰度图像，彩色图像，二值图像。

灰度图像用一个通道来表示，图像的灰度用像素值来表示，数值越大则图片越白。彩色图像常用三个通道来表示，分别是红绿蓝这三个通道，组成的是一个三维向量矩阵。而在计算机中常见的灰度或者红绿蓝的数值范围通常是0到255，这是因为图像的每个像素是使用8位来表示的，2^8=256。但这只是适合人类的彩色视觉辨别系统，其实还存在许多其他的范围，例如二值图像只有黑白两色，数值范围便只有0和1，而高级的摄像机或者卫星图片，为了提高图片的清晰度，会采用更大的范围。

在图像实际进行存储时，通常会转换成各种格式，常见的有JPG，PNG，GIF等。

PNG（Portable Network Graphic Format），适合在网络上传输和打开，本来是想替代GIF格式，但是不支持动画。
JPG（Joint Photographic Experts Group），是一种用有损压缩方式来去除冗余的数据，获得质量高，尺寸小，略有失真的图像，是目前最常用的图像格式，各种相机都是这个格式。
BMP（位图，BitMap），这是图像未经压缩的原始数据，可以存储真彩色的图像数据。
GIF（Graphics Interchange Format）是将多幅图像保存为一个图像文件，从而形成动画。采用无损压缩技术，即减少了文件的大小，有保证了图像的质量。
PSD，TIF／TIFF，这些格式由一些公司为了自己的产品而研发的格式，需要用特定的软件打开。

颜色视觉

牛顿曾经利用三棱镜，将一束白光分解成为了不同的颜色。图像的颜色也是可以由其他的颜色混合而成的，最常见的颜色模型是RGB模型，由三原色红绿蓝组成了其他的颜色，因此我们常称它为加法混色模型，电脑或者电视机这样的显示设备便是采用这种颜色模型。

image.png

在印刷行业则是使用另一种颜色模型--CMY模型，它的原色分别是青色（Cyan）、品红（Magenta）、黄色（Yellow）这三种油墨色，与RGB正好互为补色，因此被叫做减色原色模型，而RGB可以与CMY通过相减来进行转换。实际的印刷中，由于染料的纯度，纯粹的黑色不能由其他三种原色混合得到，所以增加了一种黑色（Black），实际印刷使用的模型其实是CMYK模型。

其他的如YUV，YIQ，YCrCb这类，是将颜色的亮度分离开来，用Y表示亮度，用其他两个表示颜色，这类颜色模型通常用于电视广播等，它们与RGB颜色模型能够进行转换。

RGB和CMY都是面向硬件的，而HSV和HSI颜色模型则是面向用户的。HSV用色调（Hue）、饱和度（Saturation）和明度（Value）来描述彩色空间，它把图像的明度与颜色的两个本质特征--色度和饱和度分开，能够颜色光照对图像的影响，很好的弥补了RGB模型的缺点。HSI模型也是面向用户，I表示亮度（Intensity），与HSV相比，除了计算公式略有不同，其他几乎相似，也是面向用户的。