Java基于opencv实现图像数字识别(二)—基本流程

2018-06-10 本文已影响140人奇迹迪

Java基于opencv实现图像数字识别(二)—基本流程

做一个项目之前呢，我们应该有一个总体把握，或者是进度条；来一步步的督促着我们来完成这个项目，在我们正式开始前呢，我们先讨论下流程。

我做的主要是表格中数字的识别，但这个不是重点。重点是通过这个我们可以举一反三，来实现我们自己的业务。

图像的识别主要分为两步：图片预处理和图像识别；这两步都很重要

图像预处理：
1、图像灰度化；二值化
2、图像降噪，去除干扰线
3、图像腐蚀、膨胀处理
4、字符分割
5、字符归一化

图像识别：
1、特征值提取
2、训练
3、测试

灰度化：

在RGB模型中，如果R=G=B时，则彩色表示灰度颜色，其中R=G=B的值叫灰度值；因此，灰度图像每个像素点只需一个字节存放灰度值(又称强度值、亮度值)，灰度范围为0-255。一般常用的是加权平均法来求像素点的灰度值

常见的加权方法如下：
1：）Gray = B ; Gray = G ; Gray = R
2：）Gray = max({B , G , R})
3：）Gray = (B + G + R) / 3
4：）Gray = 0.072169 * B + 0.715160 * G + 0.212671 * R
5：）Gray = 0.11 * B + 0.59 * G + 0.3 * R

这几种方法中，第一为分量法，即用RGB三个分量的某一个分量作为该点的灰度值；第二种方法为最大值法，将彩色图像中的三个分量亮度的最大值作为灰度图的灰度值；第三种方法是将彩色图像中的三分量求平均得到一个灰度图；后两种都属于加权平均法，其中第四种是opencv开发库所采用的一种求灰度值算法；第五种为从人体生理学角度所提出的一种求灰度值算法(人眼对绿色的敏感最高，对蓝色敏感最低)

二值化：

图像的二值化，就是将图像上的像素点的灰度值设置位0或255这两个极点，也就是将整个图像呈现出明显的只有黑和白的视觉效果

图像降噪：

就是处理掉一些干扰因素；

主要的降噪算法

滤波类：通过设计滤波器对图像进行处理。特点是速度往往比较快，很多卷积滤波可以借助快速傅里叶变化来加速

稀疏表达类：自然图片之所以看起来不同于随机噪音/人造结构，是因为大家发现他们总会在某一个横型下存在稀疏表达。而我们想排除的噪音往往无法被稀疏化。基于这个判别式模型，用稀疏性来约束自然图像，在很多逆问题里取得了拔群的效果

外部先验：如果从有噪音的图片本身无法找到规律，我们也可以借助其他类似但又没有噪音的图片，来总结图片具有的固有属性。这一类方法利用的外部图片来创造先验条件，然后用于约束需要预测的图片。最有代表性就是混合高斯模型

聚类低秩：除了可稀疏性，低秩性也是自然图片常见的一个特性。数学上，可稀疏表达的数据可以被认为是在Union of low-dimensional subspaces；而低秩数据则是直接存在于一个Low-dimensional subspace。这个更严格的限制往往也可以取得很好的降噪效果。

深度学习（Deep Learning）：这类可以归于外部先验的子类，如果说解决逆问题的关键，是寻找一个好的图像约束器，那么我们为什么不用一个最好的约束器？深度学习方法的精髓，就在于通过大量的数据，学习得到一个高复杂度（多层网络结构）的图片约束器，从而将学习外部先验条件这一途径推到极限。近期的很多这类工作，都是沿着这一思路，取得了非常逆天的效果。

字符分割：就是把图片有用的部分一个个分割下来;字符分割有很多方法，但并不是每一种方法都是万能的，我们需要根据自己的业务来调整；常见的就是投影法和连通域法

投影法：就是分析每一维上黑色像素点的个数(假设是二值化的图像)，然后设置一个阙值，根据这个阙值来分割图片

图像腐蚀、膨胀处理

腐蚀：图像的一部分区域与指定的核进行卷积，求核的最小值并赋值给指定区域。腐蚀可以理解为图像中高亮区域的领域缩小。

膨胀：图像的一部分区域与指定的核进行卷积，求核的最大值并赋值给指定区域。膨胀可以理解为图像中高亮区域的领域扩大。

字符的归一化：

就是将分割好的图像内的字符归一化到一个标准模板大小；归一化的理想结果就是：归一化到标准模板大小；倾斜校正；笔画宽度归一化；字形归一化。

注：
本文章参考了很多博客，感谢；主要是跟着一个博客来实现的https://blog.csdn.net/ysc6688/article/category/2913009(也是基于opencv来做的，只不过他是用c++实现的)感谢

Java基于opencv实现图像数字识别(二)—基本流程