卷积神经网络
2020-08-16 本文已影响0人
zidea
MachineLearninginMarketing
纹理
<img src="images/pattern_001.jpg">
我们要识别图片的内容,读取图片的信息,我们不但提取出图片中一些边缘的信息还需要识别出图案中纹理,这样我们才能准确获取图片的信息。
纹理表示方法
纹理是由一些基元按照一定形式组合而成,所谓纹理基元就是在图片中重复出现的最小单元的图案。
- 规则纹理
<img src="images/tile_pattern.jpg"> - 随机纹理
<img src="images/beer_pattern.jpeg">
基于卷积核组的纹理表示方法
有关图片纹理我们还可以引入一些统计学的概念,也就是不但通过基元,而且通过统计学信息描述这些基元如何组合在一起。
- 利用卷积核组提取图像中的纹理基
- 利用基元的统计信息来表示图像的纹理
卷积核组
<img src="images/kernel_group.png">
我们把这样 7 卷积核放在一起就是卷积核组,我们现在第一个卷积核看起,这个卷积核应该是高斯偏导核,用于检测水平的边,前 6 卷积核是用于检测不同方向的边,而最后一个用于检测图片上是否有圆形图案。
<img src="images/kernel_detect_circle.png">
<img src="images/kernel_detect_hline.png">
基于卷积核组的图像表示
- 设计卷积核组
- 利用卷积核组对图像进行卷积操作获取对应的特征响应图组
- 利用特征响应图的某种统计信息来表示图像中的纹理
<img src="images/kernel_grp_presentation.png">
那么我们是如何用卷积核提取图案信息来表示图像呢,首先我们用卷积核组每一个卷积核去扫描图片得到对应响应图,卷积核下方对应的图,然后将这个响应图用一个向量来表示,也就是将图片矩阵展平,如大小的响应图展平就是 10000 维的向量,然后在将这些向量组合就得到基于卷积核组的图像表示。
- 表示第一个特征图展开的向量
- 表示第 1 个特征图上第 n 个位置的响应值
纹理分类任务
接下来介绍一种更简单表示方式,因为基元位置与分类关系不大,也就是对分类没有什么影响。所以我们在用纹理表示图片没有必要记录位置信息。
- 基元位置无关
- 关注出现了哪种基元对应的纹理以及基元出现的频率
好基于上面内容,我们可以用每一个响应图所有值平均值的组合来表示图像
<img src="images/kernel_grp_presentation_2.png">
第个特征响应图的均值
卷积核组设计
每一个卷积核描述一种结构。
- 卷积核类型(边缘、条形以及点状)
- 卷积核尺度(3-6个尺度)
- 卷积核方向(6个角度)