深度学习计算机视觉

卷积神经网络

2020-08-16  本文已影响0人  zidea
MachineLearninginMarketing

纹理

<img src="images/pattern_001.jpg">
我们要识别图片的内容,读取图片的信息,我们不但提取出图片中一些边缘的信息还需要识别出图案中纹理,这样我们才能准确获取图片的信息。

纹理表示方法

纹理是由一些基元按照一定形式组合而成,所谓纹理基元就是在图片中重复出现的最小单元的图案。

基于卷积核组的纹理表示方法

有关图片纹理我们还可以引入一些统计学的概念,也就是不但通过基元,而且通过统计学信息描述这些基元如何组合在一起。

卷积核组

<img src="images/kernel_group.png">
我们把这样 7 卷积核放在一起就是卷积核组,我们现在第一个卷积核看起,这个卷积核应该是高斯偏导核,用于检测水平的边,前 6 卷积核是用于检测不同方向的边,而最后一个用于检测图片上是否有圆形图案。

<img src="images/kernel_detect_circle.png">
<img src="images/kernel_detect_hline.png">

基于卷积核组的图像表示

那么我们是如何用卷积核提取图案信息来表示图像呢,首先我们用卷积核组每一个卷积核去扫描图片得到对应响应图,卷积核下方对应的图,然后将这个响应图用一个向量来表示,也就是将图片矩阵展平,如100 \times 100大小的响应图展平就是 10000 维的向量(r_{11}),然后在将这些向量组合就得到基于卷积核组的图像表示。

r_1 = \left[ r_{11}, r_{12},\cdots,r_{1\times n} \right]

纹理分类任务

接下来介绍一种更简单表示方式,因为基元位置与分类关系不大,也就是对分类没有什么影响。所以我们在用纹理表示图片没有必要记录位置信息。

\overline{r_i}i个特征响应图的均值

卷积核组设计

每一个卷积核描述一种结构。

上一篇下一篇

猜你喜欢

热点阅读