计算机视觉基础

2018-04-24  本文已影响0人  萧风萧雨

计算机视觉基础

1. 基本概念

矩阵

图像是由一个二维,每个值对应图片的像素值;也可是三维矩阵,第三个维度是通道,如RGB三个通道。

颜色模式

熟知的RGB,用于打印的LMYK, 基于生理的LAB等。

分辨率

图像的像素大小;高分辨率的越清晰

表达

每个像素值用m-bit表示,比如8位能表示0-255。位数越大表示范围越大。

2. 卷积操作

如果知道卷积神经网络CNN的应该都知道这个的了。

一维卷积


g为卷积核,f为原数据
举个例子:
当f=[1, 2, 3], g=[2, 3, 1]时,



最终s=[1, 7, 13, 11, 3]

二维卷积


关于这个网上已经有很多说明了,这里就不举例了。

连续时


连续变量时其实也是对应值的相乘,卷积核不断的移动对原函数做卷积操作


3. Linear Time-invariant 线性时不变

卷积操作是一个线性时不变的操作。具体就是

  1. 输入延迟t,输出延迟t;
  2. 输入增大L倍,输出也会增大L倍;
  3. 线性操作和时不变互不影响,即先延迟后增大等同于先增大后延迟。
    卷积有提取特征的作用,用老师的话就是nature。
上一篇 下一篇

猜你喜欢

热点阅读