计算机视觉基础
2018-04-24 本文已影响0人
萧风萧雨
计算机视觉基础
1. 基本概念
矩阵
图像是由一个二维,每个值对应图片的像素值;也可是三维矩阵,第三个维度是通道,如RGB三个通道。
颜色模式
熟知的RGB,用于打印的LMYK, 基于生理的LAB等。
分辨率
图像的像素大小;高分辨率的越清晰
表达
每个像素值用m-bit表示,比如8位能表示0-255。位数越大表示范围越大。
2. 卷积操作
如果知道卷积神经网络CNN的应该都知道这个的了。
一维卷积

g为卷积核,f为原数据
举个例子:
当f=[1, 2, 3], g=[2, 3, 1]时,

最终s=[1, 7, 13, 11, 3]
二维卷积

关于这个网上已经有很多说明了,这里就不举例了。
连续时

连续变量时其实也是对应值的相乘,卷积核不断的移动对原函数做卷积操作
3. Linear Time-invariant 线性时不变
卷积操作是一个线性时不变的操作。具体就是
- 输入延迟t,输出延迟t;
- 输入增大L倍,输出也会增大L倍;
- 线性操作和时不变互不影响,即先延迟后增大等同于先增大后延迟。
卷积有提取特征的作用,用老师的话就是nature。