TensorFlow卷积函数tf.nn.conv2d
2019-01-21 本文已影响0人
PanDong
tf.nn.conv2d
在TensorFlow中使用tf.nn.conv2d实现卷积操作,其格式如下:
tf.nn.conv2d(
input,
filter,
strides,
padding,
use_cudnn_on_gpu=True,
data_format='NHWC',
dilations=[1, 1, 1, 1],
name=None
)
Returns:
A Tensor.
input:
指需要做卷积的输入图像(tensor),具有[batch,in_height,in_width,in_channels]这样的4维shape,分别是图片数量、图片高度、图片宽度、图片通道数,数据类型为float32或float64。
filter:
相当于CNN中的卷积核,它是一个tensor,shape是[filter_height,filter_width,in_channels,out_channels]:滤波器高度、宽度、图像通道数、滤波器个数,数据类型和input相同。
strides:
卷积在每一维的步长,一般为一个一维向量,长度为4,一般为[1,stride,stride,1]。
padding:
定义元素边框和元素内容之间的空间,只能是‘SAME’(边缘填充)或者‘VALID’(边缘不填充)。
return:
返回值是Tensor
例子
例1(1个通道1个输出)
假设我们用一个5*5的矩阵来模拟图片,定义一个2*2点的卷积核
例1import tensorflow as tf
input = tf.Variable(tf.constant(1.0, shape=[1, 5, 5, 1]))
filter = tf.Variable(tf.constant([-1.0, 0, 0, -1], shape=[2, 2, 1, 1]))
op = tf.nn.conv2d(input, filter, strides=[1, 2, 2, 1], padding='SAME')
init = tf.global_variables_initializer()
with tf.Session() as sess:
sess.run(init)
print("op:\n",sess.run(op))
输出如下:
op:
[[[[-2.]
[-2.]
[-1.]][[-2.]
[-2.]
[-1.]][[-1.]
[-1.]
[-1.]]]]
实际过程就是:
padding='SAME',这种情况tensorflow会先在边侧补0(优先右侧和下方),然后经过卷积操作得到结果。
例2(1个通道3个输出)
我们用三个filter来创造三个输出:
多通道
import tensorflow as tf
input = tf.Variable(tf.constant(1.0, shape=[1, 5, 5, 1]))
raw = tf.Variable(tf.constant([-1.0, 0, 0, -1], shape=[2, 2, 1, 1]))
filter=tf.tile(raw,[1,1,1,3])
op=tf.nn.conv2d(input,filter, strides=[1, 2, 2, 1], padding='SAME')
init = tf.global_variables_initializer()
with tf.Session() as sess:
sess.run(init)
print("op:\n",sess.run(op))
输出结果:
output三个filter相同,输出了三个相同的结果(按列看)
例3(2个通道2个输出)
例3.png代码:
import tensorflow as tf
input = tf.Variable(tf.constant(1.0, shape=[1, 3, 3, 2]))
raw = tf.Variable(tf.constant([-1, 9.0, 0, 0,0,0,1,0], shape=[2, 2, 2, 1]))
filter=tf.tile(raw,[1,1,1,2])
op=tf.nn.conv2d(input,filter, strides=[1, 2, 2, 1], padding='SAME')
init = tf.global_variables_initializer()
with tf.Session() as sess:
sess.run(init)
print(sess.run(filter))
print("\nop:\n",sess.run(op))
输出结果:
filter:
filter.png这是两个filter,红框就是一个卷积核,绿框黄框分别对应着两个通道。
卷积结果:
output.png
输出就是两个2x2的矩阵。