利用CNN(卷积神经网络)来进行训练的一些概念

2019-02-22  本文已影响0人  依然的雨田

一、CNN中重要概念

加入stride后卷积图像大小的通用计算公式为:
输入图像:n*n,过滤器:f*f步长:s,padding:p
输出图像大小为:⌊(n+2p−fs+1))⌋∗⌊(n+2p−fs+1)⌋⌊(n+2p−fs+1))⌋∗⌊(n+2p−fs+1)⌋,⌊⌋⌊⌋表示向下取整
以输入图像7*7,过滤器3*3,步长为2,padding模式为valid为例输出图像大小为:⌊(7+2∗0−32+1)⌋∗⌊7+2∗0−32+1)⌋=3∗3

tensorflow中自带的卷积操作代码定义:
https://tensorflow.google.cn/api_docs/python/tf/nn/conv2d

tf.nn.conv2d(
    input,
    filter,
    strides,
    padding,
    use_cudnn_on_gpu=True,
    data_format='NHWC',
    dilations=[1, 1, 1, 1],
    name=None
)

padding的两种模式:
Valid:no padding
输入图像nn,过滤器ff,输出图像大小为:(n−f+1)∗(n−f+1)
Same:输出图像和输入图像一样大
参考:
1、CSDN:https://blog.csdn.net/ice_actor/article/details/78648780
2、简书:https://www.jianshu.com/p/5c1f9b28b01e

欠拟合和过拟合应该怎么办?
过拟合:L2正则化,加入正则化 λ 来完善成本函数, λ 越大,w就被压缩的越小。

上一篇 下一篇

猜你喜欢

热点阅读