CV论文NAS

NEURAL ARCHITECTURE SEARCH WITH

2019-10-21  本文已影响0人  FantDing

论文原文

Abstract

idea

achievments

Introduction

idea

image

achivement

Related Work

前人工作缺点

相似工作

Methods

使用RNN Controller生成model descriptions

一个简单的RNN Controller示例

Training with reinforce

介绍如何更新RNN Controller的参数

公式推导

J(\theta_c)=E_{P(a_1:T;\theta_c)}[R] \tag{1.1}
关于(1.1)的解释,在相同的RNN Controller参数\theta_c下,每个时步t下执行的动作a_t是不同的(按照softmax采样的),因此产生的网络结构a_{1:T}也是不同的,得到的精度R也不同,因此需要求R的期望,即(1.1). 后续令a_{1:T}=\tau,则:

J(\theta_c)=E_{\tau \sim P_{\theta_c}}[R] =\int p_{\theta_c}(\tau)*R \tag{1.2}
(1.2)对(1.1)重写, 下面对\theta_c求导:

image

下面对上式中\bigtriangledown_{\theta}logP_{\theta_c}(\tau)进行计算:
因为:

image
所以:
image

带入到绿色公式可以得到,即为文章中
[站外图片上传中...(image-b8ba6d-1571643802815)]

并行异步更新

用来加速RNN Controller的学习。没搞懂,暂且放着[1]

添加Skip Connections and Other Layer Types

添加Skip Connections和branching layer

添加其他类型layers

pooling, batchnorm, 甚至是Learning rate

Generate RNN Cell Architectures

本节介绍如何用本文方法生成RNN Cell。即不仅对CNN结构搜索有效,对RNN也同样能够进行搜索

右边是例子的计算图

实验和结果

CNN for cifar10

搜索到的4个网络

RNN for PENN TREEBANK

RNN部分暂且不看

角注


  1. 待看

  2. 待看

  3. grid search怎么做?

  4. what

上一篇 下一篇

猜你喜欢

热点阅读