Alexnet
Alexnet是一年一度的ImageNet大型视觉识别挑战赛(ILSVRC)2012年冠军,ILSVRC使用ImageNet的一个子集,分为1000种类别,每种类别中都有大约1000张图像,大约有120万张训练图像,50,000张验证图像和150,000张测试图像。 Alexnet共有600000000训练参数和650000神经元。
![](https://img.haomeiwen.com/i8043545/8cf27710db09ee56.png)
基本结构
卷积层:5层
全连接层:3层
深度:8层
参数个数:60M
神经元个数:650k
分类数目:1000类
![](https://img.haomeiwen.com/i8043545/ef8750045dbbc5e1.png)
![](https://img.haomeiwen.com/i8043545/220b584cc6c20774.png)
Conv1:
输入图像规格:2242243 padding之后为2272273
Kernel size: 11113 stride:4 num_output:96
New_feture_size=(img_size-filter_size)/stride+1
(227-11)/4+1=55
输出:555596(290400)
激活函数Relu以后输出的还是555596
Maxpooling:kernel size:33 stride:2
(55-3)/2+1=27
输出:272796
局部相应归一化后输出的还是272796,分为两组,
每组分别为(272748)
训练参数:9611113=34848
![](https://img.haomeiwen.com/i8043545/a5b1373e6d9e6ccc.png)
Conv2:
输入图像规格:272796 padding:2
Kernel size:5548 stride:1 num_output:256
(27-5+22)/1+1=27
输出:两组2727128
激活函数Relu以后输出的还是2727128
Maxpooling:kernel size:33 stride:2
(27-3)/2+1=13
输出:两组1313128
归一化后输出的还是两组1313128
训练参数:25655*48=307200
![](https://img.haomeiwen.com/i8043545/20d091f62629dd6d.png)
Conv3:
输入规格:两组1313128 padding:1
Kernel size:33256 stride:1 num_output:192
(13-3+12)/1+1=13
输出:两组1313192
通过激活函数还是输出:两组1313192
训练参数:38433256=884736
![](https://img.haomeiwen.com/i8043545/42803de9eddcee3b.png)
Conv4:
输入规格:两组1313192 padding:1
Kernel size:33192 stride:1 num_output:192
(13-3+12)/1+1=13
输出:两组1313192
通过激活函数还是输出:两组1313192
训练参数:38433192=663552
![](https://img.haomeiwen.com/i8043545/f3462ab4dc7b064a.png)
Conv5:
输入规格:两组1313192 padding:1
Kernel size:33192 stride:1 num_output:128
(13-3+12)/1+1=13
输出:两组1313128
通过激活函数还是输出:两组1313128
Pooling:kernel size:33 stride:2
(13-3)/2+1=6
输出:两组66128
训练参数:25633*192=442368
![](https://img.haomeiwen.com/i8043545/14507db90e13c23d.png)
FC6 全连接层:
输入规格:两组66128
Kernel size:66256
通过4096个神经元输出运算结果,这4096个运算结果通过relu激活函数生成4096个值,并通过drop运算后输出4096个本层结果
dropout:通过定义的概率来随机删除一些神经元,同时保持输入层与输出层神经元不变
训练参数:409666*256=37748736
![](https://img.haomeiwen.com/i8043545/34700b8f999c640c.png)
FC7:第六层输出的4096个数据与第七层的4096个神经元进行全连接,
然后经由relu7进行处理后生成4096个数据,
再经过dropout7处理后输出4096个数据。
训练参数:4096*4096=16777216
![](https://img.haomeiwen.com/i8043545/96d7a7a4a07f7d40.png)
FC8:第七层输出的4096个数据与第八层的1000个神经元进行全连接
训练参数:4096*1000=4096000
![](https://img.haomeiwen.com/i8043545/aab30277e68f0731.png)