Be Your Own Teacher: Improve the

2020-04-02  本文已影响0人  晴窗细语

自蒸馏整体网络结构:


network

其中,bottleneck可减轻每个浅分类器之间的影响,添加teacher隐藏层L2 loss,并且使teacher与student网络feature map输出大小一致。

三个损失函数:

总体损失:

loss
C表示CNN中分类器个数


其中,最深分类器的λ和α为零,即最深分类器的监督仅来自标签。

注意

上一篇 下一篇

猜你喜欢

热点阅读