Distilling the Knowledge in a Ne

2017-10-18  本文已影响63人  信步闲庭v

Approach

训练和部署阶段采用不同的模型形态,可以类比于自然界中很多昆虫有多种形态以适应不同阶段的需求。具体地,如蝴蝶在幼虫以蛹的形式存储能量和营养来更好的发育,但是到了后期就为了更好的繁殖和移动它就呈现了另外一种完全不一样的形态。这种方法可以称为知识蒸馏,又叫孪生网络。

所谓模型蒸馏就是将训练好的复杂模型推广能力“知识”迁移到一个结构更为简单的网络中。或者通过简单的网络去学习复杂模型中“知识”。大致可以分为两个阶段:

  1. 原始模型训练:
  1. 精简模型训练:

Experiment

References:
https://zhuanlan.zhihu.com/p/24337627

上一篇下一篇

猜你喜欢

热点阅读