Transformer 在图像中的运用(二)TNT(Transf

2022-01-07  本文已影响0人  blackmanba_084b

基于上一篇文章说到的VIT(Transformers for Image Recognition at Scale)论文及代码解读
下面基于唐宇迪的视频简要说一下TNT模型。

TNT
其实说白了就是原来的切分的patch size比较大,所以这里就是将我们的patch size弄细一点。内部在原来的patch的基础上再嵌套一次Transformer image.png

参考:深度学习-Transformer实战系列(唐宇迪)

上一篇下一篇

猜你喜欢

热点阅读