论文笔记:Bottom-Up and Top-Down Atte

2018-07-19  本文已影响0人  会唱小星星吗

题目:Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

1.解决的问题

2.方法

​ 对于一个图片I ,提取出 k 个图片特征V=\{v_1,v_2,...,v_k\},v_i \epsilon R^D ,每一个特征代表图片得一个显著区域的编码,V​ 就可以看成是 bottom-up attention model 的输出,然后将这些用于top-down attention model,提取出对描述贡献大的显著性区域的特征。

3. Bottom-Up Attention Model

4.Captioning Model

two_lstm.png

4.1. Top-Down Attention LSTM

4.2. Language LSTM

5. VQA Model

VQA_Model.png

6. Result

result1.png result2.png

result3.png result4.png
上一篇 下一篇

猜你喜欢

热点阅读