深度学习·神经网络·计算机视觉机器学习和人工智能入门深度学习-推荐系统-CV-NLP

News |codes for AMeFu-Net (Dept

2021-05-13  本文已影响0人  与阳光共进早餐

我们开源了发表在ACM MM2020上的工作:

Depth Guided Adaptive Meta-Fusion Network for Few-shot Video Recognition

文章做的是few-shot video action recogniton的工作。

基于对视频中:
1)场景信息可以有效帮助识别动作信息
2)人类即使在场景发生一定程度的偏移的情况下也能较好识别视频动作信息

这两点发现,针对性地提出了:

1)基于adaptive instance normalization的DGAdaIn多模态融合模块,有效融合RGB信息和depth信息
2)temporal shift sampling操作,通过采取不完全匹配的RGB和depth视频片段作为训练数据,提升模型的鲁棒性。

欢迎大家关注我们的工作,非常感谢~

上一篇 下一篇

猜你喜欢

热点阅读