CVPR 2019 FAIR检测挑战赛冠军算法开源代码PySlo

2020-01-07  本文已影响0人  图像算法

近年来的视频理解研究中,Facebook人工智能研究作出了很多贡献。其视频团队不仅在CVPR、ICCV等会议上发表了多项视频研究工作,还高居主要数据集榜首,并赢得了2019年CVPR行为检测挑战赛。现在,它的团队已经在ICCV研讨会上开放了视频识别检测代码库:PySlowFast,并且还发布了一个预先训练过的模型库。该团队表示,他们的目标是推进视频理解领域的研究,同时将其前沿工作实时添加到代码库中。

Facebook AI Research(FAIR)发布了许多关于CVPR的研究工作,并赢得了CVPR 2019行为检测挑战赛。

介绍

PySlowfast是一个基于Pythorch的代码库,它允许研究人员轻松地从基础到尖端复制视频分类和动作检测算法。

不仅如此,PySlowFast的代码库还开放了大量的pretrain模型,让研究人员省去了重复训练模型的麻烦,直接使用了FAIR预先训练的尖端性能模型。

自开源以来,PySlowFast一直在GitHub趋势排名前十。

根据提供的教程和开源代码库的信息,PySlowFast不仅可以为视频理解提供一个基线模型,还可以提供当今最前沿的视频理解算法的复制。

其算法不仅包括视频分类,还包括动作分类算法。与当今开源社区中各种视频识别库的性能参差不齐相比,使用PySlowFast可以轻松重现当今的前沿模型。

视频识别(Kinetics)

行为检测(AVA)

PySlowFast在视频分类数据库dynamics 400上的性能

PySlowFast不仅可以用于视频分类,还可以用于视频理解,并提供视频检测模型,赢得2019年CVPR ActivityNet挑战赛冠军。

PySlowFast的目标是提供高性能,轻量级的pytorch代码库,提供最新的视频主干,以用于对不同任务(分类,检测等)的视频理解研究。它旨在支持快速实施和评估新颖的视频研究思想。PySlowFast包括以下骨干网络体系结构的实现:

SlowFast

SlowOnly

C2D

I3D

Non-local Network

PySlowFast使用论文有:SlowFast Networks for Video Recognition", 和"Non-local Neural Networks"。

结论

SlowFast是一种对比该轴速度的体系结构设计,它实现了视频动作分类和检测的最新准确性。作者希望这种SlowFast概念将促进视频识别的进一步研究。

论文地址或源码下载地址:关注“图像算法”微信公众号 回复"PySlowFast"

上一篇下一篇

猜你喜欢

热点阅读