CVPR 2019 FAIR检测挑战赛冠军算法开源代码PySlo
近年来的视频理解研究中,Facebook人工智能研究作出了很多贡献。其视频团队不仅在CVPR、ICCV等会议上发表了多项视频研究工作,还高居主要数据集榜首,并赢得了2019年CVPR行为检测挑战赛。现在,它的团队已经在ICCV研讨会上开放了视频识别检测代码库:PySlowFast,并且还发布了一个预先训练过的模型库。该团队表示,他们的目标是推进视频理解领域的研究,同时将其前沿工作实时添加到代码库中。
Facebook AI Research(FAIR)发布了许多关于CVPR的研究工作,并赢得了CVPR 2019行为检测挑战赛。
介绍
PySlowfast是一个基于Pythorch的代码库,它允许研究人员轻松地从基础到尖端复制视频分类和动作检测算法。
不仅如此,PySlowFast的代码库还开放了大量的pretrain模型,让研究人员省去了重复训练模型的麻烦,直接使用了FAIR预先训练的尖端性能模型。
自开源以来,PySlowFast一直在GitHub趋势排名前十。
根据提供的教程和开源代码库的信息,PySlowFast不仅可以为视频理解提供一个基线模型,还可以提供当今最前沿的视频理解算法的复制。
其算法不仅包括视频分类,还包括动作分类算法。与当今开源社区中各种视频识别库的性能参差不齐相比,使用PySlowFast可以轻松重现当今的前沿模型。
视频识别(Kinetics)
行为检测(AVA)
PySlowFast在视频分类数据库dynamics 400上的性能
PySlowFast不仅可以用于视频分类,还可以用于视频理解,并提供视频检测模型,赢得2019年CVPR ActivityNet挑战赛冠军。
PySlowFast的目标是提供高性能,轻量级的pytorch代码库,提供最新的视频主干,以用于对不同任务(分类,检测等)的视频理解研究。它旨在支持快速实施和评估新颖的视频研究思想。PySlowFast包括以下骨干网络体系结构的实现:
SlowFast
SlowOnly
C2D
I3D
Non-local Network
PySlowFast使用论文有:SlowFast Networks for Video Recognition", 和"Non-local Neural Networks"。
结论
SlowFast是一种对比该轴速度的体系结构设计,它实现了视频动作分类和检测的最新准确性。作者希望这种SlowFast概念将促进视频识别的进一步研究。
论文地址或源码下载地址:关注“图像算法”微信公众号 回复"PySlowFast"