机器学习

主流的视频动作类算法任务介绍

2022-09-03  本文已影响0人  ce0b74704937

动作识别 (action recognition) 是对每个输入视频进行分类,识别出视频中人物做出的动作。即输入视频序列,得到视频对应的类别。

时序动作检测 (temporal action detection) 任务的输入是一个未经裁剪的视频 (untrimmed video),即在这个视频里有些帧是没有动作发生的,因此需要检测出动作开始和结束的区间,并判断区间内动作的类别。即输入未经裁剪的视频序列,得到动作出现的区间和对应的类别。

时空动作检测 (spatio-temporal action detection) : 相比于时序动作检测略有不同,时空动作检测不仅需要识别动作出现的区间和对应的类别,还要在空间范围内用一个包围框 (bounding box)标记出人物的空间位置。

时序动作分割(temporal action segmentation): 任务的输入是一个未经裁剪的视频,输出是视频中每一帧的动作类别。

上一篇下一篇

猜你喜欢

热点阅读