论文阅读：Re3 : Real-Time Recurrent R

2018-10-08 本文已影响74人涂山容容

华盛顿大学的paper 发表于IEEE Robotics and Automation Letters 1705挂载arxiv上，在目标跟踪上，对待缩放形变遮挡等的效果还是很不错的。代码在https://gitlab.com/danielgordon10/re3-tensorflow上。
本文提出了一个实时，循环，基于回归的目标跟踪器。该跟踪器是通用物体的，并且十分鲁棒，其速度为150fps,该方法是给定一个初始框，之后都跟踪这个初始框，和tracking by detection不是一个路子的。
现有的跟踪算法可以分为三类： online-trained 对新读入的每一张图都训练一个分类器（DSST） offline-trained 离线训练，在线的时候也不更新并不能接收新的讯息 hybrid 例如mdnet 本文提出的方法训练虽然是离线的，但是有利用到前面帧的信息来做判断。

pipeline:

在上一帧相同的位置两倍长宽的地方crop bounding box 这里的两倍为经验值然后将其resize 到227 然后输入到cnn中，然后把两个图片cnn的输出concatenate 起来再进入一个fc,再加一个fc是为了减少维度。 cnn里面还用了skip connections.

将cnn的输出作为lstm的输入，这里的lstm是一个两层的

之后将lstm的输出输入一个fc层，预测bbox的位置。

unrolling during training:
循环神经网络更难训练，这是由于输入的是时序。这里由于输入的是一对对的，所以 use a training curriculum that begins with few unrolls and slowly increase the time horizon that the network sees to teach it longer-term relationships.

论文阅读：Re3 : Real-Time Recurrent R

猜你喜欢

热点阅读