Deep Progressive Reinforcement L

2019-03-05  本文已影响0人  纳尔biabia

motivation

方法

定义问题的决策链

State and Action

State

  1. 针对选关键帧这个MDP问题,状态S可以表示为: {Sa,Sb}
  2. Sa=[F,M] 也是由两部分组成的。F表示整个视频的信息, 它张量的形状为:f×N×3。 其中f表示视频的所有帧数,N表示每一帧中的骨架模型的节点数,3表示每一个骨架节点的3D坐标。
  3. M就表示所有被提取的关键帧信息,用一个形如m×N×3的张量表示,其中m表示关键帧的数目.
    4.Sb one-hot, 它对应到整个视频的每一帧,如果对应的元素值为1,那么说明该帧被提取为关键帧,其余则为0

Action

action的动作由FDNet输出
action的定义比较简单:
1.帧向左移动
2.帧向右移动
3.帧保持不动


上一篇 下一篇

猜你喜欢

热点阅读