姿态估计
https://marcovaldong.github.io/2017/12/31/%E8%AE%BA%E6%96%87%E9%98%85%E8%AF%BB%EF%BC%9ARealTime-Multi-Person-2D-Pose-Estimation-using-Part-Affinity-Fields/
作者:张晓
链接:https://www.zhihu.com/question/63159179/answer/206158785
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
二维图像姿态估计基于cnn的单人姿态估计方法
2014 deep pose 直接回归关节的坐标
2015 flow convnet 回归heatmap,间接得到坐标
2016 很多方法了 CPM,hourglass, 以及一票改结构的方法
2017 依旧改结构,感觉很无趣,xiaogang组的wei wang和xiao chu基于hourglass改的一个网络目前是第一,91.5%
总体感觉,单人姿态估计领域被cnn占领的差不多啦,cpm这个模型的鲁棒性相当好,遮挡很多都能推断出来,真的让人很震惊。
---------------------分割线-----------------
基于cnn的多人姿态估计方法
多人估计方法一般分为两大类,即自顶向下和自底向上,其中自顶向下是指先把人框出来,然后再用单人的方法去定位人的关节,而自底向上的方法是先把所有关节位置弄出来,然后再区分关节属于谁。
2016 mpii的deep cut和deeper cut
2017 part affine field方法,cmu的,效果很赞。目前开源的就是这个方法,openpose。
-----------------------------------------
说说目前姿态估计的面临的一些问题
(1)遮挡问题,这个问题恐怕是最难的,也是必须要解决的
(2)速度过慢,当前的所有方法,都是需要像titanx才能做到准实时的,15fps,说白了,距离实用还是有一段距离,不过不远了。
(3)仅仅有二维的姿态是不够的,目前也有这一类的研究,关于直接从2d到3d的姿态进行直接估计。这一点才是未来的趋势。
有空再更。