机器学习与数据挖掘人工智能/模式识别/机器学习精华专题深度学习-推荐系统-CV-NLP

论文 | 人体三维重建论文解读《Convolutional Me

2019-05-12  本文已影响6人  与阳光共进早餐

一 写在前面

未经允许,不得转载,谢谢~~~

这篇论文主要是将如何通过GCN网络实现人体从单张图像到3D mesh的重建过程的。

二 主要内容

2.1 motivation

1. 任务难

从单张图像重建出三维模型这个过程本身就很难,主要有以下几点:

2. 之前的方法

而在基于学习的方法里大多数研究的是基于什么模态进行学习,例如:

但是大多数的模型都是用SMPL(非常经典的做人体重建的一篇文章)的参数化表示方法作为回归目标,这一点在作者看来是非常self-constraint的。

2.2 related work

2.2 本文工作

  1. 用了一个更加混合的学习方式,保留了SMPL的模板mesh,但是并没有直接回归SMPL的模型参数,而是通过回归模板mesh上的各个点坐标来达到生成想要的人体模型的效果。
  2. 考虑到人体需要有很多的点来表示,所以用GCN网络。
  3. 具体从image到mesh的变换学习过程如下所示:


主要的pipeline为:

三 具体实现

3.1 image-based CNN 图像特征提取网络

3.2 GCN 图卷积神经网络

本文的一个核心就是用GCN来回归mesh的各个顶点的坐标,前文所述的将二维图像特征合并到三维人体的各个顶点上去之后的迭代学习的过程就是通过GCN来实现的。

1. GCN
对于GCN,理解一下这个表示:

这个操作其实等价于对每个顶点都做一个fc操作,然后再对相邻的顶点之间进行一次avg pooling的操作。这里avg pool的作用的可以保证相邻节点之间的平滑性,这样在loss设计的时候就不需要额外去考虑这个因素。

[未验证]体现在具体实现上应该就是先对输入X做一次fc(参数为W),然后再对邻居节点(通过A~确定)做一次avg pooling;

2. 残差结构
文章还使用残差结构来加快U型你连过程呢个,并得到质量更好的结果。

文中描述:基本的残差块结构与残差网络中的类似,做了如下改进:

3. 其他
除了用GCN回归了mesh的顶点坐标,还回归到了相机的参数:

3.3 network training 模型训练过程

1. ground truth

2.模型预测结果

3.loss计算
根据上述提到的3D形状及对应的2D关节点,分别构成两部分的loss:

四 datasets 数据集

五 写在最后

有机会要跑一下源码~


最后跑个题,我爱麻麻,最大的愿望就是家人一切都好,也祝所有的天下母亲节日快乐ヾ(°∇°)ノ゙

上一篇 下一篇

猜你喜欢

热点阅读