Augmenting Crowd-Sourced 3D Reco
086:**
Augmenting Crowd-Sourced 3D Reconstructions using Semantic Detections
使用语义检测扩充群体来源的3D重建
1.3D重建、SfM(由图像生成3维点云以及相机姿态)、和密集多视图立体声(MVS)
参考链接:http://www.sohu.com/a/254461246_715754
2.仅在单个视图中观察到的瞬态对象的放置和重建,估计场景的绝对尺度,以及恢复场景中的底层地面。提出了一种联合解决SfM剩余未决问题的方法,专注于检测个人图像中的人,并准确地将他们放入现有的3D模型中。根据对象语义估计场景的绝对比例,在这种情况下,对象语义构成了人口的高度分布。此外,我们获得了地面的平滑近似,并直接从个人检测中恢复了场景的重力矢量。
3.顶部:使用多视图立体声对静态场景元素进行密集但不完整的3D重建。底部:相同的视图,但是在场景中添加了纹理化的地面,并且在构造的输入图像中观察到了一部分行人。我们的方法共同恢复人的3D位置,场景的绝对尺度,景深的重力方向,以及地面的纹理和几何形状。此方法利用最近基于图像的人体检测的进展,以及人口高度分布先验,共同将检测到的人放入景深,估计绝对值重建的比例,恢复场景的重力矢量,并恢复底层地面。
4.主要运用于虚拟旅游,允许用户体验和探索他们可能无法访问的地方。通常从受控捕获场景(例如单个城市的航拍图像)开始,或者从地球上任何地方可视化场景,从互联网下载的公开可用照片。从该初始图像开始,通过Structure-from-Motion(SfM和密集多视图立体声(MVS)流水线获得3D模型。虚拟旅游的理想之处在于将用户可以探索的可导航环境(例如虚拟现实)中的这种重建呈现在偏远地区的“存在感”。
5.用于在大规模静态三维重建中添加生物瞬态元素。已经在大量真实数据集上测试并展示了定量和定性结果,以验证方法在难以捕获的元素建模方面的重大进展,对象类属性的知识,例如人类的高度分布,可以在无法准确对应的情况下对3D布局提供足够的约束。
6.作者是:True Price 、Johannes L. Sch¨onberger 美国