Artificial IntelligenceVR虚拟现实视觉三维重建

三维重建综述

2016-07-11  本文已影响5564人  羲牧

原文地址AC4Fun.com, 转载请注明出处~,谢谢

背景

应用

方法介绍

传统的三维重建主要是依靠昂贵的三维扫描设备,并且需要被扫描的目标保持一段时间的稳定。近年来,由于计算机硬件大规模计算能力的发展,特别是GPU和分布式计算的发展,实时高效的解决方案成为了可能。目前主流的方法主要分为以下两类:

基于深度相机的三维重建

深度相机

原理 主要有以下三种:

主要设备有Kinect, ASUS Xtion PRO等

Kinect 1代与kinect 2代比较

目前基于深度相机进行三维重建的工作有很多,最经典的应该属微软剑桥研究院的Kinect Fusion, 2011, 微软有自己的SDK, 注意一代和二代的原理有很大的不同,分别下载对应的SDK,目前对Kinect 2代的支持还不是特别好,它对硬件也有一定的要求(特别是USB3.0接口):

Kinect SDK2.0 System Requirements.png
当然,开源社区也有许多基于Kinect Fusion的开源实现,如由PCL团队开发的KinFu,论文在这里。高通公司nullspace的开源项目kfusion, 但是个人觉得目前效果最好的,应该要属Kintinuous,Real-time large scale dense visual SLAM system了。不过Kintinuous对kinect 2代的支持效果还不好,目前Kinect 1代和华硕的Xtion支持比较好(可能和他们都是PrimeSense的TOF原理有关吧)

基于图像的三维重建(3D Reconstruction from multiple Images)

关键点 实时要求/室内场景/大范围场景/点云精确度要求
由于基于深度相机(RGB-D)会受到红外距离的限制,如kinect支持的距离为0.5-5m,而且容易产生空洞(holes),所以比较适合室内场景,目前应用最多的是机器人Visual SLAM方面。但是从三维重建的实际应用角度来看,不够方便(主要是Kinect需要使用外接电源,而且需要连接电脑),目前工业界用的最多的方法应该是基于图像的三维几何重建了,其主要步骤包括局部特征匹配Structure-from-Motion, Multi-View StereoSurface ReconstructionSurface Texturing 等。
这种方法主要需要解决的问题是判断相机的姿态(位置和方向),这点和Visual SLAM比较类似。

立体视觉的核心问题
通过对照片特征的检测与匹配,得到相机的姿态,并计算出稀疏的场景三维点云。

目前比较好的算法主要有:

目前已知的研究小组有:#

百度深度学习研究院
中科院自动化所模式识别国重机器视觉课题组
美国明德学院(Middlebury college)
香港科技大学
德国达姆施塔特工业大学MVE
OpenMVG

相关人物
王亮
章国峰

一些资料收藏

深度数据RGBD集合

参考文献#

3D Photography Gallery
wedidstuff

基于图像的三维重建是我的研究重点,接下来将会对具体的技术,如特征提取算法,稀疏重建,立体匹配与重建,表面重建等分别说明。

如果上面有什么不对的地方,欢迎大家指教。

上一篇下一篇

猜你喜欢

热点阅读