论文阅读:Fast Point R-CNN
2020-01-04 本文已影响0人
Allen的光影天地
1. introduction部分
首先介绍传统的CNN面向图像数据来源,但是针对点云做深度学习在无人驾驶,机器人等领域是很有必要的。
然后说点云,太稀疏,奇异性大,不好直接做。那么有一种比较流行的处理手段就是:volumetric 体素化。 但是volumetric又有计算量太大的缺点。那么就有两种处理手段:
- use coarse grid: 粗的栅格化处理。这种方法的问题:无法利用fine-grained 的信息
- process point cloud directly for 3D object recognition:直接做处理。但是:笔者认为,即使这样,对于large-scale point cloud 仍然太重了
贡献
设计了一个两层3D object detection framework. 同时利用点云和voxel信息。
第一层网络叫VoxelRPN:直接面向voxel
第二层: 轻量的pointNet进一步提炼。第一层提供一个初始值。使用attention mechanism 将interior point coor 与 卷积特征 有效融合。这使得每个点附带周围环境信息。
三大贡献2. related work
1. 三维空间信息表示
整体来说就是两种: 1. 体素格子 2. 直接点云表示
2. 3D Object Detection
文章框架数据流图 VoxelRPN RefinerNet