计算机视觉笔记

RGB-D语义分割结果汇总

2019-04-15  本文已影响50人  挺老实

1 语义分割常用指标

(1)像素准确率(pixel accuracy, PA):分割正确的像素总量除以像素总数。
(2)平均像素准确率(mean pixel accuracy, MPA):对每个类计算PA,然后对所有类的PA求平均
(3)平均IOU(Mean Intersection over Union, MIOU ):对每个类计算真值与预测值的交并比(IOU),然后对所有类别的IOU求平均值
(4)频权交并比(Frequency Weighted Intersection over Union, FWIoU):对MIOU的改进,根据每个类出现的频率为其设置权重。

2 RGB-D语义分割数据库

(1)NYUDv2 dataset : 共有1449对密集标注的RGB-D图像,其中795对作为训练集,654对作为测试集,共40个类。
(2)SUN RGB-D dataset :共10335对标注图像,5285对作为训练集, 5050对作为测试集, 共38个类。

3 结果汇总

NYUDv2 SUN RGB -D
PA MPA MIOU FWIOU PA MPA MIOU FWIOU 训练尺寸 干网络 时间 发表于 备注
RedNet[1] - - - - 81.3 60.3 47.8 - 480x640 ResNet-50 2018 arxiv
RedNet[1] - - - - 81.3 60.3 47.8 - 480x640 ResNet-50 2018 arxiv
D-Refine-152[2] 74.1 59.5 47.0 - 80.8 58.9 46.3 - - resnet 2018 ICPR
SCN[3] - - 49.6 - - - 50.7 - resnet152 2018 IEEE TRANSACTIONS ON CYBERNETICS
LS_deconvNet[4] 71.9 60.7 45.9 59.3 - 58.0 - 417 × 417 Deeplab 2017 CVPR2017

参考文献


  1. RedNet: Residual Encoder-Decoder Network for indoor RGB-D Semantic Segmentation, 2018

  2. Depth-assisted_RefineNet_for_Indoor_Semantic_Segmentation,2018

  3. SCN: Switchable Context Network for Semantic Segmentation of RGB-D Images, 2018

  4. Locality-Sensitive Deconvolution Networks with Gated Fusion for RGB-D Indoor Semantic Segmentation,2017

上一篇 下一篇

猜你喜欢

热点阅读