生物医学图像语义分割(二)U-Net
2017-07-25 本文已影响2907人
Efackw13
Index
- Introduction
- Analysis
- Architecture
- Data Augmentation
- Other tricks
- Results
Introduction
相对ImageNet等通用数据集,医学图像数据集较小。如何在小数据集情况下训练出一个好的模型,是深度学习在医学图像方面的一个难点。
本文介绍了U-Net,源自2015年的一篇文章<U-Net: Convolutional Networks for Biomedical Image Segmentation>。
该文章提出的U-Net在ISBI 2015 Cell Tracking Challenge取得了第一。在该任务中,训练集中只有30幅512x512果蝇第一龄幼虫腹神经(VNC)的电镜图像。
本文应用了前一章<生物医学图像语义分割(一)FCN>中的方法,提出了U-Net。为了充分利用数据,文章中还采用了Data Augmentation的方法扩充数据集。此外,文章中有许多技巧可以应用在小数据集情况中。
Analysis
Architecture
U-netU-Net结构如上图。
U-Net运用了与FCN相同的技巧,将浅层特征图与深层特征图结合(图中copy and crop箭头),这样可以结合局部“where”以及全局“what”的特征,生成更精准的图像。U-Net并不像FCN将特征相加,而是concatenate生成双倍通道的特征图,再卷积。
Data Augmentation
由于本次任务是关于电镜图像下的语义分割,因此主要的挑战之一就是细胞或者组织的形状变化。考虑到这个因素,文章主要将训练集图像变形以产生更多训练图像,来达到扩充数据集的效果。文章将训练图片分格子,然后采用符合高斯分布的变形向量来变形。然后,使用双三次插值来填充变形造成的分辨率降低的问题。
Other tricks
- Overlap-tile strategy
由于这个算法中,图片边缘(黄色框)需要蓝色框内的图像来计算。为了达到更好的识别效果,文章还采用了Overlap-tile的技巧,将图像边缘进行一定的镜像复制生成边缘图像,这样边缘的识别效果会更好。
- Weights initialization
权值初始化在深度学习中十分重要。随着网络变深存在梯度消失的问题,此时深层的网络参数很难得到有效训练。此时,某些卷积层可能会有特别多的激活,而另一些卷积层可能对网络没有贡献。因此,权值的初始化好坏程度会影响最终模型效果以及训练时间。理想的权值初始化是使得网络中的每一个特征图方差都接近1。
在U-Net中,可以通过高斯分布随机生成权值,高斯分布的均方差为(2/N)^0.5,其中N为上一层的参数数量。