基于多任务学习的高分辨率遥感影像建筑实例分割

摘要

高分辨率遥感影像建筑物提取,一般都视为二分类问题,因此无法区分建筑物个体。本文基于Xception module改进U-net,并与多任务方法相结合,在二分类的同事,区分不同建筑物。相比U-net提取精度提高了1.4%.

1,数据来源与研究区域

  • 法国国家信息与自动化研究所 2018 年发布的Inria航空影像数据集。
  • 空间分辨率0.3m,覆盖5城市,180张,5000*5000
  • 分割方法:Maggiori,
  • 分割大小:416*416,步长384
  • 使用scikit-image中函数,由二分类真值图像生成对应的实例标记, 给不同建筑 物分配不同的标签值

2,研究方法

  • 将U-Net中编码部分的连续卷积层用Xception module替换, 从而改善深度神经网络在高分遥感影像建筑物分类过程中特征提取的效果。
  • 在Unet的解码部分,增加了一个解码器,用来生成高位特征向量

  • 使用二分类结果作为掩膜,滤除高位特征向量中非建筑物特征向量,最后聚类

2.1,Unet与Xception

Unet参见其他论文

Xception 是 2017 年提出的用于 图像分类的深度卷积神经网络模型, 在收敛速度和 精度方面优于 esNet 等深度神经网络模型。Xception 中使用 Xception module 作为 Inception module 的改进版本, 用空间相关性与波段相关性解耦的方式处理图像数据, 明显提升分类精度。

本研究减少 U-Net对应层的滤波器数目, 增加网络的层数, 同时, 在 U-Net 的编码器部分引入Xception module 结 构, 用 Xception module替换掉卷积层, 从而改善 U-Net的分类精度.

sparable convolution详解

2.2,多任务学习及判别损失函数

多任务学习是一种基于共享表示, 把多个相关的任务放在一起学习的机器学习方法。多个相关任务并行学习, 对应的损失函数同时通过反向传播算法对网络参数进行更新。

  • 对高分辨率遥感影像进行 建筑物的二分类提取;
  • 在高维特征空间中, 生成 遥感影像中建筑物像素点对应的高维特征向量。在高维空间中, 属于相同建筑物的像素点对应的特征向量在空间中聚集, 不同建筑物像素点的特征向量彼此远离。

别损失函数训练深度神经网络, 使其能够生成对应不同建筑物个体像素点的高维特征向量。当判别损失函数收敛时, 使得生成的高维特征向量能满足:

  • 具有相同标签的建筑物个体对 应像素点的高维特征向量在特征空间中应该彼此聚集
  • 具有不同标签的建筑物个体像素点的聚类中心在高维空间中应该彼此远离

表达式如下:

$$\begin{cases} L_{var} =\frac{1}{C}\sum_{m=1}^{C} \frac{1}{N_m}\sum_{i=1}^{N_m}[\mu_m-x_i-\delta_v]_+^2 \\ L_{dist}=\frac{1}{C(C-1)}\sum_{k=1}^{C}\sum_{j=1,k \neq j}^{C}[2\delta_d-||\mu_k-\mu_j||]_+^2 \\ L_{reg}=\frac{1}{C}\sum_{k=1}^{C}||\mu_k|| \end{cases} \\ L_{discrimative}=\alpha L_{var}+\beta L_{dist} + \gamma L_{reg}$$

  • $L_{var}$表示相同建筑物个体像素点的聚类程度
  • $L_{dist}$表示不同建筑物个体的聚类中心尽可能远离的程度
  • $L_{reg}$表示权重的正则化,提高其泛化能力
  • $x_i$表示第i个建筑物像素点对应的高维向量
  • $C$表示建筑物个数
  • $N_m$表示不同建筑物对应像素点个数
  • $\mu_m$表示建筑物的个体的高维空间聚类中心
  • $\delta_v$表示方差
  • $\mu_k,\mu_j$表示属于不同建筑物的聚类中心
  • $2\delta$表示两个建筑物个体的聚类中心最小距离
  • $L_{discrimative}$为判别损失函数,$\alpha,\beta,\gamma$分别对应三个损失项的权重

总损失函数:

$L_{total} = \omega_1 L_{discrimative}+\omega_2 L_{segmentation}$

根据判别损失函数的公式可知, 在理想情况下, 当模型收敛时, 属于不同建筑物个体的像素点对应的高维特征向量, 在高维空间中以$\delta_v$为方 差, 分布于聚类中心周围, 表现为超球体。在均值漂移算法中, 参数带宽(bandwidth)与高维特征向量的方差紧密相关, 本文中设置为$2\delta$

3,实验结果与分析

  • 数据扩增:p=0.5的水平翻转,镜像翻转,90,180,270度旋转
  • Adam优化算法,learning_rate=0.0004, batch=2,训练次数200
  • 多任务学习
    • 判别损失函数$\alpha = 1,\beta = 1,\gamma = 0.001,\delta_v=0.25,\delta_d = 18$
    • $\omega_1,\omega_2 = 0.5$

3.1,实例分割


3.2,可视化分析

t-SNE算法是Maaten等提出的一种用于数据 降维的机器学习算法, 可以将高维数据映射到适合观察的2维或3维空间。用来分析像素点高维特征向量。

4,原文下载

下载

Dean0731

海纳百川,有容乃大,壁立千仞,无欲则刚

相关推荐

发表评论