基于SegNet语义模型的高分辨率遥感影像农村建设用地提取

基础知识介绍

语义分割:给图像的每个像素点标注类别。通常认为这个类别与邻近像素类别有关,同时也和这个像素点归属的整体类别有关。利用图像分类的网络结构,可以利用不同层次的特征向量来满足判定需求。现有算法的主要区别是如何提高这些向量的分辨率,以及如何组合这些向量。
几种结构

  • 全卷积网络FCN:上采样提高分割精度,不同特征向量相加。
  • UNET:拼接特征向量;编码-解码结构;采用弹性形变 的方式,进行数据增广;用边界加权的损失函数分离接触的细胞。
  • SegNet:记录池化的位置,反池化时恢复。
  • PSPNet:多尺度池化特征向量,上采样后拼接
  • Deeplab:池化跨度为1,然后接带孔卷积。
  • ICNet:多分辨图像输入,综合不同网络生成结果

引言

目前图像语义分割方法主要有基于非参数转换的数据驱动方法、贝叶斯,马尔可夫随机场和条件随机场,但这些方法分割效率低、计算量大。
Long 等提出全卷积神经网络(fully convolutional
networks,FCN),该网络丢弃了全连接层,从而提高了
分割效率、降低了计算复杂度,是经典的语义分割网络。
基于 FCN 的图像语义分割算法在建筑物提取方面的表现
尤为突出.但是,目前用于建筑物提取的图像语义分割模型多为基于切片的网络架构,与基于像素的端到端网络架构相比,这种架构对样本中的特征缺乏整体性理解且效率较低.
Badrinarayanan 等提出 SegNet网络,该网络是基于像素的端到端的网络架构,是对FCN的优化,沿用了FCN进行图像语义分割的思想,该网络融合了编码-解码结构和跳跃网络的特点,使得模型能够得到更加精确的输出特征图,在训练样本有限的情况下也能得到更加准确的分类结果。

数据

河北省霸州市的全域高空间分辨率遥感影像与该地区的土地利用矢量数据。获取日期为2013年9月26日,类型为 World View-2 彩色合成图像,其空间分辨率为 0.5 m,均含有 RGB 三个波段;

研究方法

模型简介

编码网络通过多次最大池化操作虽然可以捕捉更多的平移不变性特征,但同样会丢失更多特征图的边界信息等分割的重要依据。因此,在池化过程中同时记录最大池化索引信息,保存了最大特征值所在的位置,然后利用最大池化索引信息对输入特征图进行上采,使得边界信息得以保存。
Softmax 分类器单独地对每个像素进行分类,其输出的是每个像素属于各分类的概率。每个像素具有最大概率的分类即为其预测分割的分类。
农村建筑物在高空间分辨率遥感影像中由于细节的充分展现,导致其光谱特征复杂多变,并且类内光谱差异大,类间光谱差异小,因此选取光谱特征覆盖范围广的区域作为样本区域,使选取的样本具有代表性,以避免过拟合现象的发生,增强模型的泛化能力。
数据分辨率选取:通过基于多尺度样本语义分割的高空间分辨率遥感影像分类试验来探索不同地物的最佳分类尺度数据处理通过基于多尺度样本语义分割的高空间分辨率遥感影像分类试验来探索不同地物的最佳分类尺度.
注意一般情况下重叠切割效果较好

提取流程

原文下载

Dean0731

海纳百川,有容乃大,壁立千仞,无欲则刚

相关推荐

发表评论