面向遥感图像场景分类的LAG-MANet模型

P237; 遥感图像分类过程中,局部信息与全局信息至关重要.目前,遥感图像分类的方法主要包括卷积神经网络(CNN)及Transformer.CNN在局部信息提取方面具有优势,但在全局信息提取方面有一定的局限性.相比之下,Transformer在全局信息提取方面表现出色,但计算复杂度高.为提高遥感图像场景分类性能,降低复杂度,设计了 LAG-MANet纯卷积网络.该网络既关注局部特征,又关注全局特征,并且考虑了多尺度特征.输入图像被预处理后,首先采用多分支扩张卷积模块(MBDConv)提取多尺度特征;然后依次进入网络的4个阶段,在每个阶段采用并行双域特征融合模块(P2DF)分支路提取局部、全局特...

Full description

Saved in:
Bibliographic Details
Published in测绘学报 Vol. 53; no. 7; pp. 1371 - 1383
Main Authors 王威, 郑薇, 王新
Format Journal Article
LanguageChinese
Published 长沙理工大学计算机与通信工程学院,湖南长沙 410114 12.08.2024
Subjects
Online AccessGet full text
ISSN1001-1595
DOI10.11947/j.AGCS.2024.20230074

Cover

More Information
Summary:P237; 遥感图像分类过程中,局部信息与全局信息至关重要.目前,遥感图像分类的方法主要包括卷积神经网络(CNN)及Transformer.CNN在局部信息提取方面具有优势,但在全局信息提取方面有一定的局限性.相比之下,Transformer在全局信息提取方面表现出色,但计算复杂度高.为提高遥感图像场景分类性能,降低复杂度,设计了 LAG-MANet纯卷积网络.该网络既关注局部特征,又关注全局特征,并且考虑了多尺度特征.输入图像被预处理后,首先采用多分支扩张卷积模块(MBDConv)提取多尺度特征;然后依次进入网络的4个阶段,在每个阶段采用并行双域特征融合模块(P2DF)分支路提取局部、全局特征并进行融合;最后先经过全局平均池化、再经过全连接层输出分类标签.LAG-MANet在 WHU-RS19数据集、SIRI-WHU数据集及RSSCN7数据集上的分类准确率分别为97.76%、97.04%、97.18%.试验结果表明,在3个具有挑战性的公开遥感数据集上,LAG-MANet更具有优越性.
ISSN:1001-1595
DOI:10.11947/j.AGCS.2024.20230074