面向遥感图像场景分类的LAG-MANet模型
P237; 遥感图像分类过程中,局部信息与全局信息至关重要.目前,遥感图像分类的方法主要包括卷积神经网络(CNN)及Transformer.CNN在局部信息提取方面具有优势,但在全局信息提取方面有一定的局限性.相比之下,Transformer在全局信息提取方面表现出色,但计算复杂度高.为提高遥感图像场景分类性能,降低复杂度,设计了 LAG-MANet纯卷积网络.该网络既关注局部特征,又关注全局特征,并且考虑了多尺度特征.输入图像被预处理后,首先采用多分支扩张卷积模块(MBDConv)提取多尺度特征;然后依次进入网络的4个阶段,在每个阶段采用并行双域特征融合模块(P2DF)分支路提取局部、全局特...
Saved in:
Published in | 测绘学报 Vol. 53; no. 7; pp. 1371 - 1383 |
---|---|
Main Authors | , , |
Format | Journal Article |
Language | Chinese |
Published |
长沙理工大学计算机与通信工程学院,湖南长沙 410114
12.08.2024
|
Subjects | |
Online Access | Get full text |
ISSN | 1001-1595 |
DOI | 10.11947/j.AGCS.2024.20230074 |
Cover
Summary: | P237; 遥感图像分类过程中,局部信息与全局信息至关重要.目前,遥感图像分类的方法主要包括卷积神经网络(CNN)及Transformer.CNN在局部信息提取方面具有优势,但在全局信息提取方面有一定的局限性.相比之下,Transformer在全局信息提取方面表现出色,但计算复杂度高.为提高遥感图像场景分类性能,降低复杂度,设计了 LAG-MANet纯卷积网络.该网络既关注局部特征,又关注全局特征,并且考虑了多尺度特征.输入图像被预处理后,首先采用多分支扩张卷积模块(MBDConv)提取多尺度特征;然后依次进入网络的4个阶段,在每个阶段采用并行双域特征融合模块(P2DF)分支路提取局部、全局特征并进行融合;最后先经过全局平均池化、再经过全连接层输出分类标签.LAG-MANet在 WHU-RS19数据集、SIRI-WHU数据集及RSSCN7数据集上的分类准确率分别为97.76%、97.04%、97.18%.试验结果表明,在3个具有挑战性的公开遥感数据集上,LAG-MANet更具有优越性. |
---|---|
ISSN: | 1001-1595 |
DOI: | 10.11947/j.AGCS.2024.20230074 |