基于结构感知和全局上下文信息的小目标检测

TP391.4; 在小目标检测任务中,由于小目标像素值少、特征不丰富和难提取等局限性,容易导致模型漏检、误检以及精度低等问题,提出了一种基于多尺度结构感知和全局上下文信息的小目标检测算法.针对复杂场景设计了多尺度结构感知模块,可以更好地捕获小目标的细节特征,以此增强模型识别不同尺寸物体的检测能力.为了获取更多的全局特征,借助Transformer捕获长距离依赖特征的优势设计了全局上下文信息模块,有效地建立起不同区域像素点之间的联系.针对模型训练时的梯度爆炸现象,设计了一种新的带权重损失函数W-CIoU,使得训练时的收敛速度有明显改善.大量的实验结果表明,提出的方法相较于其他经典的轻量级方法取得...

Full description

Saved in:
Bibliographic Details
Published in计算机工程与应用 Vol. 60; no. 9; pp. 292 - 298
Main Authors 李钟华, 林初俊, 朱恒亮, 廖诗宇, 白云起
Format Journal Article
LanguageChinese
Published 福建理工大学 计算机科学与数学学院,福州 350118 01.05.2024
Subjects
Online AccessGet full text
ISSN1002-8331
DOI10.3778/j.issn.1002-8331.2302-0275

Cover

More Information
Summary:TP391.4; 在小目标检测任务中,由于小目标像素值少、特征不丰富和难提取等局限性,容易导致模型漏检、误检以及精度低等问题,提出了一种基于多尺度结构感知和全局上下文信息的小目标检测算法.针对复杂场景设计了多尺度结构感知模块,可以更好地捕获小目标的细节特征,以此增强模型识别不同尺寸物体的检测能力.为了获取更多的全局特征,借助Transformer捕获长距离依赖特征的优势设计了全局上下文信息模块,有效地建立起不同区域像素点之间的联系.针对模型训练时的梯度爆炸现象,设计了一种新的带权重损失函数W-CIoU,使得训练时的收敛速度有明显改善.大量的实验结果表明,提出的方法相较于其他经典的轻量级方法取得了较好的检测效果.与基准模型相比,提出的模型在VisDrone数据集上mAP50和mAP50:95分别提高了6.4和4.6个百分点,同时在TinyPerson数据集上也有着不错的表现.
ISSN:1002-8331
DOI:10.3778/j.issn.1002-8331.2302-0275