基于特征融合和混合注意力的小目标检测

TP391.4%TP18; 针对目标检测任务中小目标特征信息不足、检测率较低,且错、漏检率较高等缺点,提出一种基于多尺度特征融合以及混合注意力机制的 Tr-SSD算法.首先,使用 Resnet50 残差网络作为 SSD算法的骨干网络,增强 SSD 算法的特征提取能力;其次,设计了一种混合注意力机制并将其应用于网络的中尺度特征图中以增强特征图中的有效信息,并建立信息间的远距离依赖;最后,使用以 Transformer为核心的网络层与替换骨干网络后的 SSD算法形成FPN结构,融合不同尺度的特征信息,以更准确地对小目标进行定位.实验结果表明:Tr-SSD 算法在 PASCAL VOC数据集、HRS...

Full description

Saved in:
Bibliographic Details
Published in郑州大学学报(工学版) Vol. 45; no. 3; pp. 72 - 79
Main Authors 魏明军, 王镆涵, 刘亚志, 李辉
Format Journal Article
LanguageChinese
Published 华北理工大学 人工智能学院,河北 唐山 063210 2024
华北理工大学 河北省工业智能感知重点实验室,河北 唐山 063210%华北理工大学 人工智能学院,河北 唐山 063210
Subjects
Online AccessGet full text
ISSN1671-6833
DOI10.13705/j.issn.1671-6833.2024.03.001

Cover

Loading…
More Information
Summary:TP391.4%TP18; 针对目标检测任务中小目标特征信息不足、检测率较低,且错、漏检率较高等缺点,提出一种基于多尺度特征融合以及混合注意力机制的 Tr-SSD算法.首先,使用 Resnet50 残差网络作为 SSD算法的骨干网络,增强 SSD 算法的特征提取能力;其次,设计了一种混合注意力机制并将其应用于网络的中尺度特征图中以增强特征图中的有效信息,并建立信息间的远距离依赖;最后,使用以 Transformer为核心的网络层与替换骨干网络后的 SSD算法形成FPN结构,融合不同尺度的特征信息,以更准确地对小目标进行定位.实验结果表明:Tr-SSD 算法在 PASCAL VOC数据集、HRSID数据集和RSOD遥感数据集上检测的mAP值分别达到 81.9%、87.5%和 88.4%,比SSD算法分别提高了 4.7 百分点、6.8 百分点和 9.2 百分点,且检测速度均满足实时检测的要求.
ISSN:1671-6833
DOI:10.13705/j.issn.1671-6833.2024.03.001