基于可变尺度先验框的声呐图像目标检测
TP391.4; 利用深度学习对声呐图像进行目标检测是近年来的研究热点,然而声呐图像存在目标尺度分布集中、数据获取难等问题,导致检测效果难以满足需求.针对该问题,提出了 一种基于可变尺度先验框的 目标检测方法.首先,考虑到声呐图像中 目标的尺度分布具有其特殊性,基于先验统计生成可变尺度先验框.其次,为了解决声呐图像稀缺的难题,采用数据增强的方法对训练集进行扩充.最后,探索了模型的轻量化,通过删减模型的大目标检测层,在不降低模型精度的同时简化模型结构.为了评估算法的有效性,以前视声呐图像为例进行了综合试验,平均精度(mean average precision,mAP)@0.75 和 mAP@...
Saved in:
Published in | 系统工程与电子技术 Vol. 46; no. 3; pp. 771 - 778 |
---|---|
Main Authors | , , |
Format | Journal Article |
Language | Chinese |
Published |
中国科学院大学电子电气与通信工程学院,北京 100049%中国科学院自动化研究所智能感知与计算研究中心,北京 100190
01.03.2024
中国科学院声学研究所水下航行器信息技术重点实验室,北京 100190 |
Subjects | |
Online Access | Get full text |
ISSN | 1001-506X |
DOI | 10.12305/j.issn.1001-506X.2024.03.01 |
Cover
Summary: | TP391.4; 利用深度学习对声呐图像进行目标检测是近年来的研究热点,然而声呐图像存在目标尺度分布集中、数据获取难等问题,导致检测效果难以满足需求.针对该问题,提出了 一种基于可变尺度先验框的 目标检测方法.首先,考虑到声呐图像中 目标的尺度分布具有其特殊性,基于先验统计生成可变尺度先验框.其次,为了解决声呐图像稀缺的难题,采用数据增强的方法对训练集进行扩充.最后,探索了模型的轻量化,通过删减模型的大目标检测层,在不降低模型精度的同时简化模型结构.为了评估算法的有效性,以前视声呐图像为例进行了综合试验,平均精度(mean average precision,mAP)@0.75 和 mAP@ 0.5:0.95 分别达 0.585 和 0.559,较原Yolov5网络分别提升了5.8%和3.1%,同时每秒10亿次浮点运算次数下降到14.9.结果表明,所提算法具有更高的精度和更轻量化的模型结构. |
---|---|
ISSN: | 1001-506X |
DOI: | 10.12305/j.issn.1001-506X.2024.03.01 |