一种基于注意力机制和上下文感知的三维目标检测网络
TP391%TN99; 随着自动驾驶的发展,行车安全成为关键性问题.由于点云场景杂乱、背景环境干扰大以及场景采集范围扩增,点云愈加稀疏,使得检测算法鲁棒性变弱.为缓解以上问题,文中提出了一种基于注意力机制和上下文感知的三维目标检测算法.在点云处理阶段,增加点云双向注意力机制生成点权重矩阵,显示标注重要点数据,抑制背景噪声干扰.在伪图特征提取模块中,添加FPN(Feature Pyramid Network)模块重复利用多尺度特征,引入上下文感知模块(Con-text Awareness Module,CAM)捕捉多比例的上下文语义,并基于源特征设计注意力导向模块(Attention Guide...
Saved in:
Published in | 电子科技 Vol. 36; no. 10; pp. 15 - 23 |
---|---|
Main Authors | , |
Format | Journal Article |
Language | Chinese |
Published |
上海理工大学 光电信息与计算机工程学院,上海 200093
2023
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | TP391%TN99; 随着自动驾驶的发展,行车安全成为关键性问题.由于点云场景杂乱、背景环境干扰大以及场景采集范围扩增,点云愈加稀疏,使得检测算法鲁棒性变弱.为缓解以上问题,文中提出了一种基于注意力机制和上下文感知的三维目标检测算法.在点云处理阶段,增加点云双向注意力机制生成点权重矩阵,显示标注重要点数据,抑制背景噪声干扰.在伪图特征提取模块中,添加FPN(Feature Pyramid Network)模块重复利用多尺度特征,引入上下文感知模块(Con-text Awareness Module,CAM)捕捉多比例的上下文语义,并基于源特征设计注意力导向模块(Attention Guide Module,AGM)生成空间位置清晰的导向权图,缓解冗余特征导致的空间模糊问题.文中网络基于KITTI数据集进行测试,结果表明在困难指标下,和基线网络相比,所提方法中行人、汽车和骑行者平均精度(Average Precision,AP)分别提升了0.59%、0.87%和1.42%;和新基线网络相比,在 3 种难度级别下,所提方法中行人的平均精度分别提升了 3.04%、3.53%和3.23%,结果证明改进网络可有效提升三维目标检测性能. |
---|---|
ISSN: | 1007-7820 |
DOI: | 10.16180/j.cnki.issn1007-7820.2023.10.003 |