基于注意力的高效机器人抓取检测网络
TP391.4; 为平衡抓取检测算法的推理速度和检测精度,本文提出一种编码器-解码器结构的像素级抓取检测神经网络,称为基于注意力的高效机器人抓取检测网络(AE-GDN).在编码器阶段引入3个空间注意模块以增强细节信息,在解码器阶段引入3个通道注意模块以提取更多语义信息.采用多个轻量高效的DenseBlocks连接编码器和解码器,提高AE-GDN的特征建模能力.预测得到的抓取矩形框与标签抓取框之间的高交并比(IoU)值并不意味着高质量的抓取配置,但可能会导致碰撞.这是因为传统IoU损失计算方法将预测抓取框中心部分像素与夹爪附近像素视为同等重要.本文设计了一种新的基于沙漏形匹配机制的IoU损失计算...
Saved in:
Published in | 信息与电子工程前沿(英文版) Vol. 24; no. 10; pp. 1430 - 后插5 |
---|---|
Main Authors | , , , , , |
Format | Journal Article |
Language | Chinese |
Published |
上海市现代光学系统重点实验室,中国 上海市,200093
2023
医用光学技术与仪器教育部重点实验室,中国 上海市,200093 同济大学上海智能科学与技术研究所,中国 上海市,201210 上海理工大学光电信息与计算机工程学院,中国 上海市,200093%上海理工大学理学院,中国 上海市,200093%上海理工大学光电信息与计算机工程学院,中国 上海市,200093 |
Subjects | |
Online Access | Get full text |
ISSN | 2095-9184 |
DOI | 10.1631/FITEE.2200502 |
Cover
Summary: | TP391.4; 为平衡抓取检测算法的推理速度和检测精度,本文提出一种编码器-解码器结构的像素级抓取检测神经网络,称为基于注意力的高效机器人抓取检测网络(AE-GDN).在编码器阶段引入3个空间注意模块以增强细节信息,在解码器阶段引入3个通道注意模块以提取更多语义信息.采用多个轻量高效的DenseBlocks连接编码器和解码器,提高AE-GDN的特征建模能力.预测得到的抓取矩形框与标签抓取框之间的高交并比(IoU)值并不意味着高质量的抓取配置,但可能会导致碰撞.这是因为传统IoU损失计算方法将预测抓取框中心部分像素与夹爪附近像素视为同等重要.本文设计了一种新的基于沙漏形匹配机制的IoU损失计算方法,该方法可在高IoU和高质量抓取配置之间建立良好对应关系.AE-GDN在Cornell和Jacquard数据集上的准确率分别达到98.9%和96.6%.推理速度达到每秒43.5帧,参数仅约1.2×106.本文提出的AE-GDN已实际部署在机械臂抓取系统中,并实现良好抓取性能.代码可在https://github.com/robvincen/robot_gradet获得. |
---|---|
ISSN: | 2095-9184 |
DOI: | 10.1631/FITEE.2200502 |