基于深度强化学习的固体放射性废物抓取方法研究

TP393.04; 针对固体放射性废物分拣作业中,放射性废物杂乱无序、远程遥操作抓取效率低、人工分拣危险性大等典型问题,提出一种基于深度强化学习的放射性固体废物抓取方法.该方法使用改进深度Q网络算法,通过获取的图像信息,使机器人与环境不断进行交互并获得回报奖励,回报奖励由机械臂动作执行结果和放射性区域内放射性活度的高低构成,根据Q值的大小得到机械臂的最佳抓取位置.用V-RE P软件对U R5机械臂建立仿真模型,在仿真环境中完成不同类型固体放射性废物抓取的训练与测试.仿真结果表明,固体废物在松散放置时该方法可使机械臂抓取成功率大于90％,在紧密放置时抓取成功率大于65％,机械臂不会受到废物堆叠的...

Full description

Saved in:

Bibliographic Details
Published in	计算机应用研究 Vol. 37; no. 11; pp. 3363 - 3367
Main Authors	周祺杰, 刘满禄, 李新茂, 张华
Format	Journal Article
Language	Chinese
Published	中国科学技术大学信息科学技术学院,合肥230026 2020 西南科技大学信息工程学院,四川绵阳621000%西南科技大学信息工程学院,四川绵阳621000
Subjects	固体放射性废物深度强化学习回报奖励机械臂抓取
Online Access	Get full text

Cover

Loading…

More Information
Summary:	TP393.04; 针对固体放射性废物分拣作业中,放射性废物杂乱无序、远程遥操作抓取效率低、人工分拣危险性大等典型问题,提出一种基于深度强化学习的放射性固体废物抓取方法.该方法使用改进深度Q网络算法,通过获取的图像信息,使机器人与环境不断进行交互并获得回报奖励,回报奖励由机械臂动作执行结果和放射性区域内放射性活度的高低构成,根据Q值的大小得到机械臂的最佳抓取位置.用V-RE P软件对U R5机械臂建立仿真模型,在仿真环境中完成不同类型固体放射性废物抓取的训练与测试.仿真结果表明,固体废物在松散放置时该方法可使机械臂抓取成功率大于90％,在紧密放置时抓取成功率大于65％,机械臂不会受到废物堆叠的影响,并且会优先抓取放射性区域内具有高放射性活度的物体.
ISSN:	1001-3695
DOI:	10.19734/j.issn.1001-3695.2019.07.0288