基于人工势场DDPG算法的移动机械臂协同避障轨迹规划

TP241%TP18; 为了提高移动机械臂在狭窄通道和障碍物约束情况的避障轨迹规划能力,提出一种人工势场法(APF)和深度确定性策略梯度算法(DDPG)结合的改进算法(APF-DDPG).首先,对机械臂设计了 APF规划得到近似姿态,再将研究问题表示为马尔科夫决策过程,设计了状态空间、动作空间和奖惩函数,对规划过程进行阶段性分析处理,设计了一种引导机制来过渡各控制阶段,即避障阶段由DDPG主导训练,目标规划阶段由近似姿态引导DDPG训练,最终获得用于规划的策略模型.最后,建立并设计了固定和随机状态场景的仿真实验,验证了所提算法的有效性.实验结果表明,相较于传统DDPG算法,APF-DDPG算法...

Full description

Saved in:

Bibliographic Details
Published in	计算机集成制造系统 Vol. 30; no. 12; pp. 4282 - 4291
Main Authors	李勇, 张朝兴, 柴燎宁
Format	Journal Article
Language	Chinese
Published	重庆邮电大学工业物联网与网络化控制教育部重点实验室,重庆 400065 31.12.2024
Subjects	deep deterministic policy gradient 深度确定性策略梯度避障轨迹规划人工势场法 mobile robotic arm artificial potential field guided training 引导训练移动机械臂 obstacle avoidance trajectory planning
Online Access	Get full text

Cover

Loading…

More Information
Summary:	TP241%TP18; 为了提高移动机械臂在狭窄通道和障碍物约束情况的避障轨迹规划能力,提出一种人工势场法(APF)和深度确定性策略梯度算法(DDPG)结合的改进算法(APF-DDPG).首先,对机械臂设计了 APF规划得到近似姿态,再将研究问题表示为马尔科夫决策过程,设计了状态空间、动作空间和奖惩函数,对规划过程进行阶段性分析处理,设计了一种引导机制来过渡各控制阶段,即避障阶段由DDPG主导训练,目标规划阶段由近似姿态引导DDPG训练,最终获得用于规划的策略模型.最后,建立并设计了固定和随机状态场景的仿真实验,验证了所提算法的有效性.实验结果表明,相较于传统DDPG算法,APF-DDPG算法能够以更高收敛效率训练得到具有更高效控制性能的策略模型.
ISSN:	1006-5911
DOI:	10.13196/j.cims.2023.0369