基于人工势场DDPG算法的移动机械臂协同避障轨迹规划
TP241%TP18; 为了提高移动机械臂在狭窄通道和障碍物约束情况的避障轨迹规划能力,提出一种人工势场法(APF)和深度确定性策略梯度算法(DDPG)结合的改进算法(APF-DDPG).首先,对机械臂设计了 APF规划得到近似姿态,再将研究问题表示为马尔科夫决策过程,设计了状态空间、动作空间和奖惩函数,对规划过程进行阶段性分析处理,设计了一种引导机制来过渡各控制阶段,即避障阶段由DDPG主导训练,目标规划阶段由近似姿态引导DDPG训练,最终获得用于规划的策略模型.最后,建立并设计了固定和随机状态场景的仿真实验,验证了所提算法的有效性.实验结果表明,相较于传统DDPG算法,APF-DDPG算法...
Saved in:
Published in | 计算机集成制造系统 Vol. 30; no. 12; pp. 4282 - 4291 |
---|---|
Main Authors | , , |
Format | Journal Article |
Language | Chinese |
Published |
重庆邮电大学工业物联网与网络化控制教育部重点实验室,重庆 400065
31.12.2024
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | TP241%TP18; 为了提高移动机械臂在狭窄通道和障碍物约束情况的避障轨迹规划能力,提出一种人工势场法(APF)和深度确定性策略梯度算法(DDPG)结合的改进算法(APF-DDPG).首先,对机械臂设计了 APF规划得到近似姿态,再将研究问题表示为马尔科夫决策过程,设计了状态空间、动作空间和奖惩函数,对规划过程进行阶段性分析处理,设计了一种引导机制来过渡各控制阶段,即避障阶段由DDPG主导训练,目标规划阶段由近似姿态引导DDPG训练,最终获得用于规划的策略模型.最后,建立并设计了固定和随机状态场景的仿真实验,验证了所提算法的有效性.实验结果表明,相较于传统DDPG算法,APF-DDPG算法能够以更高收敛效率训练得到具有更高效控制性能的策略模型. |
---|---|
ISSN: | 1006-5911 |
DOI: | 10.13196/j.cims.2023.0369 |