一种基于深度强化学习的无人小车双层路径规划方法

TP311; 随着智能无人小车的广泛应用,智能化导航、路径规划和避障技术成为了重要的研究内容.文中提出了基于无模型的DDPG和SAC深度强化学习算法,利用环境信息循迹至目标点,躲避静态与动态的障碍物并且使其普适于不同环境.通过全局规划和局部避障相结合的方式,该方法以更好的全局性与鲁棒性解决路径规划问题,以更好的动态性与泛化性解决避障问题,并缩短了迭代时间;在网络训练阶段结合PID和A?等传统算法,提高了所提方法的收敛速度和稳定性.最后,在机器人操作系统ROS和仿真程序gazebo中设计了导航和避障等多种实验场景,仿真实验结果验证了所提出的兼顾问题全局性和动态性的方法具有可靠性,生成的路径和时间...

Full description

Saved in:
Bibliographic Details
Published in计算机科学 Vol. 50; no. 1; pp. 194 - 204
Main Authors 黄昱洲, 王立松, 秦小麟
Format Journal Article
LanguageChinese
Published 南京航空航天大学计算机科学与技术学院 南京 211106 2023
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:TP311; 随着智能无人小车的广泛应用,智能化导航、路径规划和避障技术成为了重要的研究内容.文中提出了基于无模型的DDPG和SAC深度强化学习算法,利用环境信息循迹至目标点,躲避静态与动态的障碍物并且使其普适于不同环境.通过全局规划和局部避障相结合的方式,该方法以更好的全局性与鲁棒性解决路径规划问题,以更好的动态性与泛化性解决避障问题,并缩短了迭代时间;在网络训练阶段结合PID和A?等传统算法,提高了所提方法的收敛速度和稳定性.最后,在机器人操作系统ROS和仿真程序gazebo中设计了导航和避障等多种实验场景,仿真实验结果验证了所提出的兼顾问题全局性和动态性的方法具有可靠性,生成的路径和时间效率有所优化.
ISSN:1002-137X
DOI:10.11896/jsjkx.220500241