基于改进SNN-HRL的智能体路径规划算法

TP181; 针对SNN-HRL等传统Skill discovery类算法存在的探索困难问题,本文基于SNN-HRL算法提出了融合多种探索策略的分层强化学习算法MES-HRL,改进传统分层结构,算法包括探索轨迹、学习轨迹、路径规划三层.在探索轨迹层,训练智能体尽可能多地探索未知环境,为后续的训练过程提供足够的环境状态信息.在学习轨迹层,将探索轨迹层的训练结果作为"先验知识"用于该层训练,提高训练效率.在路径规划层,利用智能体之前获得的skill来完成路径规划任务.通过仿真对比MES-HRL与SNN-HRL算法在不同环境下的性能表现,仿真结果显示,MES-HRL算法解决了传统...

Full description

Saved in:

Bibliographic Details
Published in	东北大学学报（自然科学版） Vol. 44; no. 11; pp. 1548 - 1555
Main Authors	赵钊, 原培新, 唐俊文, 陈锦林
Format	Journal Article
Language	Chinese
Published	东北大学机械工程与自动化学院,辽宁沈阳 110819 05.12.2023
Subjects	探索策略 hierarchical reinforcement learning ( HRL ) 分层强化学习 Skill discovery方法 exploration strategy 深度强化学习 Skill discovery method deep reinforcement learning path planning 路径规划
Online Access	Get full text
ISSN	1005-3026
DOI	10.12068/j.issn.1005-3026.2023.11.005

Cover

More Information
Summary:	TP181; 针对SNN-HRL等传统Skill discovery类算法存在的探索困难问题,本文基于SNN-HRL算法提出了融合多种探索策略的分层强化学习算法MES-HRL,改进传统分层结构,算法包括探索轨迹、学习轨迹、路径规划三层.在探索轨迹层,训练智能体尽可能多地探索未知环境,为后续的训练过程提供足够的环境状态信息.在学习轨迹层,将探索轨迹层的训练结果作为"先验知识"用于该层训练,提高训练效率.在路径规划层,利用智能体之前获得的skill来完成路径规划任务.通过仿真对比MES-HRL与SNN-HRL算法在不同环境下的性能表现,仿真结果显示,MES-HRL算法解决了传统算法的探索问题,具有更出色的路径规划能力.
ISSN:	1005-3026
DOI:	10.12068/j.issn.1005-3026.2023.11.005