基于熵和不等概率的量子强化学习控制

复杂量子系统的高精度控制是实现量子计算和量子信息处理的关键技术之一.深度强化学习算法已经应用到量子控制问题中,可以为不同的量子系统设计最优策略.为实现量子系统快速高精度的量子态制备,本文提出一种基于熵和不等概率的深度强化学习算法,其中引入了信息论中熵的概念以改进动作选择策略.通过当前状态的动作值得到该状态的熵值,并根据熵值选择进行"探索"(exploration)或者"利用"(exploitation),其中针对"利用"采用不等概率进行随机选择动作.所提强化学习算法中的智能体(agent)对于学习程度充分的状态专注于利用,对于学习程度...

Full description

Saved in:

Bibliographic Details
Published in	控制理论与应用 Vol. 41; no. 12; pp. 2277 - 2285
Main Authors	张玉瑶, 匡森
Format	Journal Article
Language	Chinese
Published	中国科学技术大学自动化系,安徽合肥 230027 01.12.2024
Subjects	action selection strategy entropy 熵 unequal probability 不等概率量子态制备强化学习 quantum state preparation 动作选择策略 reinforcement learning
Online Access	Get full text
ISSN	1000-8152
DOI	10.7641/CTA.2023.30007

Cover

Loading…

More Information
Summary:	复杂量子系统的高精度控制是实现量子计算和量子信息处理的关键技术之一.深度强化学习算法已经应用到量子控制问题中,可以为不同的量子系统设计最优策略.为实现量子系统快速高精度的量子态制备,本文提出一种基于熵和不等概率的深度强化学习算法,其中引入了信息论中熵的概念以改进动作选择策略.通过当前状态的动作值得到该状态的熵值,并根据熵值选择进行"探索"(exploration)或者"利用"(exploitation),其中针对"利用"采用不等概率进行随机选择动作.所提强化学习算法中的智能体(agent)对于学习程度充分的状态专注于利用,对于学习程度非充分的状态则专注于探索,直到完成任务.在量子位系统上的数值仿真结果表明,与传统的强化学习算法相比,本文算法能够以更快的收敛速度和保真度实现本征态和纠缠态的制备.
ISSN:	1000-8152
DOI:	10.7641/CTA.2023.30007