智能电网中基于多智能体强化学习的频谱分配算法
TN92; 针对智能电网中利用 5G网络承载多样化电力终端的业务需求,提出了一种基于多智能体强化学习的频谱分配算法.首先,基于智能电网中部署的集成接入回程系统,考虑智能电网中轻量化和非轻量化终端业务的不同通信需求,将频谱分配问题建模为最大化系统总能效的非凸混合整数规划.其次,将前述问题构建为一个部分可观测的马尔可夫决策过程并转换为完全协作的多智能体问题,进而提出了一种集中训练分布执行框架下基于多智能体近端策略优化的频谱分配算法.最后,通过仿真验证了所提算法的性能.仿真结果表明,所提算法具有更快的收敛速度,通过有效减少层内与层间干扰、平衡接入与回程链路速率,可以将系统总速率提高25.2%....
Saved in:
Published in | 通信学报 Vol. 44; no. 9; pp. 12 - 24 |
---|---|
Main Authors | , , , , , |
Format | Journal Article |
Language | Chinese |
Published |
东南大学移动通信全国重点实验室,江苏 南京 210096%东南大学软件学院,江苏 南京 211100%国网山东省电力公司信息通信公司,山东 济南 250001%国网山东省电力公司济南供电公司,山东 济南 250012
25.09.2023
|
Subjects | |
Online Access | Get full text |
ISSN | 1000-436X |
DOI | 10.11959/j.issn.1000-436x.2023179 |
Cover
Loading…
Summary: | TN92; 针对智能电网中利用 5G网络承载多样化电力终端的业务需求,提出了一种基于多智能体强化学习的频谱分配算法.首先,基于智能电网中部署的集成接入回程系统,考虑智能电网中轻量化和非轻量化终端业务的不同通信需求,将频谱分配问题建模为最大化系统总能效的非凸混合整数规划.其次,将前述问题构建为一个部分可观测的马尔可夫决策过程并转换为完全协作的多智能体问题,进而提出了一种集中训练分布执行框架下基于多智能体近端策略优化的频谱分配算法.最后,通过仿真验证了所提算法的性能.仿真结果表明,所提算法具有更快的收敛速度,通过有效减少层内与层间干扰、平衡接入与回程链路速率,可以将系统总速率提高25.2%. |
---|---|
ISSN: | 1000-436X |
DOI: | 10.11959/j.issn.1000-436x.2023179 |