自适应分布式聚合博弈广义纳什均衡算法

随着信息物理系统技术的发展,面向多智能体系统的分布式协同优化问题得到广泛研究.主要研究面向多智能体系统的受约束分布式聚合博弈问题,其中局部智能体成本函数受到全局聚合项约束和全局等式耦合约束.首先,面向一阶积分型多智能体系统设计一种基于估计梯度下降的纳什均衡求解算法.其中,利用多智能体系统平均一致性方法设计一种自适应估计策略,以实现全局聚合项约束分布式估计,并据此计算出梯度函数估计值.其次,利用状态反馈策略和输出反馈策略将上述算法推广至状态信息可测和状态信息不可测一般线性异构多智能体系统.最后,利用拉萨尔不变性原理证实上述算法收敛性,并提供多组案例仿真用以验证算法有效性....

Full description

Saved in:
Bibliographic Details
Published in自动化学报 Vol. 50; no. 6; pp. 1210 - 1220
Main Authors 时侠圣, 任璐, 孙长银
Format Journal Article
LanguageChinese
Published 安徽大学安徽省无人系统与智能技术工程研究中心 合肥 230601 01.06.2024
安徽大学自主无人系统技术教育部工程研究中心 合肥 230601
安徽大学人工智能学院 合肥 230601
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:随着信息物理系统技术的发展,面向多智能体系统的分布式协同优化问题得到广泛研究.主要研究面向多智能体系统的受约束分布式聚合博弈问题,其中局部智能体成本函数受到全局聚合项约束和全局等式耦合约束.首先,面向一阶积分型多智能体系统设计一种基于估计梯度下降的纳什均衡求解算法.其中,利用多智能体系统平均一致性方法设计一种自适应估计策略,以实现全局聚合项约束分布式估计,并据此计算出梯度函数估计值.其次,利用状态反馈策略和输出反馈策略将上述算法推广至状态信息可测和状态信息不可测一般线性异构多智能体系统.最后,利用拉萨尔不变性原理证实上述算法收敛性,并提供多组案例仿真用以验证算法有效性.
ISSN:0254-4156
DOI:10.16383/j.aas.c230584