非线性零和微分对策的事件触发自适应动态规划算法

TP273; 针对一类非线性零和微分对策问题,本文提出了一种事件触发自适应动态规划(event-triggered adaptive dynamic programming, ET-ADP)算法在线求解其鞍点.首先,提出一个新的自适应事件触发条件.然后,利用一个输入为采样数据的神经网络(评价网络)近似最优值函数,并设计了新型的神经网络权值更新律使得值函数、控制策略及扰动策略仅在事件触发时刻同步更新.进一步地,利用Lyapunov稳定性理论证明了所提出的算法能够在线获得非线性零和微分对策的鞍点且不会引起Zeno行为.所提出的ET-ADP算法仅在事件触发条件满足时才更新值函数、控制策略和扰动策略,...

Full description

Saved in:

Bibliographic Details
Published in	控制理论与应用 Vol. 35; no. 5; pp. 610 - 618
Main Authors	崔黎黎, 张勇, 张欣
Format	Journal Article
Language	Chinese
Published	沈阳师范大学科信软件学院,辽宁沈阳,110034%中国石油大学(华东)信息与控制工程学院,山东青岛,266580 01.05.2018
Subjects	最优控制 adaptive dynamic programming nonlinear zero-sum differential games event-triggered 自适应动态规划 optimal control 非线性零和微分对策事件触发神经网络
Online Access	Get full text
ISSN	1000-8152
DOI	10.7641/CTA.2017.70674

Cover

Loading…

More Information
Summary:	TP273; 针对一类非线性零和微分对策问题,本文提出了一种事件触发自适应动态规划(event-triggered adaptive dynamic programming, ET-ADP)算法在线求解其鞍点.首先,提出一个新的自适应事件触发条件.然后,利用一个输入为采样数据的神经网络(评价网络)近似最优值函数,并设计了新型的神经网络权值更新律使得值函数、控制策略及扰动策略仅在事件触发时刻同步更新.进一步地,利用Lyapunov稳定性理论证明了所提出的算法能够在线获得非线性零和微分对策的鞍点且不会引起Zeno行为.所提出的ET-ADP算法仅在事件触发条件满足时才更新值函数、控制策略和扰动策略,因而可有效减少计算量和降低网络负荷.最后,两个仿真例子验证了所提出的ET-ADP算法的有效性.
ISSN:	1000-8152
DOI:	10.7641/CTA.2017.70674