非线性零和微分对策的事件触发自适应动态规划算法
TP273; 针对一类非线性零和微分对策问题,本文提出了一种事件触发自适应动态规划(event-triggered adaptive dynamic programming, ET-ADP)算法在线求解其鞍点.首先,提出一个新的自适应事件触发条件.然后,利用一个输入为采样数据的神经网络(评价网络)近似最优值函数,并设计了新型的神经网络权值更新律使得值函数、控制策略及扰动策略仅在事件触发时刻同步更新.进一步地,利用Lyapunov稳定性理论证明了所提出的算法能够在线获得非线性零和微分对策的鞍点且不会引起Zeno行为.所提出的ET-ADP算法仅在事件触发条件满足时才更新值函数、控制策略和扰动策略,...
Saved in:
Published in | 控制理论与应用 Vol. 35; no. 5; pp. 610 - 618 |
---|---|
Main Authors | , , |
Format | Journal Article |
Language | Chinese |
Published |
沈阳师范大学科信软件学院,辽宁沈阳,110034%中国石油大学(华东)信息与控制工程学院,山东青岛,266580
01.05.2018
|
Subjects | |
Online Access | Get full text |
ISSN | 1000-8152 |
DOI | 10.7641/CTA.2017.70674 |
Cover
Loading…
Summary: | TP273; 针对一类非线性零和微分对策问题,本文提出了一种事件触发自适应动态规划(event-triggered adaptive dynamic programming, ET-ADP)算法在线求解其鞍点.首先,提出一个新的自适应事件触发条件.然后,利用一个输入为采样数据的神经网络(评价网络)近似最优值函数,并设计了新型的神经网络权值更新律使得值函数、控制策略及扰动策略仅在事件触发时刻同步更新.进一步地,利用Lyapunov稳定性理论证明了所提出的算法能够在线获得非线性零和微分对策的鞍点且不会引起Zeno行为.所提出的ET-ADP算法仅在事件触发条件满足时才更新值函数、控制策略和扰动策略,因而可有效减少计算量和降低网络负荷.最后,两个仿真例子验证了所提出的ET-ADP算法的有效性. |
---|---|
ISSN: | 1000-8152 |
DOI: | 10.7641/CTA.2017.70674 |