基于POMDP模型的智能雷达干扰决策方法

TN973; 为了有效提高复杂电磁环境下对非合作方工作模式未知的智能雷达的干扰效率和准确率,提出了一种基于部分可观测马尔可夫决策过程(partially observable Markov decision process,POMDP)的干扰决策方法.首先,根据智能雷达的工作特点构建了智能雷达对抗系统的POMDP模型,采用非参数的、基于样本的信念分布反映智能体对环境的认知,并利用贝叶斯滤波更新智能体对环境的信念.然后,以信息熵作为评估准则,令干扰机选择信息熵最大的干扰样式不断尝试.最后,通过仿真实验与传统Q-学习法和经验决策法的干扰决策性能进行比较,验证所提方法的优越性.结果表明,所提方法能够...

Full description

Saved in:

Bibliographic Details
Published in	系统工程与电子技术 Vol. 45; no. 9; pp. 2755 - 2760
Main Authors	冯路为, 刘松涛, 徐华志
Format	Journal Article
Language	Chinese
Published	海军大连舰艇学院信息系统系,辽宁大连116018 01.09.2023
Subjects	贝叶斯滤波智能雷达 intelligent radar partially observable Markov decision process(POMDP)model 部分可观测马尔可夫决策过程模型强化学习 Bayesian filtering reinforcement learning
Online Access	Get full text
ISSN	1001-506X
DOI	10.12305/j.issn.1001-506X.2023.09.13

Cover

More Information
Summary:	TN973; 为了有效提高复杂电磁环境下对非合作方工作模式未知的智能雷达的干扰效率和准确率,提出了一种基于部分可观测马尔可夫决策过程(partially observable Markov decision process,POMDP)的干扰决策方法.首先,根据智能雷达的工作特点构建了智能雷达对抗系统的POMDP模型,采用非参数的、基于样本的信念分布反映智能体对环境的认知,并利用贝叶斯滤波更新智能体对环境的信念.然后,以信息熵作为评估准则,令干扰机选择信息熵最大的干扰样式不断尝试.最后,通过仿真实验与传统Q-学习法和经验决策法的干扰决策性能进行比较,验证所提方法的优越性.结果表明,所提方法能够根据未知雷达状态变化动态地选择最优干扰方式,且能更快实现对智能雷达的干扰决策.
ISSN:	1001-506X
DOI:	10.12305/j.issn.1001-506X.2023.09.13