MARL-GPN:一种基于多智能体强化学习的博弈Petri网

TP309.2; 作为过程挖掘中的一个重要研究分支,变化挖掘可运用在系统安全分析、IPS安全建设等场景下,从变化域的生成情况判断可能存在的未知漏洞.而传统变化挖掘算法更注重业务流程的安全性,无法满足在动态博弈场景下挖掘需要考虑多方安全效益所形成有效变化域的情况.针对此问题,提出一种基于多智能体强化学习的博弈Petri网(MARL-GPN),以专用于动态安全模型的有效变化域研究.该新型的博弈Petri网会首先根据攻防事件构建效益矩阵,然后各智能体间会根据对方当前状态与下一步走势生成最优应对策略,其次在指定学习周期下达成纳什平衡得到双方最优活动迹,与传统变化挖掘进行比对即可得到有效变化域.最后以典...

Full description

Saved in:

Bibliographic Details
Published in	计算机集成制造系统 Vol. 29; no. 5; pp. 1590 - 1601
Main Authors	刘雨舟, 方贤文
Format	Journal Article
Language	Chinese
Published	安徽省煤矿安全大数据分析与预警技术工程实验室,安徽淮南 232001 31.05.2023 安徽理工大学数学与大数据学院,安徽淮南 232001
Subjects	变化挖掘强化学习网络攻防多智能体博弈博弈Petri网
Online Access	Get full text
ISSN	1006-5911
DOI	10.13196/j.cims.2023.05.016

Cover

More Information
Summary:	TP309.2; 作为过程挖掘中的一个重要研究分支,变化挖掘可运用在系统安全分析、IPS安全建设等场景下,从变化域的生成情况判断可能存在的未知漏洞.而传统变化挖掘算法更注重业务流程的安全性,无法满足在动态博弈场景下挖掘需要考虑多方安全效益所形成有效变化域的情况.针对此问题,提出一种基于多智能体强化学习的博弈Petri网(MARL-GPN),以专用于动态安全模型的有效变化域研究.该新型的博弈Petri网会首先根据攻防事件构建效益矩阵,然后各智能体间会根据对方当前状态与下一步走势生成最优应对策略,其次在指定学习周期下达成纳什平衡得到双方最优活动迹,与传统变化挖掘进行比对即可得到有效变化域.最后以典型信息安全事件为例验证了该模型的可行性.
ISSN:	1006-5911
DOI:	10.13196/j.cims.2023.05.016