MARL-GPN:一种基于多智能体强化学习的博弈Petri网
TP309.2; 作为过程挖掘中的一个重要研究分支,变化挖掘可运用在系统安全分析、IPS安全建设等场景下,从变化域的生成情况判断可能存在的未知漏洞.而传统变化挖掘算法更注重业务流程的安全性,无法满足在动态博弈场景下挖掘需要考虑多方安全效益所形成有效变化域的情况.针对此问题,提出一种基于多智能体强化学习的博弈Petri网(MARL-GPN),以专用于动态安全模型的有效变化域研究.该新型的博弈Petri网会首先根据攻防事件构建效益矩阵,然后各智能体间会根据对方当前状态与下一步走势生成最优应对策略,其次在指定学习周期下达成纳什平衡得到双方最优活动迹,与传统变化挖掘进行比对即可得到有效变化域.最后以典...
Saved in:
Published in | 计算机集成制造系统 Vol. 29; no. 5; pp. 1590 - 1601 |
---|---|
Main Authors | , |
Format | Journal Article |
Language | Chinese |
Published |
安徽省煤矿安全大数据分析与预警技术工程实验室,安徽 淮南 232001
31.05.2023
安徽理工大学 数学与大数据学院,安徽 淮南 232001 |
Subjects | |
Online Access | Get full text |
ISSN | 1006-5911 |
DOI | 10.13196/j.cims.2023.05.016 |
Cover
Summary: | TP309.2; 作为过程挖掘中的一个重要研究分支,变化挖掘可运用在系统安全分析、IPS安全建设等场景下,从变化域的生成情况判断可能存在的未知漏洞.而传统变化挖掘算法更注重业务流程的安全性,无法满足在动态博弈场景下挖掘需要考虑多方安全效益所形成有效变化域的情况.针对此问题,提出一种基于多智能体强化学习的博弈Petri网(MARL-GPN),以专用于动态安全模型的有效变化域研究.该新型的博弈Petri网会首先根据攻防事件构建效益矩阵,然后各智能体间会根据对方当前状态与下一步走势生成最优应对策略,其次在指定学习周期下达成纳什平衡得到双方最优活动迹,与传统变化挖掘进行比对即可得到有效变化域.最后以典型信息安全事件为例验证了该模型的可行性. |
---|---|
ISSN: | 1006-5911 |
DOI: | 10.13196/j.cims.2023.05.016 |