用于流程发现的局部日志采样方法
TP311.13; 针对传统流程发现算法在处理大规模事件日志时的性能瓶颈问题,提出一种基于轨迹信息增量的日志采样方法,通过量化事件之间的直接跟随关系和轨迹的特征信息,将轨迹是否带有新的流程行为作为采样标准,基于统计理论确定了最小连续遍历样本数量.为了进一步提高预处理速度,提出二进制指数跳跃算法来避免扫描重复轨迹.通过4个真实事件日志的实验表明,所提采样方法可以快速有效地缩小事件日志的规模,并保留关键的控制流和频率信息,同时提高流程发现算法的运行速度....
Saved in:
Published in | 计算机集成制造系统 Vol. 28; no. 10; pp. 3166 - 3174 |
---|---|
Main Authors | , , , |
Format | Journal Article |
Language | Chinese |
Published |
杭州电子科技大学 计算机学院,浙江 杭州 310018%杭州师范大学,浙江 杭州 311121
31.10.2022
|
Subjects | |
Online Access | Get full text |
ISSN | 1006-5911 |
DOI | 10.13196/j.cims.2022.10.013 |
Cover
Summary: | TP311.13; 针对传统流程发现算法在处理大规模事件日志时的性能瓶颈问题,提出一种基于轨迹信息增量的日志采样方法,通过量化事件之间的直接跟随关系和轨迹的特征信息,将轨迹是否带有新的流程行为作为采样标准,基于统计理论确定了最小连续遍历样本数量.为了进一步提高预处理速度,提出二进制指数跳跃算法来避免扫描重复轨迹.通过4个真实事件日志的实验表明,所提采样方法可以快速有效地缩小事件日志的规模,并保留关键的控制流和频率信息,同时提高流程发现算法的运行速度. |
---|---|
ISSN: | 1006-5911 |
DOI: | 10.13196/j.cims.2022.10.013 |