面向行为不变性的事件日志采样方法

TP301; 信息系统在执行过程中收集了大量的业务流程事件日志,模型发现旨在从事件日志的行为信息中发现流程模型为业务流程理解和改进提供事实依据.直接跟随活动关系(DF)作为事件日志中最基本的行为信息是模型发现算法的基础.根据是否考虑日志的DF频次特征,将已有模型发现算法分为考虑频次和不考虑频次两类.已有面向模型发现的日志采样方法注重于提高模型发现的效率,却损失了事件日志中DF频次信息,得到的样本日志在使用基于DF频次的模型发现算法时改变了原始日志的行为.因此,针对基于DF频次的模型发现算法,提出一种面向行为不变性的日志采样方法,具体而言,该方法包括通过按比率选取轨迹变体及频次、计算轨迹的DF权...

Full description

Saved in:
Bibliographic Details
Published in计算机集成制造系统 Vol. 30; no. 8; pp. 2809 - 2821
Main Authors 张帅鹏, 刘聪, 苏轩, 闻立杰, 宋容嘉, 曾庆田
Format Journal Article
LanguageChinese
Published 山东科技大学计算机科学与工程学院,山东 青岛 266590%清华大学 软件学院,北京 100084%杭州电子科技大学管理学院,浙江 杭州 310018%山东科技大学计算机科学与工程学院,山东 青岛 266590 01.08.2024
山东理工大学计算机科学与技术学院,山东 淄博 255000%山东理工大学计算机科学与技术学院,山东 淄博 255000
Subjects
Online AccessGet full text
ISSN1006-5911
DOI10.13196/j.cims.2023.BPM21

Cover

Loading…
Abstract TP301; 信息系统在执行过程中收集了大量的业务流程事件日志,模型发现旨在从事件日志的行为信息中发现流程模型为业务流程理解和改进提供事实依据.直接跟随活动关系(DF)作为事件日志中最基本的行为信息是模型发现算法的基础.根据是否考虑日志的DF频次特征,将已有模型发现算法分为考虑频次和不考虑频次两类.已有面向模型发现的日志采样方法注重于提高模型发现的效率,却损失了事件日志中DF频次信息,得到的样本日志在使用基于DF频次的模型发现算法时改变了原始日志的行为.因此,针对基于DF频次的模型发现算法,提出一种面向行为不变性的日志采样方法,具体而言,该方法包括通过按比率选取轨迹变体及频次、计算轨迹的DF权重和基于集合覆盖采样三个阶段,使得样本日志包含的行为信息与原始日志一致.通过公开事件日志数据集上的实验分析表明,与已有的日志采样方法比较本文方法得到的样本日志能更准确地保留原始日志中的DF频次信息,从而确保更高的模型挖掘质量.
AbstractList TP301; 信息系统在执行过程中收集了大量的业务流程事件日志,模型发现旨在从事件日志的行为信息中发现流程模型为业务流程理解和改进提供事实依据.直接跟随活动关系(DF)作为事件日志中最基本的行为信息是模型发现算法的基础.根据是否考虑日志的DF频次特征,将已有模型发现算法分为考虑频次和不考虑频次两类.已有面向模型发现的日志采样方法注重于提高模型发现的效率,却损失了事件日志中DF频次信息,得到的样本日志在使用基于DF频次的模型发现算法时改变了原始日志的行为.因此,针对基于DF频次的模型发现算法,提出一种面向行为不变性的日志采样方法,具体而言,该方法包括通过按比率选取轨迹变体及频次、计算轨迹的DF权重和基于集合覆盖采样三个阶段,使得样本日志包含的行为信息与原始日志一致.通过公开事件日志数据集上的实验分析表明,与已有的日志采样方法比较本文方法得到的样本日志能更准确地保留原始日志中的DF频次信息,从而确保更高的模型挖掘质量.
Abstract_FL Considerable amounts of business process event logs are collected by information systems,model discovery aims to discover process models from event logs to provide evidence for business process improvement.As the most basic behavior information in the event log,Directly Follow relation(DF)is the basis of the model discovery algo-rithm.According to the frequency of the directly follow relation in the event log,the existing model discovery algo-rithms can be divided into two types:with frequency and without frequency.The existing log sampling methods for model discovery focus on improving the efficiency of model discovery,but lose the DF frequency information in the event log.The sample log obtained changes the behavior of the original log when using the DF frequency-based model discovery algorithm.Therefore,for the DF frequency-based model discovery algorithm,a behavior invariance-oriented event log sampling method was proposed,which included three-stage sampling process of reducing the fre-quency of trace variants,calculating the DF weight of the trace and one-time set coverage sampling method to ensure that the behavior of the process model mined with the sample event log and the original log was consistent.Through the experimental analysis on the public event log data set,compared with the existing log sampling methods,the proposed sample log could more accurately retain the DF frequency information in the original log,thus ensuring a higher quality of model mining.
Author 刘聪
宋容嘉
闻立杰
苏轩
张帅鹏
曾庆田
AuthorAffiliation 山东理工大学计算机科学与技术学院,山东 淄博 255000%山东理工大学计算机科学与技术学院,山东 淄博 255000;山东科技大学计算机科学与工程学院,山东 青岛 266590%清华大学 软件学院,北京 100084%杭州电子科技大学管理学院,浙江 杭州 310018%山东科技大学计算机科学与工程学院,山东 青岛 266590
AuthorAffiliation_xml – name: 山东理工大学计算机科学与技术学院,山东 淄博 255000%山东理工大学计算机科学与技术学院,山东 淄博 255000;山东科技大学计算机科学与工程学院,山东 青岛 266590%清华大学 软件学院,北京 100084%杭州电子科技大学管理学院,浙江 杭州 310018%山东科技大学计算机科学与工程学院,山东 青岛 266590
Author_FL ZHANG Shuaipeng
LIU Cong
SU Xuan
SONG Rongjia
WEN Lijie
ZENG Qingtian
Author_FL_xml – sequence: 1
  fullname: ZHANG Shuaipeng
– sequence: 2
  fullname: LIU Cong
– sequence: 3
  fullname: SU Xuan
– sequence: 4
  fullname: WEN Lijie
– sequence: 5
  fullname: SONG Rongjia
– sequence: 6
  fullname: ZENG Qingtian
Author_xml – sequence: 1
  fullname: 张帅鹏
– sequence: 2
  fullname: 刘聪
– sequence: 3
  fullname: 苏轩
– sequence: 4
  fullname: 闻立杰
– sequence: 5
  fullname: 宋容嘉
– sequence: 6
  fullname: 曾庆田
BookMark eNrjYmDJy89LZWCQMjTQMzQ2tDTTz9JLzswt1jMyMDLWcwrwNTJkYeA0NDAw0zW1NDTkYOAtLs5MAnJNzYzNTU05GQxezl30dMLEFwt7nuzY9WRH79P-Gc8alj-f1fJkV_eT3dueTV_6dP_0l-3tzxZsfzZt57PNU3kYWNMSc4pTeaE0N0Oom2uIs4euj7-7p7Ojj26xoYGpuW6iRZo50IZkI_NEc6MUoxRzE0PDVHPTlJRUsyQT8xTLFFNLy1SzZOPUFBNzQ8Mky9Q0U6NEQ9NkgyQTQzOgkDE3gxbE3PLEvLTEvPT4rPzSojygjfFZxVlZyVVVFSVAP5oYWBgYmhsDAIj3Wl4
ClassificationCodes TP301
ContentType Journal Article
Copyright Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
Copyright_xml – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
DBID 2B.
4A8
92I
93N
PSX
TCJ
DOI 10.13196/j.cims.2023.BPM21
DatabaseName Wanfang Data Journals - Hong Kong
WANFANG Data Centre
Wanfang Data Journals
万方数据期刊 - 香港版
China Online Journals (COJ)
China Online Journals (COJ)
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
DocumentTitle_FL Behavior invariance oriented event log sampling method
EndPage 2821
ExternalDocumentID jsjjczzxt202408017
GroupedDBID 2B.
4A8
92I
93N
ALMA_UNASSIGNED_HOLDINGS
CDYEO
PSX
TCJ
ID FETCH-LOGICAL-s1057-a8f7375c27a72d2d7411e75dde6b47d9d599e6c3ed4711b9ef52a15c0b4164713
ISSN 1006-5911
IngestDate Thu May 29 04:00:06 EDT 2025
IsPeerReviewed true
IsScholarly true
Issue 8
Keywords model discovery
behavior invariance
事件日志
行为不变性
log sampling
模型发现
日志采样
event log
Language Chinese
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-s1057-a8f7375c27a72d2d7411e75dde6b47d9d599e6c3ed4711b9ef52a15c0b4164713
PageCount 13
ParticipantIDs wanfang_journals_jsjjczzxt202408017
PublicationCentury 2000
PublicationDate 2024-08-01
PublicationDateYYYYMMDD 2024-08-01
PublicationDate_xml – month: 08
  year: 2024
  text: 2024-08-01
  day: 01
PublicationDecade 2020
PublicationTitle 计算机集成制造系统
PublicationTitle_FL Computer Integrated Manufacturing Systems
PublicationYear 2024
Publisher 山东科技大学计算机科学与工程学院,山东 青岛 266590%清华大学 软件学院,北京 100084%杭州电子科技大学管理学院,浙江 杭州 310018%山东科技大学计算机科学与工程学院,山东 青岛 266590
山东理工大学计算机科学与技术学院,山东 淄博 255000%山东理工大学计算机科学与技术学院,山东 淄博 255000
Publisher_xml – name: 山东理工大学计算机科学与技术学院,山东 淄博 255000%山东理工大学计算机科学与技术学院,山东 淄博 255000
– name: 山东科技大学计算机科学与工程学院,山东 青岛 266590%清华大学 软件学院,北京 100084%杭州电子科技大学管理学院,浙江 杭州 310018%山东科技大学计算机科学与工程学院,山东 青岛 266590
SSID ssib006563755
ssib023646381
ssib001102950
ssib051375755
ssib023167363
ssib036438063
ssib000459500
ssib002258428
Score 2.422621
Snippet TP301;...
SourceID wanfang
SourceType Aggregation Database
StartPage 2809
Title 面向行为不变性的事件日志采样方法
URI https://d.wanfangdata.com.cn/periodical/jsjjczzxt202408017
Volume 30
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMw1V3Na9RAFA-1vXgRRcVvCjqnZWsyyWTmHWd2U4pYEWyht5JPteAKdkXZkwehBxX1oBVBUEH8AwSt9eA_s13tf-F7k3Q3dVWqN2EJb5M3837vg8l7SWbGcc7hwJgnihYfTLy4GfC0aMZJUTQ5JRdZmOShpAnO85fCucXgwpJYmpi6U59d0k1m0t4v55X8i1fxHPqVZsn-hWeHneIJpNG_eEQP43FPPmYRMGgzzVkkGLgMPBYppj2mWiwKmFHM6IpQbeJRswwUi0L6vkFLFkkGmqnA8iBhLGGYCYkHJNOCWplZolGWkvTDS9plxhIQMgNEGJ-V21juZLoWSURgUAoSUPK3LCSEbZiyUpQi5IRNWblgsbnUCvtEMEQYBsMvkC2ilmURVjNBjRCF2sVC_SoCoTym9eiKIjXRDkgYNB2MrgBhLAVqY40RknWNW38ywoPhd3llLFsUHv1KQ6OG1IG0zkD1NOmDPDqwFkcCpYZ_tM6w-ZC5dGFkZZVewaPVZMSD8IFCgbfGITWqSAEbKYaj-RuYMwm0PBfWfaUdBcVJKWc33saOvWZrIfIb0Rh8pI4NKd1q0KsdDLFSDkVru1IDIhuAyCeqvsDdm-3kyHbYRP0OSkg9QxmeHkZQYxxBg948ecqi-6_9WEsu6OmdgCq5qLIP362NsqqeSigXamkpV-VKAmMpD91Dbc6TXr9B-w9wf8Zcni-Zf1pKfmV1ZSXt9e52uV3ZEG_G-5wpjvW1O-lM6fb8xSv1Sg9EbeVOrBI4iPqUeaxcak8usCz05WiKO6cFNmor-9E2FXinH6YS-NdX7ui68LC1tHtUD61UTXEk_c6PaWfnWHaKuHO1Vg4sHHQOVHX8tC4H5UPORO_aYcfdfvV268nT728e9jc2-xuPth6_GNx7_-3l_f7mg_6Xj4P1d1tf17fX1gavPw2efx58eHbEWZyNFlpzzWpLmuYqbYjejFUhEWnKZSx5xjOsx7xcCswRwySQGWQCIA9TP88w6fcSyAvBY0-kbhLQwo2ef9SZ7Nzs5MecaS9MvUJJH4qCatYsUTnkroizMIgDLLyOO2crDZerW87q8rgDT-yJ66SzfzRAnnImu7du56exmOomZyrH_wBaU_vr
linkProvider EBSCOhost
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E9%9D%A2%E5%90%91%E8%A1%8C%E4%B8%BA%E4%B8%8D%E5%8F%98%E6%80%A7%E7%9A%84%E4%BA%8B%E4%BB%B6%E6%97%A5%E5%BF%97%E9%87%87%E6%A0%B7%E6%96%B9%E6%B3%95&rft.jtitle=%E8%AE%A1%E7%AE%97%E6%9C%BA%E9%9B%86%E6%88%90%E5%88%B6%E9%80%A0%E7%B3%BB%E7%BB%9F&rft.au=%E5%BC%A0%E5%B8%85%E9%B9%8F&rft.au=%E5%88%98%E8%81%AA&rft.au=%E8%8B%8F%E8%BD%A9&rft.au=%E9%97%BB%E7%AB%8B%E6%9D%B0&rft.date=2024-08-01&rft.pub=%E5%B1%B1%E4%B8%9C%E7%A7%91%E6%8A%80%E5%A4%A7%E5%AD%A6%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%A7%91%E5%AD%A6%E4%B8%8E%E5%B7%A5%E7%A8%8B%E5%AD%A6%E9%99%A2%2C%E5%B1%B1%E4%B8%9C+%E9%9D%92%E5%B2%9B+266590%25%E6%B8%85%E5%8D%8E%E5%A4%A7%E5%AD%A6+%E8%BD%AF%E4%BB%B6%E5%AD%A6%E9%99%A2%2C%E5%8C%97%E4%BA%AC+100084%25%E6%9D%AD%E5%B7%9E%E7%94%B5%E5%AD%90%E7%A7%91%E6%8A%80%E5%A4%A7%E5%AD%A6%E7%AE%A1%E7%90%86%E5%AD%A6%E9%99%A2%2C%E6%B5%99%E6%B1%9F+%E6%9D%AD%E5%B7%9E+310018%25%E5%B1%B1%E4%B8%9C%E7%A7%91%E6%8A%80%E5%A4%A7%E5%AD%A6%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%A7%91%E5%AD%A6%E4%B8%8E%E5%B7%A5%E7%A8%8B%E5%AD%A6%E9%99%A2%2C%E5%B1%B1%E4%B8%9C+%E9%9D%92%E5%B2%9B+266590&rft.issn=1006-5911&rft.volume=30&rft.issue=8&rft.spage=2809&rft.epage=2821&rft_id=info:doi/10.13196%2Fj.cims.2023.BPM21&rft.externalDocID=jsjjczzxt202408017
thumbnail_s http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fjsjjczzxt%2Fjsjjczzxt.jpg