面向行为不变性的事件日志采样方法
TP301; 信息系统在执行过程中收集了大量的业务流程事件日志,模型发现旨在从事件日志的行为信息中发现流程模型为业务流程理解和改进提供事实依据.直接跟随活动关系(DF)作为事件日志中最基本的行为信息是模型发现算法的基础.根据是否考虑日志的DF频次特征,将已有模型发现算法分为考虑频次和不考虑频次两类.已有面向模型发现的日志采样方法注重于提高模型发现的效率,却损失了事件日志中DF频次信息,得到的样本日志在使用基于DF频次的模型发现算法时改变了原始日志的行为.因此,针对基于DF频次的模型发现算法,提出一种面向行为不变性的日志采样方法,具体而言,该方法包括通过按比率选取轨迹变体及频次、计算轨迹的DF权...
Saved in:
Published in | 计算机集成制造系统 Vol. 30; no. 8; pp. 2809 - 2821 |
---|---|
Main Authors | , , , , , |
Format | Journal Article |
Language | Chinese |
Published |
山东科技大学计算机科学与工程学院,山东 青岛 266590%清华大学 软件学院,北京 100084%杭州电子科技大学管理学院,浙江 杭州 310018%山东科技大学计算机科学与工程学院,山东 青岛 266590
01.08.2024
山东理工大学计算机科学与技术学院,山东 淄博 255000%山东理工大学计算机科学与技术学院,山东 淄博 255000 |
Subjects | |
Online Access | Get full text |
ISSN | 1006-5911 |
DOI | 10.13196/j.cims.2023.BPM21 |
Cover
Loading…
Abstract | TP301; 信息系统在执行过程中收集了大量的业务流程事件日志,模型发现旨在从事件日志的行为信息中发现流程模型为业务流程理解和改进提供事实依据.直接跟随活动关系(DF)作为事件日志中最基本的行为信息是模型发现算法的基础.根据是否考虑日志的DF频次特征,将已有模型发现算法分为考虑频次和不考虑频次两类.已有面向模型发现的日志采样方法注重于提高模型发现的效率,却损失了事件日志中DF频次信息,得到的样本日志在使用基于DF频次的模型发现算法时改变了原始日志的行为.因此,针对基于DF频次的模型发现算法,提出一种面向行为不变性的日志采样方法,具体而言,该方法包括通过按比率选取轨迹变体及频次、计算轨迹的DF权重和基于集合覆盖采样三个阶段,使得样本日志包含的行为信息与原始日志一致.通过公开事件日志数据集上的实验分析表明,与已有的日志采样方法比较本文方法得到的样本日志能更准确地保留原始日志中的DF频次信息,从而确保更高的模型挖掘质量. |
---|---|
AbstractList | TP301; 信息系统在执行过程中收集了大量的业务流程事件日志,模型发现旨在从事件日志的行为信息中发现流程模型为业务流程理解和改进提供事实依据.直接跟随活动关系(DF)作为事件日志中最基本的行为信息是模型发现算法的基础.根据是否考虑日志的DF频次特征,将已有模型发现算法分为考虑频次和不考虑频次两类.已有面向模型发现的日志采样方法注重于提高模型发现的效率,却损失了事件日志中DF频次信息,得到的样本日志在使用基于DF频次的模型发现算法时改变了原始日志的行为.因此,针对基于DF频次的模型发现算法,提出一种面向行为不变性的日志采样方法,具体而言,该方法包括通过按比率选取轨迹变体及频次、计算轨迹的DF权重和基于集合覆盖采样三个阶段,使得样本日志包含的行为信息与原始日志一致.通过公开事件日志数据集上的实验分析表明,与已有的日志采样方法比较本文方法得到的样本日志能更准确地保留原始日志中的DF频次信息,从而确保更高的模型挖掘质量. |
Abstract_FL | Considerable amounts of business process event logs are collected by information systems,model discovery aims to discover process models from event logs to provide evidence for business process improvement.As the most basic behavior information in the event log,Directly Follow relation(DF)is the basis of the model discovery algo-rithm.According to the frequency of the directly follow relation in the event log,the existing model discovery algo-rithms can be divided into two types:with frequency and without frequency.The existing log sampling methods for model discovery focus on improving the efficiency of model discovery,but lose the DF frequency information in the event log.The sample log obtained changes the behavior of the original log when using the DF frequency-based model discovery algorithm.Therefore,for the DF frequency-based model discovery algorithm,a behavior invariance-oriented event log sampling method was proposed,which included three-stage sampling process of reducing the fre-quency of trace variants,calculating the DF weight of the trace and one-time set coverage sampling method to ensure that the behavior of the process model mined with the sample event log and the original log was consistent.Through the experimental analysis on the public event log data set,compared with the existing log sampling methods,the proposed sample log could more accurately retain the DF frequency information in the original log,thus ensuring a higher quality of model mining. |
Author | 刘聪 宋容嘉 闻立杰 苏轩 张帅鹏 曾庆田 |
AuthorAffiliation | 山东理工大学计算机科学与技术学院,山东 淄博 255000%山东理工大学计算机科学与技术学院,山东 淄博 255000;山东科技大学计算机科学与工程学院,山东 青岛 266590%清华大学 软件学院,北京 100084%杭州电子科技大学管理学院,浙江 杭州 310018%山东科技大学计算机科学与工程学院,山东 青岛 266590 |
AuthorAffiliation_xml | – name: 山东理工大学计算机科学与技术学院,山东 淄博 255000%山东理工大学计算机科学与技术学院,山东 淄博 255000;山东科技大学计算机科学与工程学院,山东 青岛 266590%清华大学 软件学院,北京 100084%杭州电子科技大学管理学院,浙江 杭州 310018%山东科技大学计算机科学与工程学院,山东 青岛 266590 |
Author_FL | ZHANG Shuaipeng LIU Cong SU Xuan SONG Rongjia WEN Lijie ZENG Qingtian |
Author_FL_xml | – sequence: 1 fullname: ZHANG Shuaipeng – sequence: 2 fullname: LIU Cong – sequence: 3 fullname: SU Xuan – sequence: 4 fullname: WEN Lijie – sequence: 5 fullname: SONG Rongjia – sequence: 6 fullname: ZENG Qingtian |
Author_xml | – sequence: 1 fullname: 张帅鹏 – sequence: 2 fullname: 刘聪 – sequence: 3 fullname: 苏轩 – sequence: 4 fullname: 闻立杰 – sequence: 5 fullname: 宋容嘉 – sequence: 6 fullname: 曾庆田 |
BookMark | eNrjYmDJy89LZWCQMjTQMzQ2tDTTz9JLzswt1jMyMDLWcwrwNTJkYeA0NDAw0zW1NDTkYOAtLs5MAnJNzYzNTU05GQxezl30dMLEFwt7nuzY9WRH79P-Gc8alj-f1fJkV_eT3dueTV_6dP_0l-3tzxZsfzZt57PNU3kYWNMSc4pTeaE0N0Oom2uIs4euj7-7p7Ojj26xoYGpuW6iRZo50IZkI_NEc6MUoxRzE0PDVHPTlJRUsyQT8xTLFFNLy1SzZOPUFBNzQ8Mky9Q0U6NEQ9NkgyQTQzOgkDE3gxbE3PLEvLTEvPT4rPzSojygjfFZxVlZyVVVFSVAP5oYWBgYmhsDAIj3Wl4 |
ClassificationCodes | TP301 |
ContentType | Journal Article |
Copyright | Copyright © Wanfang Data Co. Ltd. All Rights Reserved. |
Copyright_xml | – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved. |
DBID | 2B. 4A8 92I 93N PSX TCJ |
DOI | 10.13196/j.cims.2023.BPM21 |
DatabaseName | Wanfang Data Journals - Hong Kong WANFANG Data Centre Wanfang Data Journals 万方数据期刊 - 香港版 China Online Journals (COJ) China Online Journals (COJ) |
DatabaseTitleList | |
DeliveryMethod | fulltext_linktorsrc |
DocumentTitle_FL | Behavior invariance oriented event log sampling method |
EndPage | 2821 |
ExternalDocumentID | jsjjczzxt202408017 |
GroupedDBID | 2B. 4A8 92I 93N ALMA_UNASSIGNED_HOLDINGS CDYEO PSX TCJ |
ID | FETCH-LOGICAL-s1057-a8f7375c27a72d2d7411e75dde6b47d9d599e6c3ed4711b9ef52a15c0b4164713 |
ISSN | 1006-5911 |
IngestDate | Thu May 29 04:00:06 EDT 2025 |
IsPeerReviewed | true |
IsScholarly | true |
Issue | 8 |
Keywords | model discovery behavior invariance 事件日志 行为不变性 log sampling 模型发现 日志采样 event log |
Language | Chinese |
LinkModel | OpenURL |
MergedId | FETCHMERGED-LOGICAL-s1057-a8f7375c27a72d2d7411e75dde6b47d9d599e6c3ed4711b9ef52a15c0b4164713 |
PageCount | 13 |
ParticipantIDs | wanfang_journals_jsjjczzxt202408017 |
PublicationCentury | 2000 |
PublicationDate | 2024-08-01 |
PublicationDateYYYYMMDD | 2024-08-01 |
PublicationDate_xml | – month: 08 year: 2024 text: 2024-08-01 day: 01 |
PublicationDecade | 2020 |
PublicationTitle | 计算机集成制造系统 |
PublicationTitle_FL | Computer Integrated Manufacturing Systems |
PublicationYear | 2024 |
Publisher | 山东科技大学计算机科学与工程学院,山东 青岛 266590%清华大学 软件学院,北京 100084%杭州电子科技大学管理学院,浙江 杭州 310018%山东科技大学计算机科学与工程学院,山东 青岛 266590 山东理工大学计算机科学与技术学院,山东 淄博 255000%山东理工大学计算机科学与技术学院,山东 淄博 255000 |
Publisher_xml | – name: 山东理工大学计算机科学与技术学院,山东 淄博 255000%山东理工大学计算机科学与技术学院,山东 淄博 255000 – name: 山东科技大学计算机科学与工程学院,山东 青岛 266590%清华大学 软件学院,北京 100084%杭州电子科技大学管理学院,浙江 杭州 310018%山东科技大学计算机科学与工程学院,山东 青岛 266590 |
SSID | ssib006563755 ssib023646381 ssib001102950 ssib051375755 ssib023167363 ssib036438063 ssib000459500 ssib002258428 |
Score | 2.422621 |
Snippet | TP301;... |
SourceID | wanfang |
SourceType | Aggregation Database |
StartPage | 2809 |
Title | 面向行为不变性的事件日志采样方法 |
URI | https://d.wanfangdata.com.cn/periodical/jsjjczzxt202408017 |
Volume | 30 |
hasFullText | 1 |
inHoldings | 1 |
isFullTextHit | |
isPrint | |
link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMw1V3Na9RAFA-1vXgRRcVvCjqnZWsyyWTmHWd2U4pYEWyht5JPteAKdkXZkwehBxX1oBVBUEH8AwSt9eA_s13tf-F7k3Q3dVWqN2EJb5M3837vg8l7SWbGcc7hwJgnihYfTLy4GfC0aMZJUTQ5JRdZmOShpAnO85fCucXgwpJYmpi6U59d0k1m0t4v55X8i1fxHPqVZsn-hWeHneIJpNG_eEQP43FPPmYRMGgzzVkkGLgMPBYppj2mWiwKmFHM6IpQbeJRswwUi0L6vkFLFkkGmqnA8iBhLGGYCYkHJNOCWplZolGWkvTDS9plxhIQMgNEGJ-V21juZLoWSURgUAoSUPK3LCSEbZiyUpQi5IRNWblgsbnUCvtEMEQYBsMvkC2ilmURVjNBjRCF2sVC_SoCoTym9eiKIjXRDkgYNB2MrgBhLAVqY40RknWNW38ywoPhd3llLFsUHv1KQ6OG1IG0zkD1NOmDPDqwFkcCpYZ_tM6w-ZC5dGFkZZVewaPVZMSD8IFCgbfGITWqSAEbKYaj-RuYMwm0PBfWfaUdBcVJKWc33saOvWZrIfIb0Rh8pI4NKd1q0KsdDLFSDkVru1IDIhuAyCeqvsDdm-3kyHbYRP0OSkg9QxmeHkZQYxxBg948ecqi-6_9WEsu6OmdgCq5qLIP362NsqqeSigXamkpV-VKAmMpD91Dbc6TXr9B-w9wf8Zcni-Zf1pKfmV1ZSXt9e52uV3ZEG_G-5wpjvW1O-lM6fb8xSv1Sg9EbeVOrBI4iPqUeaxcak8usCz05WiKO6cFNmor-9E2FXinH6YS-NdX7ui68LC1tHtUD61UTXEk_c6PaWfnWHaKuHO1Vg4sHHQOVHX8tC4H5UPORO_aYcfdfvV268nT728e9jc2-xuPth6_GNx7_-3l_f7mg_6Xj4P1d1tf17fX1gavPw2efx58eHbEWZyNFlpzzWpLmuYqbYjejFUhEWnKZSx5xjOsx7xcCswRwySQGWQCIA9TP88w6fcSyAvBY0-kbhLQwo2ef9SZ7Nzs5MecaS9MvUJJH4qCatYsUTnkroizMIgDLLyOO2crDZerW87q8rgDT-yJ66SzfzRAnnImu7du56exmOomZyrH_wBaU_vr |
linkProvider | EBSCOhost |
openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E9%9D%A2%E5%90%91%E8%A1%8C%E4%B8%BA%E4%B8%8D%E5%8F%98%E6%80%A7%E7%9A%84%E4%BA%8B%E4%BB%B6%E6%97%A5%E5%BF%97%E9%87%87%E6%A0%B7%E6%96%B9%E6%B3%95&rft.jtitle=%E8%AE%A1%E7%AE%97%E6%9C%BA%E9%9B%86%E6%88%90%E5%88%B6%E9%80%A0%E7%B3%BB%E7%BB%9F&rft.au=%E5%BC%A0%E5%B8%85%E9%B9%8F&rft.au=%E5%88%98%E8%81%AA&rft.au=%E8%8B%8F%E8%BD%A9&rft.au=%E9%97%BB%E7%AB%8B%E6%9D%B0&rft.date=2024-08-01&rft.pub=%E5%B1%B1%E4%B8%9C%E7%A7%91%E6%8A%80%E5%A4%A7%E5%AD%A6%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%A7%91%E5%AD%A6%E4%B8%8E%E5%B7%A5%E7%A8%8B%E5%AD%A6%E9%99%A2%2C%E5%B1%B1%E4%B8%9C+%E9%9D%92%E5%B2%9B+266590%25%E6%B8%85%E5%8D%8E%E5%A4%A7%E5%AD%A6+%E8%BD%AF%E4%BB%B6%E5%AD%A6%E9%99%A2%2C%E5%8C%97%E4%BA%AC+100084%25%E6%9D%AD%E5%B7%9E%E7%94%B5%E5%AD%90%E7%A7%91%E6%8A%80%E5%A4%A7%E5%AD%A6%E7%AE%A1%E7%90%86%E5%AD%A6%E9%99%A2%2C%E6%B5%99%E6%B1%9F+%E6%9D%AD%E5%B7%9E+310018%25%E5%B1%B1%E4%B8%9C%E7%A7%91%E6%8A%80%E5%A4%A7%E5%AD%A6%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%A7%91%E5%AD%A6%E4%B8%8E%E5%B7%A5%E7%A8%8B%E5%AD%A6%E9%99%A2%2C%E5%B1%B1%E4%B8%9C+%E9%9D%92%E5%B2%9B+266590&rft.issn=1006-5911&rft.volume=30&rft.issue=8&rft.spage=2809&rft.epage=2821&rft_id=info:doi/10.13196%2Fj.cims.2023.BPM21&rft.externalDocID=jsjjczzxt202408017 |
thumbnail_s | http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fjsjjczzxt%2Fjsjjczzxt.jpg |