ProBench:一种评估流程相似性查询算法的基准数据集

doi:10.13196/j.cims.2017.05.018

计算机集成制造系统 ›› 2017, Vol. 23 ›› Issue (第5期): 1069-1079.DOI: 10.13196/j.cims.2017.05.018

ProBench:一种评估流程相似性查询算法的基准数据集

曹斌,王佳星,安卫士,范菁⁺,程时伟

浙江工业大学计算机科学与技术学院

出版日期:2017-05-31 发布日期:2017-05-31
基金资助:
国家自然科学基金资助项目(61602411,61272308);浙江省自然科学基金资助项目(LY15F020030);浙江省重大科技专项重点工业资助项目(2015C01034,2015C01029);杭州市重大科技创新资助项目(20152011A03)。

ProBench:a benchmark dataset for evaluating the process similarity search methods

Online:2017-05-31 Published:2017-05-31
Supported by:
Project supported by the National Natural Science Foundation,China(No.61602411,61272308),the Natural Science Foundation of Zhejiang Province,China(No.LY15F020030),the Key Research and Development Project of Zhejiang Province,China(No.2015C01034,2015C01029),and the Major Science and Technology Innovation Project of Hangzhou City,China(No.20152011A03).

摘要/Abstract

摘要： 针对目前缺乏评估现有流程相似性算法性能的基准数据集问题,在IBM公开的数据集基础上,用Petri网建模流程模型,提出一种评估流程相似性查询算法的基准数据集。该数据集由100个流程模型组成,其中标记出了10个检索流程与其各自的9个相关流程,以及相关流程的排序顺序。对于每个检索流程,其9个相关流程与该检索流程的相关性排序顺序由一个用户调查的结果确定,将该结果作为一个基准对算法的结果进行评估。选取3个基于结构的和1个基于行为的流程相似性查询算法,对它们在准确率和效率两个方面进行了评估,实验结果展示了这些算法各自的适用场景。所提出的基准数据集和相关的算法代码已经公开发布在网上,可供研究人员下载使用。

关键词: 基准数据集, 业务流程, 相似性, Petri网

Abstract: A Benchmark dataset is presented to evaluate the performance of different process similarity search methods.This dataset is built based on the existing public IBM dataset,where the search models,their corresponding relevant models and the order of these relevant models are manually labeled by using the business domain knowledge.The relevant models are manually synthetized by adding,deleting,or combining the relevant nodes and fragments.Based on this dataset,the precision and efficiency of some process similarity search similarity methods in terms of structure and behavior are evaluated.The dataset and corresponding similarity search algorithm codes are available to the public on a website1.

Key words: benchmark dataset, business process, similarity, Petri-net

中图分类号:

TP311

曹斌,王佳星,安卫士,范菁,程时伟. ProBench:一种评估流程相似性查询算法的基准数据集[J]. 计算机集成制造系统, 2017, 23(第5期): 1069-1079.

[1]	郜启凯,李莹,邓水光. 支持跨组织协作的高可靠性服务编排框架[J]. 计算机集成制造系统, 2021, 27(9): 2501-2507.
[2]	唐玄昭,余阳,吴荆璞,潘茂林. 基于区块链的业务流程互操作服务框架[J]. 计算机集成制造系统, 2021, 27(9): 2508-2516.
[3]	孙笑笑,侯文杰,沈沪军,应钰柯,俞东进. 基于上下文感知的多角度业务流程在线异常检测方法[J]. 计算机集成制造系统, 2021, 27(9): 2532-2541.
[4]	鲁法明,崔明浩,包云霞,曾庆田,段华. 基于程序运行轨迹Petri网模型挖掘的死锁检测方法[J]. 计算机集成制造系统, 2021, 27(9): 2611-2624.
[5]	王丽丽,方贤文. 基于行为距离的带隐变迁过程模型挖掘方法[J]. 计算机集成制造系统, 2021, 27(9): 2670-2679.
[6]	闫志强,杨翰宇,程冠杰,刘洪荣,邓水光,刘冠宇,杨明. 基于区块链的服务质量综合评估框架与算法[J]. 计算机集成制造系统, 2021, 27(9): 2708-2720.
[7]	余志强,欧阳森山,孙炜. 基于球谐函数的三维装配体模型相似性分析方法[J]. 计算机集成制造系统, 2021, 27(7): 1974-1980.
[8]	张海军,闫琼,张国辉,李庆宇,余杰. 基于数字孪生的制造资源动态优选决策[J]. 计算机集成制造系统, 2021, 27(2): 521-535.
[9]	李文川,高思源,章鑫,冯良清. 基于随机Petri网的企业RFID技术采纳内化建模与仿真[J]. 计算机集成制造系统, 2020, 26(第2): 470-480.
[10]	何彦,陈文奇,王禹林,岳冠楠,李育锋,田小成. 集成设计参数和制造参数的车削工件机加工能耗预测方法[J]. 计算机集成制造系统, 2020, 26(9): 2355-2366.
[11]	张立彬,吕焕培,胥芳,谭大鹏,陈教料,林琼. 面向低压电器的CPN协同装配任务建模与优化[J]. 计算机集成制造系统, 2020, 26(7): 1737-1748.
[12]	肖宗水,潘凤薇,张宝晨,钱进,孔兰菊. 基于专业能力评价模型的业务流程角色协同调优算法[J]. 计算机集成制造系统, 2020, 26(6): 1465-1472.
[13]	刘聪,程龙,曾庆田,闻立杰,欧阳春. 基于Petri网的分层业务过程挖掘方法[J]. 计算机集成制造系统, 2020, 26(6): 1525-1537.
[14]	黄苾,代飞,王亚博,莫启,曹涌,王雷光. 基于Petri网分析编排的可实现性[J]. 计算机集成制造系统, 2020, 26(6): 1548-1556.
[15]	倪维健,孙宇健,刘彤,曾庆田,刘聪. 基于注意力双向循环神经网络的业务流程剩余时间预测方法[J]. 计算机集成制造系统, 2020, 26(6): 1564-1572.

ProBench:一种评估流程相似性查询算法的基准数据集

ProBench:a benchmark dataset for evaluating the process similarity search methods

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics