摘要: 关系数据库作为企业管理数据的主要工具,在信息系统运行过程中记录下大量事件日志。传统的流程挖掘技术主要处理用文件存储的XES格式日志数据,每次挖掘任务都需要手工从数据库导出最新日志文件,整个过程操作十分繁琐,且无法充分利用关系数据库强大的数据处理能力。针对该问题,研究了面向关系型日志数据的流程挖掘策略与算法。针对关系数据库中储存的大规模事件日志,利用关系数据库的快速排序能力,提出一种挖掘流程任务之间紧邻关系的近似线性挖掘算法,提高了关系型事件日志的流程挖掘效率。该算法对业务数据库侵入性小,具有较好的通用性。该算法已在开源软件平台ProM上实现,通过基于大规模事件日志的对比实验验证了该方法的高效性。
中图分类号: