计算机集成制造系统 ›› 2022, Vol. 28 ›› Issue (10): 3225-3238.DOI: 10.13196/j.cims.2022.10.018
朱锐1,2,吕昌龙1,李彤2,3+,何亚辉1,刘航1,张存明1,陈晔婷2,4
ZHU Rui1,2,LYU Changlong1,LI Tong2,3+,HE Yahui1,LIU Hang1,ZHANG Cunming1,CHEN Yeting2,4
摘要: 为打破现有过程挖掘算法在日志缺失时无法使用带来的局限性,基于现有的深度学习、自然语言处理技术基础,提出一种新颖的从过程文本描述中深度自动生成业务过程模型的方法。对现有命名实体方法进行改进,通过BERT,BiLSTM,CRF构建活动实体识别模型,提出面向业务过程的活动实体识别方法;将语言模型从句子级别扩展到文档级别,提出一种通过递归体系结构有序神经网络(ON-LSTM)无监督地发现过程描述文档中所蕴含的活动实体间潜在的层次结构;通过活动实体的层次深度原则,将层次结构树转化为业务过程模型。通过对人工采集与标注的150个真实的SAP产品用户指南文本作为训练数据进行实验,并在ON-LSTM基础上采用K折交叉验证思想对数据进行多次分组实验,验证了所提方法的有效性。
中图分类号: