计算机集成制造系统 ›› 2018, Vol. 24 ›› Issue (第7): 1680-1689.DOI: 10.13196/j.cims.2018.07.009
倪维健,韦振胜,曾庆田+,刘彤
摘要: 针对描述具体流程案例信息的自然文本,提出一种案例自动抽取方法,实现了无结构过程文本向结构化事件日志转换,从而为后续的过程挖掘研究提供数据支持。首先对过程文本案例抽取任务进行了形式化描述,抽象出活动/属性实体识别、活动/属性关系识别、活动顺序关系识别3个核心任务,然后应用半监督统计学习技术分别设计了解决方法。选取中文菜谱文档为实例开展了大规模实验研究,对所提出的案例信息抽取方法的有效性进行了全面评估。实验结果表明,所提方法能够在少量人工标注数据的基础上有效利用同领域内大量未标注过程文本提升案例抽取效果,且无需人工设计复杂的规则,具有良好的领域适用性。
中图分类号: