计算机集成制造系统 ›› 2019, Vol. 25 ›› Issue (12): 3181-3190.DOI: 10.13196/j.cims.2019.12.019
娄建楼1,2,李燕1+,王琦3,孙博1,贾俊奇1
摘要: 数据清洗过程是对锅炉设备在线监测数据预处理的一个重要环节,针对数据清洗步骤繁琐,易导致连续性数据被破坏等问题,提出一种基于混合自适应性矩估计和随机梯度下降算法优化的堆栈降噪自编码器的数据清洗方法。首先,引入自适应性矩阵估计和随机梯度下降的混合算法,以不断调整堆栈降噪自编码器模型的网络参数。其次,利用模型训练正常状态数据,获取数据的隐藏特征,得到正常状态下的重构误差。再次,用该模型检测异常状态数据,根据其重构误差分析各种类型的数据对模型的影响,并对“脏数据”和反映设备故障的异常数据进行快速分类清洗修复。通过某电厂锅炉监测数据的清洗修补实验,证明了该方法能准确识别出“脏数据”,修补后的数据亦能遵循数据整体的分布规律,满足了数据的清洗要求,为后续数据分析挖掘和设备故障诊断工作奠定了良好的基础。
中图分类号: