王宇1,2,3,徐福丽4+,王怀震5,崔勇6,姜岩4,陶晔6,王译笙1,2,3,张琦4
WANG Yu1,2,3,XU Fuli4+,WANG Huaizhen5,CUI Yong6,JIANG Yan4,TAO Ye6,WANG Yisheng1,2,3,ZHANG Qi4
摘要: 由于工业现场采集的铸管字符图像存在背景模糊、字符区域占比小、刻字位置不固定、油漆遮挡等问题,导致现有模型的检测精度难以满足工业现场的需求。针对上述问题,提出改进的Cascade RCNN铸管字符检测算法。首先对特征金字塔进行改进,提出融合小目标增强的特征金字塔(Small Target Enhancement Feature Pyramid Networks,STE-FPN),利用多尺度特征融合的特征增强能力丰富铸管小目标字符的特征信息。其次引入自矫正/池化的ResNeSt(Self-Calibrated/Pooling ResNeSt,SCP-ResNeSt)作为特征提取网络,利用自矫正卷积和池化操作以提升背景复杂的铸管字符特征提取效率。最后对级联结构进行改进,引进Mask分支结构,可以自适应地检测字符区域并去除干扰区域,优化了检测结果。将改进后的算法在铸管数据集上进行测试,其平均检测精度mAP为99.1%,比原Cascade RCNN算法提高了2.3%。得到的精度表明改进后的性能优于原算法。
中图分类号: