计算机集成制造系统 ›› 2024, Vol. 30 ›› Issue (2): 508-519.DOI: 10.13196/j.cims.2021.0597
程玮1,张亚辉2,曹先锋3,金增志3,胡小锋1+
CHENG Wei1,ZHANG Yahui2,CAO Xianfeng3,JIN Zengzhi3,HU Xiaofeng1+#br#
摘要: 针对传统优化算法求解双边装配线第一类平衡问题时不能有效利用历史求解经验,难以得到最优解,提出一种深度强化学习求解算法CNN-PPO。设计了CNN-PPO强化学习智能体结构,在近端策略优化算法基础上,引入卷积神经网络增强智能体的数据特征提取能力;根据双边装配线问题特征,定义状态矩阵对双边装配线问题进行描述,并引入标记层辅助智能体进行任务决策;根据问题优化目标设计了奖励函数,结合强化学习在线执行—评价机制,为每次决策选择最优的待分配任务,并通过多个案例测试验证了算法的有效性和稳定性。实验结果表明,所提方法的求解结果具有优越性,59个测试案例中有57个可以达到下界。
中图分类号: