摘要: 为解决移动机器人仓储系统中的多自动导引车(AGV)无冲突运动规划问题,建立了Markov决策过程模型,提出一种新的基于深度Q网络(DQN)的求解方法。将AGV的位置作为输入信息,利用DQN估计该状态下采取每个动作所能获得的最大期望累计奖励,并采用经典的深度Q学习算法进行训练。算例计算结果表明,该方法可以有效克服AGV车队在运动中的碰撞问题,使AGV车队能够在无冲突的情况下完成货架搬运任务。与已有启发式算法相比,该方法求得的AGV运动规划方案所需要的平均最大完工时间更短。
中图分类号:
孙辉, 袁维. 基于深度强化学习的多自动导引车运动规划[J]. 计算机集成制造系统, 2024, 30(2): 708-716.
SUN Hui, YUAN Wei. Multi-AGV motion planning based on deep reinforcement learning[J]. Computer Integrated Manufacturing System, 2024, 30(2): 708-716.