基于SARSA算法的机器人轴孔装配策略

doi:10.13196/j.cims.2022.0435

计算机集成制造系统 ›› 2023, Vol. 29 ›› Issue (11): 3669-3680.DOI: 10.13196/j.cims.2022.0435

基于SARSA算法的机器人轴孔装配策略

李少东¹,袁小钢¹,牛捷^2,3,4+

1.广西大学广西电力装备智能控制与运维重点实验室
2.智能带电作业技术及装备（机器人）湖南省重点实验室
3.带电巡检与智能作业技术国网公司实验室
4.国家电网有限公司

出版日期:2023-11-30 发布日期:2023-12-04
基金资助:
广西研究生教育创新计划资助项目(YCSW2022014);广西自然科学基金—青年基金资助项目(2022JJB170009);国网湖南超高压输电公司2021年实验室开放性课题(2021KZD2002)。

Robotic peg-in-hole assembly strategy research based on SARSA algorithm

LI Shaodong¹,YUAN Xiaogang¹,NIU Jie^2,3,4+

1.Guangxi Key Laboratory of Intelligent Control and Maintenance of Power Equipment,Guangxi University,
2.Hunan Provincial Key Laboratory of Intelligent Live Working Technology and Equipment (Robot)
3.Live Inspection and Intelligent Operation Technology State Grid Corporation Laboratory
4.State Grid Corporation of China

Online:2023-11-30 Published:2023-12-04
Supported by:
Project supported by the Innovation Project of Guangxi Graduate Education,China(No.YCSW2022014),the Guangxi Natural Science Foundation,China(No.2022JJB170009),and the State Grid Hunan EHV Transmission Line Company Opening Program,China(No.2021KZD2002).

摘要/Abstract

摘要： 为解决机器人装配任务中轴孔位姿不确定问题,提高装配操作的成功率、效率和泛化能力,提出一种基于SARSA算法的变参数导纳控制策略。首先,分析了轴孔装配机理,指导运动控制策略设计。其次,仿真分析了不同导纳参数的位置响应,获得控制器参数。此外,建立了以插孔深度和单次调整移动量为尺度的动作评估机制,解决装配过程奖励函数建模难题,并在动作价值更新过程引入资格迹函数提高算法学习效率。最后,在真实机器人上开展了3组实验,对比基于位置控制和导纳控制的实验结果验证了所提算法在装配成功率和效率上的提升,从不同初始位姿开始装配的实验结果验证了所提算法的泛化能力。结果表明,所提算法有望解决机器人装配任务中轴孔位姿不确定问题。

关键词: 强化学习, 机器人柔顺控制, 轴孔装配, 导纳控制器

Abstract: To solve the problem of uncertain pose (position and pose) of peg and hole for improving the success rate,efficiency,and generalization ability of robot assembly operation,a variable admittance control strategy based on SARSA algorithm was proposed.The mechanism of peg-in-hole assembly was analyzed to guide the design of motion control strategy.Then,the different admittance parameters were analyzed by a series of simulations to obtain the controller parameters.In addition,an action evaluation method combining the displacement in each step and insertion depth was established to solve the problem of complex reward establishment in the assembly process.Meanwhile,qualification trace function is introduced to enhance learning efficiency of SARSA algorithm.Three sets of assembly experiments were implemented on the real robot.The improvement of success rate and efficiency could be verified by position and admittance control experiments.The performance of generalization ability was also validated through experiments in different initial pose.The results indicated that the proposed algorithm could solve the problem of the uncertain pose of peg and hole in the assembly task.

Key words: reinforcement learning, robot compliance control, peg-in-hole assembly, admittance controller

中图分类号:

TP242.2

李少东, 袁小钢, 牛捷. 基于SARSA算法的机器人轴孔装配策略[J]. 计算机集成制造系统, 2023, 29(11): 3669-3680.

LI Shaodong, YUAN Xiaogang, NIU Jie. Robotic peg-in-hole assembly strategy research based on SARSA algorithm[J]. Computer Integrated Manufacturing System, 2023, 29(11): 3669-3680.

[1]	黄岩松, 姚锡凡, 景轩, 胡晓阳. 基于深度Q网络的多起点多终点AGV路径规划[J]. 计算机集成制造系统, 2023, 29(8): 2550-2562.
[2]	马冯超, 陈思溢, 刘锦. 基于云联盟协同机制的利益优化方法[J]. 计算机集成制造系统, 2023, 29(7): 2385-2396.
[3]	刘雨舟, 方贤文. MARL-GPN:一种基于多智能体强化学习的博弈Petri网[J]. 计算机集成制造系统, 2023, 29(5): 1590-1601.
[4]	李国燕, 薛翔, 刘毅, 潘玉恒. 改进TD3的SDN车联网边缘计算卸载策略[J]. 计算机集成制造系统, 2023, 29(5): 1627-1634.
[5]	熊志华, 陈昊, 王长生, 岳明, 侯文彬, 徐斌. 基于深度强化学习的人机协作组装任务分配[J]. 计算机集成制造系统, 2023, 29(3): 789-800.
[6]	蔡静雯, 马玉敏, 黎声益, 刘鹃. 基于Q学习的智能车间自适应调度方法#br#[J]. 计算机集成制造系统, 2023, 29(11): 3727-3737.
[7]	王卓君, 张朋, 张洁. 结合逆向强化学习与强化学习的晶圆批处理设备调度方法[J]. 计算机集成制造系统, 2023, 29(11): 3738-3749.
[8]	贺俊杰, 张洁, 张朋, 郑鹏, 王明. 基于多智能体强化学习的纺织面料染色车间动态调度方法[J]. 计算机集成制造系统, 2023, 29(1): 61-74.
[9]	蔡泽, 胡耀光, 闻敬谦, 张立祥. 复杂动态环境下基于深度强化学习的AGV避障方法[J]. 计算机集成制造系统, 2023, 29(1): 236-245.
[10]	黄子钊, 庄子龙, 滕浩, 秦威, 秦涛, 邹鹰. 自动化码头出口箱箱位分配优化超启发式算法[J]. 计算机集成制造系统, 2022, 28(8): 2619-2632.
[11]	杨琪森, 王慎执, 桑金楠, 王朝飞, 黄高, 吴澄, 宋士吉. 复杂开放水域下智能船舶路径规划与避障方法[J]. 计算机集成制造系统, 2022, 28(7): 2030-2040.
[12]	崔建双, 吕玥, 徐子涵. 基于Q—学习的超启发式模型及算法求解多模式资源约束项目调度问题[J]. 计算机集成制造系统, 2022, 28(5): 1472-1481.
[13]	高鹏, 苏雍贺, 左颖, 陶飞. 基于强化学习的分布式光伏运维资源动态调度[J]. 计算机集成制造系统, 2022, 28(2): 552-563.
[14]	潘柏松, 颜天野, 胡鑫达, 罗路平, 翁微妮. 基于几何约束与隐马尔可夫链模型的轴孔装配策略[J]. 计算机集成制造系统, 2022, 28(12): 3768-3778.
[15]	周晓婷, 吴禄彬, 章宇, 姜善成. 基于不确定需求的无人驾驶出租车优化调度[J]. 计算机集成制造系统, 2022, 28(11): 3433-3442.

基于SARSA算法的机器人轴孔装配策略

Robotic peg-in-hole assembly strategy research based on SARSA algorithm

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics