基于增强学习的机械臂轨迹跟踪控制

doi:10.13196/j.cims.2018.08.011

计算机集成制造系统 ›› 2018, Vol. 24 ›› Issue (第8): 1996-2004.DOI: 10.13196/j.cims.2018.08.011

基于增强学习的机械臂轨迹跟踪控制

刘卫朋¹,邢关生²,陈海永¹,孙鹤旭¹

1.河北工业大学控制科学与工程学院
2.青岛科技大学自动化与电子工程学院

出版日期:2018-08-31 发布日期:2018-08-31
基金资助:
河北省科技计划资助项目(17211804D);天津市教委科研计划资助项目(20140728);河北省自然科学基金资助项目(F2018202078);河北省首批青年拔尖人才支持计划资助项目(210003);天津市自然科学基金资助项目(16JCQNJC04200)。

Robotic trajectory tracking control method based on reinforcement learning

Online:2018-08-31 Published:2018-08-31
Supported by:
Project supported by the Technology Program of Hebei Province,China(No.17211804D),the Tianjin Municipal Education Commission Research Program,China(No.20140728),the Natural Science Foundation of Hebei Province,China(No.F2018202078),the Young Talents Program in Hebei Province,China(No.210003),and the Natural Science Foundation of Tianjin Province,China(No.16JCQNJC04200).

摘要/Abstract

摘要： 为了提高机器臂轨迹跟踪控制器的工作性能,提出基于增强学习的机械臂轨迹跟踪控制方法。介绍了增强学习的基本原理,提出基于SARSA算法的增强学习补偿控制策略。利用比例—微分(PD)控制器完成了基本的稳定任务后,再利用增强学习算法实现了对未知干扰因素的补偿,提升了对不同未知情况的适应能力。实验结果验证了自适应离散化增强学习方法在机械臂轨迹跟踪问题中的可行性和有效性,明显提高了控制器的学习速度。

关键词: 机器人, 增强学习, 轨迹跟踪, 比例&mdash, 微分控制器, 前馈神经网络

Abstract: To improve the working performance of robotic trajectory tracking controller,the robotic trajectory tracking control method based on reinforcement learning was proposed.The basic principle of reinforcement learning was introduced,and then the robot trajectory tracking control strategy based on SARSA was proposed.By using the reinforcement learning,the unknown disturbance factors were compensated and the adaptability to the unknown was improved after the PD control method was applied.The experimental results verified the feasibility and effectiveness of the reinforcement learning method in the trajectory tracking problem of robot arms,and the learning speed of the controller was enhanced.

Key words: robot, reinforcement learning, trajectory tracking, PD controller, feedforward neural network

中图分类号:

TP242.2

刘卫朋,邢关生,陈海永,孙鹤旭. 基于增强学习的机械臂轨迹跟踪控制[J]. 计算机集成制造系统, 2018, 24(第8): 1996-2004.

[1]	杨旭亭,王孜悦,李凤鸣,宋锐. 基于过程建模的机器人分阶引导装配方法[J]. 计算机集成制造系统, 2021, 27(8): 2321-2330.
[2]	冯春,张祎伟,黄成,姜文彪,武之炜. 双足机器人步态控制的深度强化学习方法[J]. 计算机集成制造系统, 2021, 27(8): 2341-2349.
[3]	林俊义,吴雷,杨梅英,张雪枫,江开勇. 大型自由曲面零件的机器人视觉快速定位方法[J]. 计算机集成制造系统, 2021, 27(7): 1951-1958.
[4]	侯正航,何卫平. 基于数字孪生的飞机装配状态巡检机器人的建模与控制[J]. 计算机集成制造系统, 2021, 27(4): 981-989.
[5]	陈满意,张桥,张弓,梁济民,侯至丞,杨文林,徐征,王建. 多障碍环境下机械臂避障路径规划[J]. 计算机集成制造系统, 2021, 27(4): 990-998.
[6]	赵文政,刘银华,金隼. 面向多机器人协调运动规划的层级化任务分配方法[J]. 计算机集成制造系统, 2021, 27(4): 999-1007.
[7]	徐翔斌,马中强. RMFS订单拣选系统动态货位再指派研究[J]. 计算机集成制造系统, 2021, 27(4): 1146-1154.
[8]	谢绍辉,丁龙伟,戴宁,范需,程筱胜. 基于主应力线的软体气动弯曲驱动器设计[J]. 计算机集成制造系统, 2021, 27(3): 663-671.
[9]	吴铮,陈彦杰,何炳蔚,林立雄,王耀南. 基于方向选择的移动机器人路径规划方法[J]. 计算机集成制造系统, 2021, 27(3): 672-682.
[10]	娄宁,习俊通. 基于光刀图像的机器人示教纠偏方法[J]. 计算机集成制造系统, 2021, 27(3): 683-691.
[11]	孙阳君,赵宁. 基于数字孪生的多自动导引小车系统集中式调度[J]. 计算机集成制造系统, 2021, 27(2): 569-584.
[12]	胡玉蝶,周勇,王宇琦,李卫东. 基于高斯噪声发散的协作机器人路径优化及避障[J]. 计算机集成制造系统, 2021, 27(12): 3503-3510.
[13]	林俊义,张举,李龙喜,肖棋,江开勇. 融合深度图像与密度聚类的下一最佳测量位姿确定方法[J]. 计算机集成制造系统, 2021, 27(11): 3138-3147.
[14]	万国扬,王国峰,李福东,朱文俊. 基于视觉定位与轨迹规划的机器人打磨工作站[J]. 计算机集成制造系统, 2021, 27(1): 119-128.
[15]	翟敬梅,刘坤,徐晓. 室内移动机器人自主导航系统设计与方法[J]. 计算机集成制造系统, 2020, 26(第4): 890-899.

基于增强学习的机械臂轨迹跟踪控制

Robotic trajectory tracking control method based on reinforcement learning

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics