Deep Reinforcement Learning for High Precision Assembly Tasks

文献目录 本篇论文的目的是控制机械臂在组件装配精度高于机器人控制精度的情况下实现轴孔的装配。本文使用双层LSTM网络结构来作为状态-行为价值函数Q的近似,输入为机械臂的力-力矩传感器反馈信号以及机械臂末端的近似位置,输出为机械臂末端三个轴上施加的力与两个方向上姿态的旋转角度。从演示视频来看效果还是很不错的。 该论文实验中有一个前置条件:假设轴已经被抓且与孔板相接触。那么这篇论文其实就是分两步走:一
相关文章
相关标签/搜索