基于Q-Learning算法的机器人路径规划

时间 2020-05-23

标签基于 learning 算法机器人路径规划繁體版

原文原文链接

最近一直在研究强化学习中的Q学习算法，鉴于网上的代码对于新手来讲太过于复杂，我在MATLAB以及Python下都写了相对容易的代码，以便于新手理解与学习。python python代码：算法 ''' 1,环境：先从简单的6x6的方格环境作起,起始位置为右下角,终止位置为右上角, 其中选中两处为障碍物,其他的位置为平地，环境的选择为坐标系(0,0)->(5,5). 2,选择的动做为‘上下左右’,步长

>>阅读原文<<