基于Q-Learning算法的机器人路径规划

最近一直在研究强化学习中的Q学习算法,鉴于网上的代码对于新手来讲太过于复杂,我在MATLAB以及Python下都写了相对容易的代码,以便于新手理解与学习。python python代码:算法 ''' 1,环境:先从简单的6x6的方格环境作起,起始位置为右下角,终止位置为右上角, 其中选中两处为障碍物,其他的位置为平地,环境的选择为坐标系(0,0)->(5,5). 2,选择的动做为‘上下左右’,步长
相关文章
相关标签/搜索