【强化学习】python 实现 q-learning 例二

本文做者:hhh5460html 本文地址:https://www.cnblogs.com/hhh5460/p/10134855.htmlpython 问题情境 一个2*2的迷宫,一个入口,一个出口,还有一个陷阱。如图算法 (图片来源:https://jizhi.im/blog/post/intro_q_learning)数组  这是一个二维的问题,不过咱们能够把这个降维,变为一维的问题。app
相关文章
相关标签/搜索