Q学习（Q-learning）入门小例子及python实现

时间 2020-05-23

标签学习 learning 入门例子 python 实现栏目 Python 繁體版

原文原文链接

1、从马尔科夫过程到Q学习 # 有必定基础的读者能够直接看第二部分python Q学习（Q-learning）算法是一种与模型无关的强化学习算法，以马尔科夫决策过程（Markov Decision Processes, MDPs）为理论基础。算法标准的马尔科夫决策过程能够用一个五元组<S,A,P,R,γ> 表示，其中：app S是一个离散有界的状态空间； A是一个离散的动做空间； P为状态转移

>>阅读原文<<