强化学习 Q学习原理及例子(离散)附matlab程序

原文地址:http://mnemstudio.org/path-finding-q-learning-tutorial.htm 这篇教程通过简单且易于理解的实例介绍了Q-学习的概念知识,例子描述了一个智能体通过非监督学习的方法对未知的环境进行学习。 假设我们的楼层内共有5个房间,房间之间通过一道门相连,正如下图所示。我们将房间编号为房间0到房间4,楼层的外部可以被看作是一间大房间,编号为5。注意到
相关文章
相关标签/搜索