强化学习w/ Keras + OpenAI的实践:Actor-Critic模型

快速回顾 在上次的Keras/OpenAI教程中,讨论了一个非常基础的强化学习算法——DQN(深度Q网络)。这个“深度Q网络”是近几年刚出现的新兴事物,所以,如果你能够理解甚至运用这个算法,那就太了不起了。首先,还是快速地回顾一下取得的惊人成绩:一开始,对于一个好算法的开发几乎一概不知;而现在,已经能够探索的环境,并且完成试验了。 可以设身处地的想,这有点像让你玩一个既没有游戏规则,也没有最终目标
相关文章
相关标签/搜索