揭秘深度强化学习-3强化学习理论依据——马尔科夫决策过程

看完觉得深受启发的一篇文章,根据自己的理解翻译过来留以后再次翻看 原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/ 马尔科夫决策过程(Markov Decision Process) 现在我们来看看如何构造一个强化学习问题的公式。最常用的是基于马尔科夫决策过程(Markov decision process)。
相关文章
相关标签/搜索