【5分钟 Paper】Deep Recurrent Q-Learning for Partially Observable MDPs

时间 2021-01-02

原文原文链接

论文题目：Deep Recurrent Q-Learning for Partially Observable MDPs 这篇论文最开始是15年提出来的，但最新的修订版本是17年的，下文所有内容都以17年版本为主。论文链接：https://arxiv.org/abs/1507.06527 所解决的问题？如题目中所述，作者解决的就是部分可观测马尔可夫决策过程 (Partially-Obs