【5分钟 Paper】Deep Recurrent Q-Learning for Partially Observable MDPs

论文题目:Deep Recurrent Q-Learning for Partially Observable MDPs   这篇论文最开始是15年提出来的,但最新的修订版本是17年的,下文所有内容都以17年版本为主。 论文链接:https://arxiv.org/abs/1507.06527 所解决的问题?   如题目中所述,作者解决的就是部分可观测马尔可夫决策过程 (Partially-Obs
相关文章
相关标签/搜索