论文笔记 Retrospective Analysis of the 2019MineRL Competition on Sample Efficient Reinforcement Learning

摘要 论文作者在NeurIPS2019举办了在利用人类先验知识的sample-efficient强化学习上的MineRL挑战赛。强化学习中agent和环境的交互成本较高,若一个算法可以尽量少地与环境交互,即用尽量少的样本数量进行训练,则该算法是sample efficient的。MineRL挑战赛旨在发展使用协同人类示范(human demonstration)的强化学习来减少样本数量的算法。这些
相关文章
相关标签/搜索