Learning to Design Games Strategic Environments in Reinforcement Learning(部分翻译)

摘要算法 在典型的强化学习(reinforcement learning ,RL)中,(一般是)假设环境给定,而且学习的目标是为代理agent经过与环境的交互采起行动肯定最优策略。在本篇论文中,咱们拓展这种设置,经过考虑环境未给定,但倒是可控的以及可学习的(只要)经过它与代理agent的实时交互。这个扩展是受现实世界中的环境设计场景的启发,包括游戏设计、购物空间设计和交通讯号灯设计。理论上来讲,咱
相关文章
相关标签/搜索