Mastering Complex Control in MOBA Games with Deep Reinforcement Learning（论文笔记）

时间 2020-12-24

原文原文链接

本文由腾讯AI Lab跟天美发表，用于王者荣耀1v1的AI训练，达成99.81%的胜率。文章分了几个部分进行讲解。大系统整个框架分为四个模块：RL Learner，AI Server，Dispatch module与Memory Pool，如下图： AI Server：此模块用当前的agent与游戏环境进行交互来收集数据，一个AI Server绑定一个cpu，agent会copy到cpu中，为