Mastering Complex Control in MOBA Games with Deep Reinforcement Learning(论文笔记)

本文由腾讯AI Lab跟天美发表,用于王者荣耀1v1的AI训练,达成99.81%的胜率。文章分了几个部分进行讲解。 大系统 整个框架分为四个模块:RL Learner,AI Server,Dispatch module与Memory Pool,如下图: AI Server:此模块用当前的agent与游戏环境进行交互来收集数据,一个AI Server绑定一个cpu,agent会copy到cpu中,为
相关文章
相关标签/搜索