SEED RL:大规模分布式强化学习框架

SEED RL:Scalable, Efficient Deep-RL,每秒处理数百万张图片的分布式强化学习框架。 目录 基本架构 学习过程 总结  基本架构 Actor由大量CPUs组成,只进行环境交互,不再进行推理采样。 Learner由GPU组成,高度的算力集中,完成推理采样、数据存储及学习训练。 基本结构和GA3C很相似。 学习过程 整体采用批处理机制,批量采样、批量学习。 Inferen
相关文章
相关标签/搜索