【RL从入门到放弃】【二十五】

一直在纠结强化学习的env环节,今天来看看google团队提供的horizen: 今日,Facebook 开源了适合大规模产品和服务的强化学习平台 Horizon,这是第一个使用强化学习在大规模生产环境中优化系统的开源端到端平台。Horizon 包含的工作流程和算法建立在开放的框架上(PyTorch 1.0、Caffe2、Spark),任何使用 RL 的人都可以访问 Horizon。去年,Face
相关文章
相关标签/搜索