TensorFlow 2.0深度强化学习指南

在本教程中,我将经过实施Advantage Actor-Critic(演员-评论家,A2C)代理来解决经典的CartPole-v0环境,经过深度强化学习(DRL)展现即将推出的TensorFlow2.0特性。虽然咱们的目标是展现TensorFlow2.0,但我将尽最大努力让DRL的讲解更加平易近人,包括对该领域的简要概述。python 事实上,因为2.0版本的焦点是让开发人员的生活变得更轻松,因此
相关文章
相关标签/搜索