强化学习论文(1): Soft Actor-Critic

加州伯克利大学发布的 off-policy model-free强化学习算法,soft actor-critic(SAC) 论文地址为:Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor 假定已经对经典强化学习建模和基本Actor-Critic方法有所了解
相关文章
相关标签/搜索