强化学习论文(1): Soft Actor-Critic

时间 2020-12-30

原文原文链接

加州伯克利大学发布的 off-policy model-free强化学习算法，soft actor-critic（SAC）论文地址为：Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor 假定已经对经典强化学习建模和基本Actor-Critic方法有所了解