强化学习论文笔记:Soft Actor Critic算法

Soft Actor Critic是伯克利大学团队在2018年的ICML(International Conference on Machine Learning)上发表的off-policy model-free强化学习算法 论文地址为:Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a
相关文章
相关标签/搜索