深度强化学习落地宝典（3）——算法选择篇

时间 2021-01-12

原文原文链接

目录前言强化学习——探索和利用的平衡游戏 DQN DDPG A3C 其他算法前言虽然每年RL方向的paper满天飞，但真正具有普遍实用价值的突破性工作实在不多，大多数还是在经典框架基础上的改进和扩展。DRL常规武器库里的存货主要还是老三样：DQN，DDPG和A3C，它们是深度学习时代最成熟、最能体现智慧结晶的三个DRL框架，你可以在GitHub上找到无数相关代码，有OpenAI，NVIDI

>>阅读原文<<