深度强化学习落地宝典(3)——算法选择篇

目录 前言 强化学习——探索和利用的平衡游戏 DQN DDPG A3C 其他算法 前言 虽然每年RL方向的paper满天飞,但真正具有普遍实用价值的突破性工作实在不多,大多数还是在经典框架基础上的改进和扩展。DRL常规武器库里的存货主要还是老三样:DQN,DDPG和A3C,它们是深度学习时代最成熟、最能体现智慧结晶的三个DRL框架,你可以在GitHub上找到无数相关代码,有OpenAI,NVIDI
相关文章
相关标签/搜索