多巴胺:谷歌开源新型增强学习框架

  https://www.cnblogs.com/DicksonJYL/p/9569139.html   Google 近日宣布开源一个新的基于 Tensorflow 的框架 —— Dopamine,旨在为新手和资深 RL(强化学习)研究人员提供灵活性、稳定性和可重复性。该框架受大脑中的奖励动机行为启发,反映了神经科学与强化学习研究之间的强历史联系,旨在实现可以推动激进发现的投机性研究。 Dop
相关文章
相关标签/搜索