令人激动！谷歌推强化学习新框架「多巴胺」，基于TensorFlow，已开源丨附github...

时间 2021-01-14

原文原文链接

郭一璞发自凹非寺量子位报道 | 公众号 QbitAI 上周那个在DOTA2 TI8赛场上“装逼失败”的OpenAI Five，背后是强化学习的助推。其实不仅仅是OpenAI Five，下围棋的AlphaGo和AlphaGo Zero、玩雅达利街机游戏的DeepMind DQN（deep Q-network），都离不开强化学习（Reinforcement Learning）。现在