令人激动!谷歌推强化学习新框架「多巴胺」,基于TensorFlow,已开源丨附github...

郭一璞 发自 凹非寺  量子位 报道 | 公众号 QbitAI 上周那个在DOTA2 TI8赛场上“装逼失败”的OpenAI Five,背后是强化学习的助推。 其实不仅仅是OpenAI Five,下围棋的AlphaGo和AlphaGo Zero、玩雅达利街机游戏的DeepMind DQN(deep Q-network),都离不开强化学习(Reinforcement Learning)。  现在
相关文章
相关标签/搜索