Animal-AI 2.0.0发布了!快来测试你的智能体吧。

  游戏环境经常被用来评估智能体的“能力”。一般都是给定状态转移概率,以一个分布或者在当前状态采取某个动作以固定的概率转移到下一个状态,以及奖励函数也是确定的。那真实的世界真的是这样的吗?当然不是,真实的世界要比这复杂地多,就连动物都能学地比这更好。   难道就因为Alphago打败了李世石,我们就喊创造通用人工智能吗?在AlphaGo的算法中究竟是穷举还是智能?从model-free到model
相关文章
相关标签/搜索