让机器玩游戏的强化学习(附github)

强化学习 强化学习是代理面临的学习问题,它通过与动态环境反复交互试验从而学习到某种行为。它是机器学习的主要学习方法之一,智能体从环境到行为的学习,也就是如何在环境中采取一些列行为,才能使得回报信号函数的值最大,即获得的累积回报最大。 现在强化学习与深度学习结合的深度强化学习更加强大。 马尔科夫决策过程 在理解强化学习之前,我们先了解我们要解决什么样的问题。其实强化学习过程就是优化马尔科夫决策过程,
相关文章
相关标签/搜索