强化学习如何入门?

转自:https://www.itcodemonkey.com/article/3646.html 来自:量子位(微信号:QbitAI),王小新编译整理 对于大脑的工作原理,我们知之甚少,但是我们知道大脑能通过反复尝试来学习知识。我们做出合适选择时会得到奖励,做出不切当选择时会受到惩罚,这也是我们来适应环境的方式。如今,我们可以利用强大的计算能力,在软件中对这个具体过程进行建模,这就是强化学习。
相关文章
相关标签/搜索