强化学习如何入门？

时间 2021-01-09

原文原文链接

转自：https://www.itcodemonkey.com/article/3646.html 来自：量子位（微信号：QbitAI），王小新编译整理对于大脑的工作原理，我们知之甚少，但是我们知道大脑能通过反复尝试来学习知识。我们做出合适选择时会得到奖励，做出不切当选择时会受到惩罚，这也是我们来适应环境的方式。如今，我们可以利用强大的计算能力，在软件中对这个具体过程进行建模，这就是强化学习。