David Silver深度强化学习第1课

时间 2020-12-23

原文原文链接

强化学习本质上是要找到一种最优的方式来做决策。强化学习涉及到很多学科领域，例如它是计算机科学中机器学习的一部分，工业中的优化控制，还有模拟神经科学中的奖励机制的算法，心理学中的条件反射也是一种奖励机制，数学中的运筹学，经济学中的博弈论等，这些都是研究如何做决策能够使效用最大化。强化学习和其他机器学习方法的区别： There is no supervisor, only a reward sig

>>阅读原文<<