强化学习及Python代码示例

1 概述 强化学习是机器学习里面的一个分支。它强调如何基于环境而行动,以取得最大化的预期收益。其灵感来源于心理学中的行为主义理论,既有机体如何在环境给予的奖励或者惩罚的刺激下,逐步造成对刺激的预期,产生可以最大利益的习惯性行为。结构简图以下:python 由于强化学习考虑到了自主个体、环境、奖励等因素,因此不少人包括强化学习的研究者Richard Sutton 都认为它是人工智能中最高层的模型,其
相关文章
相关标签/搜索