python实现强化学习

强化学习 强化学习(reinforcement learning),又称再励学习、评价学习,是一种重要的机器学习方法,强化学习是智能体(Agent)以“试错”的方式进行学习,经过与环境进行交互得到的奖赏指导行为,目标是使智能体得到最大的奖赏,强化学习不一样于链接主义学习中的监督学习,主要表如今强化信号上,强化学习中由环境提供的强化信号是对产生动做的好坏做一种评价(一般为标量信号),而不是告诉强化学
相关文章
相关标签/搜索