强化学习笔记01,02——强化学习问题和Multi-arm Bandits

人之所以能适应环境的变化并不断提高解决问题的能力,其原因是人能通过学习积累经验,总结规律,以增长知识和才能,从而更好地改善自己的决策和行为。强化学习的思想来源于人类对动物学习过程的长期观察。在机器学习范畴,依据从系统中获得的反馈不同,机器学习可以分为监督学习,无监督学习和强化学习。 强化学习概念 强化学习要解决的问题: 一个能够感知环境的自治智能体(Agent),如何通过学习选择能够达到目标的最优
相关文章
相关标签/搜索