强化学习(RL)原理以及数学模型

强化学习简介 1强化学习与机器学习的关系 2强化学习的一些小案例 强化学习的原理 强化学习的数学原理 1建模的思路 2 马尔可夫过程 3 马尔可夫决策过程MDP 1.强化学习简介 1.1强化学习与机器学习的关系 强化学习是机器学习的一个分支,强调如何基于环境行动,以取得最大化的预期利益,其灵感来源于心理学中的行为主义理论,即有机体如何在环境的奖励或惩罚刺激下,逐步造成对刺激的预期,产生能最大化利益
相关文章
相关标签/搜索