强化学习（RL）原理以及数学模型

时间 2019-12-04

原文原文链接

强化学习简介 1强化学习与机器学习的关系 2强化学习的一些小案例强化学习的原理强化学习的数学原理 1建模的思路 2 马尔可夫过程 3 马尔可夫决策过程MDP 1.强化学习简介 1.1强化学习与机器学习的关系强化学习是机器学习的一个分支，强调如何基于环境行动，以取得最大化的预期利益，其灵感来源于心理学中的行为主义理论，即有机体如何在环境的奖励或惩罚刺激下，逐步造成对刺激的预期，产生能最大化利益

>>阅读原文<<