《Reinforcement Learning》读书笔记 5：蒙特卡洛（Monte Carlo Methods）

时间 2020-12-30

标签强化学习 reinforcement learning 读书笔记蒙特卡洛 Monte Carlo 繁體版

原文原文链接

《Reinforcement Learning: An Introduction》读书笔记 - 目录问题前面两章都假设我们已知MDP的分布 p(s′,r|s,a) p ( s ′ , r | s , a ) （model），但有时这一点难以做到（第2章的多臂老虎机问题是一个特殊的例子），或者说这种Markov假设可能是不合理的，那么我们只能从真实/模拟环境中去获取这些知识 PS: 以下只考虑

>>阅读原文<<

《Reinforcement Learning》 读书笔记 5：蒙特卡洛（Monte Carlo Methods）

《Reinforcement Learning》读书笔记 5：蒙特卡洛（Monte Carlo Methods）