机器学习方法篇(26)------蒙特卡罗方法

● 每周一言 易怒与躁动,是不成熟的表现。 导语 蒙特卡洛,是袖珍之国摩纳哥的一座赌城名字。冯·诺依曼用一个赌城的名字命名蒙特卡洛方法,增加了这个方法的神秘性。那么,MC的算法思想是什么? 蒙特卡罗方法 如上一节所述,MC是一种基于样本而不基于模型的价值学习方法,只需要在不断试错过程当中学习到的经验。总体来说,MC的核心思路步骤是:探索 → 模拟 → 抽样 → 估值 → 策略优化。 在上一节中我们
相关文章
相关标签/搜索