【强化学习】第三篇--蒙特卡洛方法

做者:王小草 笔记时间:2019年1月22日web 1 蒙特卡罗法的起源 蒙特卡罗法的名字来源于世界著名的赌城蒙特卡罗。是用随机数来解决计算问题,即以几率为基础的方法。bootstrap 套路是:生成随机样本–>试验屡次–>总结经验框架 利用蒙特卡罗法计算圆周率π: ide 利用蒙特卡罗法测量不规则图形的面积: svg 2 蒙特卡罗法MC概述 2.1 MC与DP的差别 首先来看看马尔科夫决策过程的
相关文章
相关标签/搜索