机器学习知识点(三十五)蒙特卡罗方法

强化学习中免模型学习采用蒙特卡罗方法去逼近最优解,那这种采样原理是怎样的呢? 1、蒙特卡罗思想       是一类随机方法的统称。这类方法的特点是,可以在随机采样上计算得到近似结果,随着采样的增多,得到的结果是正确结果的概率逐渐加大,但在(放弃随机采样,而采用类似全采样这样的确定性方法)获得真正的结果之前,无法知道目前得到的结果是不是真正的结果。       和拉斯维加斯算法相比,经典的描述就是:
相关文章
相关标签/搜索