Bandit算法

       在生活中,每一个人都会面临各类各样的选择问题,简单的来讲中午吃什么有不少种可能性,怎么样能提供一种比较好的办法来解决选择难的问题,那就是Bandit算法git       说到Bandit算法,我起初刚看到这个算法的时候是出如今强化学习里面,这个算法主要来源于赌博的问题,主要是这么回事,一我的去赌场摇老虎机,你不知道老虎机是什么能够理解为就是一台机器你摇它的手臂它会往出吐钱,赌场有一
相关文章
相关标签/搜索