马尔科夫决策过程MDP

出处:http://www.fengchang.cc/post/11 参考这里 和 这里 A Markov Decision Process (MDP) model contains: A set of possible world states S. A set of Models. A set of possible actions A. A real valued reward functi
相关文章
相关标签/搜索