马尔科夫决策过程

Markov Decision Processes 资料来源:http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching_files/MDP.pdf Markov Process可表示为 < S , P > <S, P> <S,P> 其中 S S S为有限状态集, P P P为状态转移矩阵,我们关注的是状态的转移 MRP( Ma
相关文章
相关标签/搜索