对POMDP的认识

知识总结材料来源:https://www.zhihu.com/question/20683006           部分可观察马尔可夫决策过程(partially observable Markov decision processes,POMDP)是环境状态部分可知动态不确定环境下序贯决策的理想模型,其核心点在于,agent无法知道自己所处的环境状态,需要借助于额外的传感器,或者与其他的age
相关文章
相关标签/搜索