基于文本知识库的强化学习技术——Learning to Win by Reading Manuals in a Monte-Carlo Framework

论文链接:http://people.csail.mit.edu/branavan/papers/acl2011.pdf 文章目录 1. 背景介绍 2. 将攻略文本引入值函数 Q ( s , a ) Q(s, a) Q(s,a) 评价 2.1 复杂环境下使用传统 Q ( s , a ) Q(s, a) Q(s,a) 函数的缺陷 2.2 设计 Q ( s , a , d ) Q(s, a, d) Q
相关文章
相关标签/搜索