【RL从入门到放弃】【十】

1、逆强化学习概述 2、基于最大边际的逆强化学习 学徒学习方法 最大边际规划方法MMP 基于结构化分类的方法   3、基于概率模型的形式化 基于最大信息熵的逆强化学习 基于相对熵的逆强化学习 深度逆向强化学习
相关文章
相关标签/搜索