强化学习的另一种策略(二)

我们在上一篇文章中简单给大家介绍了反向强化学习的相关概念以及如何理解反向强化学习的知识。通过这些,相信大家对于反向强化学习已经有了一个深刻的理解,我们将在这篇文章中继续为大家介绍反向强化学习的内容,希望这篇文章能够帮助大家更好地理解反向强化学习。 反向强化学习的一般思路是什么呢?其实思路很简单,总共有四点,第一点就是随机生成一个策略作为agent的初始策略。第二点就是通过比较高手的交互样本和自身的
相关文章
相关标签/搜索