强化学习之Eligibility Traces

Eligibility Traces  Eligibility traces是Reinforcement Learning中的一个基本机制。TD( λ )算法中的 λ 指的就是对Eligibility traces的运用。几乎所有的TD算法,包括Q Learning、Sarsa算法,可以结合Eligibility trace得到一个通用的能更有效学习的方法。   可以从两种视角看待Eligibil
相关文章
相关标签/搜索