《reinforcement learning:an introduction》第十章《On-policy Control with Approximation》总结

由于组里新同学进来,需要带着他入门RL,选择从silver的课程开始。 对于我自己,增加一个仔细阅读《reinforcement learning:an introduction》的要求。 因为之前读的不太认真,这一次希望可以认真一点,将对应的知识点也做一个简单总结。 The present chapter features the semi-gradient Sarsa algorithm(即
相关文章
相关标签/搜索