Q-Learning

Q-Learning 什么是 Q-learning? 强化学习中的一种 values-based 算法,最终应是会学出一个收敛的表格 Q-Table。 在Q-Learning的学习中,我们用Q(S, A)来表示value function.之前我们只讨论了有限个状态(state)和行动(action)的情况,这种情况下,我们其实等价于在不断维护一个Q-table,不断更新,直至其收敛。
相关文章
相关标签/搜索