深度强化学习——第六~八章Q-Learning

深度强化学习——第六~八章Q-Learning 1. Q-Learning concept 2. Q-Learning Function 2.1 State Value Function Estimation V π ( s ) V^{\pi}(s) Vπ(s) 2.2 State-action Value Function Q π ( s , a ) Q^{\pi}(s, a) Qπ(s,a)
相关文章
相关标签/搜索