第十四讲--深度增强学习--课时33

看了好几遍也没看懂DQN neural network模拟Q-value function可以只将state作为输入,输出为各个Q(state,action)的值。并行计算各个动作,高效。 流程实在看不懂。。。 ----------------------------------------------------------------------------------------------
相关文章
相关标签/搜索