股票操作之强化学习基础(三)(Deep Q Network、Actor-critic、Policy gradients)

股票操作之强化学习基础(三)(Deep Q Network、Actor-critic、Policy gradients) 接上一篇文章继续介绍一些强化学习基础。 1 DQN(Deep Q Network) DQN是一种融合了神经网络和Q-learning的方法。那么DQN提出来的动机是什么呢?Q-learning算法的核心是学习Q-table,然而真实世界的状态非常多,这些状态多到计算机已经无法储
相关文章
相关标签/搜索