股票操作之强化学习基础（三）（Deep Q Network、Actor-critic、Policy gradients）

时间 2021-01-15

原文原文链接

股票操作之强化学习基础（三）（Deep Q Network、Actor-critic、Policy gradients）接上一篇文章继续介绍一些强化学习基础。 1 DQN（Deep Q Network） DQN是一种融合了神经网络和Q-learning的方法。那么DQN提出来的动机是什么呢？Q-learning算法的核心是学习Q-table，然而真实世界的状态非常多，这些状态多到计算机已经无法储

>>阅读原文<<