Agent Inspired Trading Using Recurrent Reinforcement Learning and LSTM Neural Networks论文解析

为什么要翻译这篇文章     本人利用DNN和RNN做了深度强化学习的策略,本质上是一个基于策略梯度的强化学习,翻看这个作者的论文发现,核心思路是一模一样的,差别在于细节的处理,先说说和作者的相似之处: 用神经网络来表示一个确定性策略;状态空间是一个连续的,从神经网络的角度来讲,就是所谓的特征。这样做必须要解决的问题就是把状态到动作的映射变成一个连续可导的函数,由于在交易中,我们有最小交易单位,比
相关文章
相关标签/搜索