Deep Q-Learning深度加强学习(代码篇)

搭建DQN 初始化 #动做数量 self.n_actions #状态数量 self.n_features #learning_rate学习速率 self.lr #Q-learning中reward衰减因子 self.gamma #e-greedy的选择几率最大值 self.epsilon_max #更新Q现实网络参数的步骤数 self.replace_target_iter #存储记忆的数量
相关文章
相关标签/搜索