强化学习入门(三)将神经网络引入强化学习,经典算法 DQN

本文内容源自百度强化学习 7 日入门课程学习整理 感谢百度 PARL 团队李科浇老师的课程讲解 文章目录 一、为什么要引入神经网络 二、DQN 算法 2.1 DQN 约等于 Q-learning + 神经网络 2.2 DQN 的两大创新 2.2.1 经验回放 Experience replay 2.2.2 固定 Q 目标 Fixed Q target 2.3 DQN 流程框架图 2.4 PARL
相关文章
相关标签/搜索