百度深度强化学习框架PARL技术学习笔记

目录 前言:寄语 基础准备和预习 第一节课:玩个简单的迷宫游戏吧 第二节课:基于表格型方法求解RL 1, SARSA算法 2,Q-Learning算法 第三节课:基于神经网络求解RL 第三节课:基于策略梯度求解RL 第四节课:连续动做空间上求解RL 前言:寄语 这是一门深度强化学习基础实践课程,为了不你们被数学公式劝退,理论方面讲的不是太深,科老师是两度世界冠军,说这是目前国内最好的强化学习实践课
相关文章
相关标签/搜索