百度深度强化学习框架PARL技术学习笔记

时间 2020-07-20

标签百度深度强化学习框架 parl 技术笔记繁體版

原文原文链接

目录前言：寄语基础准备和预习第一节课：玩个简单的迷宫游戏吧第二节课：基于表格型方法求解RL 1, SARSA算法 2，Q-Learning算法第三节课：基于神经网络求解RL 第三节课：基于策略梯度求解RL 第四节课：连续动做空间上求解RL 前言：寄语这是一门深度强化学习基础实践课程，为了不你们被数学公式劝退，理论方面讲的不是太深，科老师是两度世界冠军，说这是目前国内最好的强化学习实践课

>>阅读原文<<