学习总结——强化学习入门

近期参加了百度飞桨的零基础入门强化学习课程,经过7天的教学+实践的方式入门学习强化学习,从完成小项目的形式加深对强化学习一些概念和算法的理解和消化。在课程的最后,对整个课程做个简单的知识总结。 目录 强化学习(RL) 概念 学习方案 学习框架 基于表格型方法求解RL Sarsa Q-learning 区别对比 基于神经网络方法求解RL DQN算法 算法流程 基于策略梯度方法求解RL Policy
相关文章
相关标签/搜索