百度强化学习7日课程笔记

百度强化学习7日打卡营课程笔记 上周参加了百度的强化学习7日打卡营,科老师的讲解非常有条理,且将代码与知识点结合起来,使得不擅长公式推导的小白得以了解强化学习领域的入门知识以及百度的PaddlePaddle框架,并且有机会自己尝试调试简单的强化学习程序。 现将部分课程笔记整理如下,共5节课。 第一课-强化学习(RL)概况 第二课-基于表格型方法求解RL 应用场景:离散状态+离散动作,确定性策略 O
相关文章
相关标签/搜索