强化学习学习笔记——马尔可夫决策过程(一)

强化学习学习笔记——马尔可夫决策过程(一) 前言 强化学习 从马尔科夫开始 马尔科夫性 马尔科夫过程 前言 虽然不是第一次学强化学习的内容,但这确实是我第一次在网上开始写学习笔记。 写学习笔记的原因有两个: 首先是因为,自己学了好久都学不明白,现在开始下决心把这套东西学透。学习笔记有助于我整理学习的思路,相当于再自己复习一遍,看能否用自己的话把所学的东西说明白。也借用各位的评价来审视自己的理解是否
相关文章
相关标签/搜索