从零实践强化学习之连续动做空间上求解RL(PARL)

回顾这五节课的内容,其实能够分红四大内容:python 离散状态空间 连续状态空间 离散动做空间 连续状态空间 最后一节课的主要内容就是学习用强化学习来求解连续状态空间的问题web 连续动做空间 连续动做和离散动做是一个相对的概念,经过回顾离散动做来学习什么是连续动做算法 连续动做 VS 离散动做 前面几节课接触到的,好比倒立摆、小乌龟还有雅达利的乒乓球,动做的步长都已经提早给定的,好比按一下就走
相关文章
相关标签/搜索