增强学习(Reinforcement Learning and Control)

原文地址为: 增强学习(Reinforcement Learning and Control)  [pdf版本]增强学习.pdf      在之前的讨论中,我们总是给定一个样本x,然后给或者不给label y。之后对样本进行拟合、分类、聚类或者降维等操作。然而对于很多序列决策或者控制问题,很难有这么规则的样本。比如,四足机器人的控制问题,刚开始都不知道应该让其动那条腿,在移动过程中,也不知道怎么让
相关文章
相关标签/搜索