《强化学习》基础知识(一)

强化学习解决什么问题 ⼀句话概括强化学习能解决的问题:序贯决策问题。 强化学习如何解决问题,和监督学习的区别 与之相对的是监督学习,监督学习解决的是智能感知的问题。比如手写体数字识别,通过多样化的标签数据来训练智能体,让智能体学习到输入样本的抽象特征并分类。 强化学习要解决序贯决策问题,不关心输入长什么样,只关心当前状态下应该采取什么动作才能实现最终的目标,即让整个任务序列达到最优。智能体通过动作
相关文章
相关标签/搜索