强化学习

机器学习可以分为三类,分别是 supervised learning,unsupervised learning 和reinforcement learning。而强化学习与其他机器学习不同之处为: 没有教师信号,也没有label。只有reward,其实reward就相当于label。 反馈有延时,不是能立即返回。 相当于输入数据是序列数据。 agent执行的动作会影响之后的数据。 强化学习的关键
相关文章
相关标签/搜索