强化学习(1)

课程资料参见:https://github.com/zhoubolei/introRL 课件:https://github.com/zhoubolei/introRL/blob/master/lecture1.pdf 数列决策过程 机器感知和机器决策结合起来 和监督学习对比学习 监督学习:有标签 强监督学习会希望数据尽量的i.i.d(IID即随机的)可以消除数据之间的相关性 无监督学习:无标签 强
相关文章
相关标签/搜索