深度强化学习从入门到放弃

本笔记来自于台大李宏毅机器学习课程–Reinforcement Learning 前面写过CNN入门与集成学习,这些均属于监督学习的范畴,而强化学习与监督学习是有很大区别的 其中监督学习是有特征(feature)和标签(label)的,即便是没有标签的,机器也是可以通过特征和标签之间的关系,判断出标签。举例子理解:高考试题是在考试前就有标准答案的,在学习和做题的过程中,可以对照答案,分析问题找出方
相关文章
相关标签/搜索