2019年伯克利大学 CS294-112《深度强化学习》第3讲:TensorFlow 和神经网络简述(笔记)

今天课的主要内容是TensorFlow的教程和深度神经网络,由助教Greg Kahn主讲。python 在开始以前,想继续讲一下上周的一些讨论,由于上次最后没有讲完的全部理论,这是上星期的课程的一点尾巴。在不少场景下,模仿学习是一个学习策略的合适方法,可是在另一些场景,模仿学习就力不从心了,这也是课程要讲强化学习的理由。若是你想超越模仿学习,很是重要的是确切的定义出一个决定是好是坏,而不是仅仅说采
相关文章
相关标签/搜索