强化学习导论(Reinforcement Learning:An Introduction)学习笔记(一)

Introduction ​ 我们在思考学习本质时首先想到的可能就是通过与我们的环境进行交互从而学习。当一个婴儿玩耍时,挥动着他的手臂,虽然看起来,他没有明确的老师,但他确实与他的环境有直接的感觉联系。并且这种联系可以产生大量关于因果,行为后果以及为了实现一个目标我们要做什么等信息。在我们的整个生活中,这种交互无疑是我们了解环境和自己的主要知识来源。无论我们是在学习驾驶汽车还是进行对话,我们都非常
相关文章
相关标签/搜索