深度学习之感性理解-强化学习简介

深度学习之感性理解-强化学习简介 基本介绍 为什么不能用监督学习 目前最多的应用 强化学习基本结构-actor行动者 总结 基本介绍 简单来说,就是让机器根据环境,动作和奖励,进行自主学习,来更好的完成目的。 举个例子: 比如王者荣耀,我们的目的是打钱,当你的英雄只有10血的时候(环境),面对野区的怪物,你有2种选择,一种是逃命(动作),一种就打到死(动作),如果你选择了逃命,没打到钱(奖励),回
相关文章
相关标签/搜索