强化学习,深度学习,深度强化学习

1.深度学习:任何经过神经网络的训练和学习都是深度学习网络 2.强化学习:基于MDP(马尔可夫决策过程),经过状态(state),决策(action),以及奖励(reward)和转化几率来进行学习的就是强化学习,经过求Q*(state,action),求pai*,复杂一点就可能不知道奖励和转化几率函数 3.深度强化学习:深度学习和强化学习的结合,就是经过定义一个函数Q(s,a)=w1*featur
相关文章
相关标签/搜索