强化学习Q - learning

做者:牛阿 连接:https://www.zhihu.com/question/26408259/answer/123230350 来源:知乎 著做权归做者全部。商业转载请联系做者得到受权,非商业转载请注明出处。  git 让小鸟学习怎么飞是一个强化学习(reinforcement learning)的过程,强化学习中有状态(state)、动做(action)、奖赏(reward)这三个要素。智能
相关文章
相关标签/搜索