2018-08-03 强化学习

一、强化学习         强化学习包含多种算法,比如有通过行为的价值来选取特定行为的方法, 包括使用表格学习的 q learning, sarsa, 使用神经网络学习的 deep q network, 还有直接输出行为的 policy gradients, 又或者了解所处的环境, 想象出一个虚拟的环境并从虚拟的环境中学习 等等. 参考链接:https://morvanzhou.github.i
相关文章
相关标签/搜索