强化学习主流算法特色总结

强化学习主流算法有Q-learning、Sarsa、Deep Q learning、Policy Gradients、Actor Critic等等,每种算法都有其特色。web 根据莫烦老师的教学视频,将各个算法特色进行总结。方便本身以后科研工做中针对不一样问题特色选择算法,同时加深理解记忆。算法 RL算法总结 Q-learning Sarsa Sarsa-lambda Deep Q Network
相关文章
相关标签/搜索