强化学习入门总结

目录git 1、强化学习概述github 1.强化学习简介算法 2.发展历程:网络 3.MDP(马儿可夫决策过程)app 4.why RL?框架 5.总结:less 2、强化学习求解方法dom 1.动态规划方法机器学习 2.蒙特卡洛方法函数 3.时间差分方法 3、强化学习算法分类 1.分类一: 2.分类二: 3.分类三: 4.分类四: 4、表明性算法 1.Q-learning 2.Sarsa: 3
相关文章
相关标签/搜索