Deep Q-learning

时间 2021-07-13

标签 Reinforcement Learning 繁體版

原文原文链接

推自己的github，边学边写，有RL,DL的一些小实验，训练机器走迷宫之类的小游戏，有兴趣可以玩玩传送门 Q-learning作为典型的value-based algorithm，训练出来的是critic（并不直接采取行为，评价现在的行为有多好），因此提出了state value function的概念，方便对每个状态进行评估 Policy-based是不断的增加reward高的行为发生的概率

>>阅读原文<<

1. 强化学习——Qlearning
2. 强化学习--QLearning
3. Qlearning、sarsa以及sarsa_lambda
4. 强化学习——Qlearning——value based
5. 强化学习学习总结（一）——Qlearning
6. 强化学习笔记（一） Qlearning & Sarsa
7. Paper: Continuous Deep Q-Learning with Model-based Acceleration
8. 强化学习学习总结（二）——QLearning算法更新
9. TensorFlow应用实战-17-Qlearning实现迷宫小游戏
10. iOS Deep Linkin 和 Deferred Deep Linking
更多相关文章...
• XML DOM - Document 对象 - XML DOM 教程
• SVN 安装 - SVN 教程

最新文章

1. .Net core webapi2.1生成exe可执行文件
2. 查看dll信息工具-oleview
3. c++初学者
4. VM下载及安装
5. win10下如何安装.NetFrame框架
6. WIN10 安装
7. JAVA的环境配置
8. idea全局配置maven
9. vue项目启动
10. SVN使用-Can't remove directoryXXXX,目录不是空的,项目报错，有红叉

本站公众号

欢迎关注本站公众号,获取更多信息

1. 强化学习——Qlearning
2. 强化学习--QLearning
3. Qlearning、sarsa以及sarsa_lambda
4. 强化学习——Qlearning——value based
5. 强化学习学习总结（一）——Qlearning
6. 强化学习笔记（一） Qlearning & Sarsa
7. Paper: Continuous Deep Q-Learning with Model-based Acceleration
8. 强化学习学习总结（二）——QLearning算法更新
9. TensorFlow应用实战-17-Qlearning实现迷宫小游戏
10. iOS Deep Linkin 和 Deferred Deep Linking

>>更多相关文章<<