强化学习（6）：Actor-Critic（演员评论家）算法

时间 2021-01-13

标签强化学习繁體版

原文原文链接

本文主要讲解有关 Actor-Critic 算法的有关知识。一、Actor Critic 算法 Actor-Critic 算法合并了以策略为基础的 Policy Gradient和以值为基础的 Q-Learning 两类强化学习算法，该算法中将前者当作 Actor，用来基于概率选择行为。将后者当作 Critic，用来评判 Actor 的行为得分，然后 Actor 又会根据 Critic 的评分修

>>阅读原文<<

1. 强化学习（2）-算法总论
2. 强化学习6
3. 强化学习算法
4. 强化学习DQN算法
5. PPO-强化学习算法
6. 强化学习算法DQN
7. 强化学习——DQN算法
8. 机器学习算法——强化学习
9. 强化学习——强化学习的算法分类
10. 【强化学习】什么是强化学习算法？
更多相关文章...
• 您已经学习了 XML Schema，下一步学习什么呢？ - XML Schema 教程
• 我们已经学习了 SQL，下一步学习什么呢？ - SQL 教程
• Kotlin学习（一）基本语法
• Tomcat学习笔记（史上最全tomcat学习笔记）

最新文章

1. js中 charCodeAt
2. Android中通过ViewHelper.setTranslationY实现View移动控制（NineOldAndroids开源项目）
3. 【Android】日常记录：BottomNavigationView自定义样式，修改点击后图片
4. maya 文件检查 ui和数据分离（一）
5. eclipse 修改项目的jdk版本
6. Android InputMethod设置
7. Simulink中Bus Selector出现很多? ? ?
8. 【Openfire笔记】启动Mac版Openfire时提示“系统偏好设置错误”
9. AutoPLP在偏好标签中的生产与应用
10. 数据库关闭的四种方式

本站公众号

欢迎关注本站公众号,获取更多信息

1. 强化学习（2）-算法总论
2. 强化学习6
3. 强化学习算法
4. 强化学习DQN算法
5. PPO-强化学习算法
6. 强化学习算法DQN
7. 强化学习——DQN算法
8. 机器学习算法——强化学习
9. 强化学习——强化学习的算法分类
10. 【强化学习】什么是强化学习算法？

>>更多相关文章<<