Q-learning算法实践

时间 2021-01-20

标签人工智能智能学习机器人学习繁體版

原文原文链接

我们将会应用 Q-learning 算法完成一个经典的 Markov 决策问题 -- 走迷宫！项目描述：在该项目中，你将使用强化学习算法，实现一个自动走迷宫机器人。如上图所示，智能机器人显示在右上角。在我们的迷宫中，有陷阱（红色炸弹）及终点（蓝色的目标点）两种情景。机器人要尽量避开陷阱、尽快到达目的地。小车可执行的动作包括：向上走 u、向右走 r、向下走 d、向左走 l。执行不同的动作后

>>阅读原文<<

1. Python算法实践
2. 算法实践第三天
3. 算法分析与实践
4. 排序算法实践三
5. YOLO 算法时实践
6. 算法分析实践12
7. 2.2、Softmax Regression算法实践
8. 一周算法实践(三)
9. 聚类算法实践
10. 排序算法实践二
更多相关文章...
• Thymeleaf项目实践 - Thymeleaf 教程
• PHP 运算符 - PHP教程
• 算法总结-广度优先算法
• 算法总结-深度优先算法