百面机器学习总结笔记（第十一章强化学习）

时间 2021-01-10

原文原文链接

百面机器学习总结笔记（第十一章强化学习）百面机器学习总结笔记第十一章强化学习强化学习基础视频游戏里的强化学习策略梯度探索与利用百面机器学习总结笔记第十一章强化学习强化学习基础场景描述知识点强化学习马尔科夫决策过程价值迭代策略迭代问题1 强化学习中有哪些基本概念？在马里奥找宝藏问题中如何定义这些概念？分析与解答问题2 根据图11.1给定的马里奥的位置以及宝藏

>>阅读原文<<

百面机器学习总结笔记（第十一章 强化学习）

百面机器学习总结笔记（第十一章强化学习）