5. 强化学习之——策略优化

时间 2021-01-14

标签强化学习繁體版

原文原文链接

课程大纲基于策略的强化学习：前面讲的都是基于价值的强化学习，这次讲基于策略函数去优化的强化学习蒙特卡罗策略梯度如何降低策略梯度的方差 Actor-Critic：同时学习策略函数和价值函数基于策略的强化学习基础知识 Value-based RL 与 Policy-based RL： Policy-based RL 的优势与劣势：策略的分类：（1）确定性策略（2）概率分布性策略对策略

>>阅读原文<<

最新文章

欢迎关注本站公众号,获取更多信息