七月算法强化学习第二课学习笔记

时间 2020-12-29

标签深度学习七月在线强化学习网络算法栏目系统网络繁體版

原文原文链接

一.Unknown Environment MDP 1.回顾： 1）Known Environment MDP 策略评估 2）Known Environment MDP 寻找最优策略 2.Unknown Environment MDP 1）大多数时候模型未知，No knowledge of MDP transitions / rewards What do you do when don’t k

>>阅读原文<<

相关文章

相关标签/搜索

强化学习笔记

第七周学习笔记

强化学习篇

学习第二节

强化学习（第2版）

学习笔记——Linux

Thymeleaf 教程

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公众号

欢迎关注本站公众号,获取更多信息

相关文章

>>更多相关文章<<