强化学习七天打卡营学习笔记

时间 2021-01-10

标签 python 机器学习人工智能深度学习强化学习栏目 Python 繁體版

原文原文链接

强化学习七天打卡营学习笔记一、RL分类根据环境是否可知可以分为 Model-based RL & Model-free RL，基于模型的RL的和无模型的RL; 按照学习目标可分为Value-based & Policy-based; 按照学习方式可以分为On-Policy & Off-Policy 二、强化学习的算法和环境经典算法：Q-learning、Sarsa、DQN、Policy Gr

>>阅读原文<<

相关文章

相关标签/搜索

强化学习笔记

强化学习篇

学习笔记——Linux

Perl学习笔记

swoole 学习笔记

2018.05.29学习笔记

Hibernate学习笔记

Thymeleaf 教程

代码格式化

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公众号

欢迎关注本站公众号,获取更多信息

相关文章

>>更多相关文章<<