rl - JavaShuo

rl

rl

全部

Reinforcement learning: integrating learning and planning, exploitation and exploration

2020-12-29 UCL exploitati Model

【RL】策略梯度（VPG）与Actor-critic的思想与推导

2020-12-30 IL&IRL&RL Policy Gradient Actor-Critic

【RL】策略梯度的训练技巧

2020-12-30 IL&IRL&RL 策略梯度 VPG训练

[Distributed Training]强化学习并行训练论文合集

2020-12-30

[model-free] 经典强化学习论文合集

2020-12-30

强化学习Q-Learning算法

2021-01-01

DeepMind强化学习综述:快速和缓慢的强化学习

2021-01-01 图像算法 RNN DeepMind 强化学习 Google

关于飞桨深度学习学院《强化学习7日打卡训练营》的一点心得体会

2021-01-01 PARL 飞桨深度学习学院深度学习

卡耐基梅隆大学 Probabilistic Graphical Models 课程 | Elements of Meta-Learning 关于元学习和强化学习

2021-01-01 深度学习会议&报告元学习强化学习 meta-learning 悠闲生活

Reinforcement Learning：An Introduction Chapter 1 学习笔记

2021-01-02

« 1 2 3 4 5 6 7 8 9 »

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。