JavaShuo
栏目
标签
rl
rl
全部
Reinforcement learning: integrating learning and planning, exploitation and exploration
2020-12-29
UCL
exploitati
Model
【RL】策略梯度(VPG)与Actor-critic的思想与推导
2020-12-30
IL&IRL&RL
Policy Gradient
Actor-Critic
【RL】策略梯度的训练技巧
2020-12-30
IL&IRL&RL
策略梯度
VPG训练
[Distributed Training]强化学习并行训练论文合集
2020-12-30
[model-free] 经典强化学习论文合集
2020-12-30
强化学习Q-Learning算法
2021-01-01
DeepMind强化学习综述:快速和缓慢的强化学习
2021-01-01
图像算法
RNN
DeepMind
强化学习
Google
关于飞桨深度学习学院《强化学习7日打卡训练营》的一点心得体会
2021-01-01
PARL
飞桨深度学习学院
深度学习
卡耐基梅隆大学 Probabilistic Graphical Models 课程 | Elements of Meta-Learning 关于元学习和强化学习
2021-01-01
深度学习
会议&报告
元学习
强化学习
meta-learning
悠闲生活
Reinforcement Learning:An Introduction Chapter 1 学习笔记
2021-01-02
«
1
2
3
4
5
6
7
8
9
»
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。