百度飞桨世界冠军带你从零实践强化学习第三天（课程白话）

时间 2021-01-08

原文原文链接

冠军带你从零实践强化学习第三天（课程白话）神经网络方法求解 RL->Deep RL 数量逐渐增加到不可数值函数的近似神经网络 Q-learning 使用神经网络拟合Q表格监督式学习 DQN DQN两大创新点 DQN算法使用流程作业问题环境的选择代码书写参数修改大家好你们的三岁又回来啦，今天已经是第3天的课程啦，先说声抱歉，没有时间看直播，只能够通过录播去自己解读，如果有不足的地方

>>阅读原文<<