DeepMind提出多任务强化学习新方法Distral

选自arXiv 机器之心编译 参与:蒋思源、黄小天 深度强化学习因为复杂的环境而很难进行有效的训练,通常我们会简化环境或使用共享神经网络参数的方法进行多任务学习,但采用这种方法的学习并不稳定。因此 DeepMind 近日发表了一篇论文,并提出了一种用于多任务的联合训练的新方法—Distral(提取&迁移学习)。   论文链接:https://arxiv.org/pdf/1707.04175.pdf
相关文章
相关标签/搜索