[译] 可微可塑性:一种学会学习的新方法

做为 Uber 机器学习系统基础的神经网络,在解决包括图像识别、语言理解和博弈论在内的复杂问题方面被证实是很是成功的。然而,网络一般经过 梯度降低 训练到一个终止点,根据屡次试验中的网络表现不断调整网络链接。一旦训练完成,网络就已经固定,链接再也不改变;所以,除了之后的再训练(又须要不少样本),实际上网络在训练结束时就中止学习。html

相比之下,生物大脑表现出的 可塑性 —— 即在整个生命中,神经元之间链接持续不断地自主变化的能力,使动物可以从持续的经验中快速有效地学习。大脑中不一样区域和链接的可塑性水平是经过数百万年的进化而进行微调的结果,以便在动物的一辈子中进行有效地学习。由此产生的持续学习能力可让动物只需不多的额外信息(additional data)就能适应变化或不可预测的环境。咱们能够很快地记住之前从未见过的场景,或者在彻底陌生的状况下从几回试验中得到新的知识。前端

为了给咱们的人工智能体提供相似的能力,Uber 人工智能实验室开发了 一种称为可微可塑性的新方法 让咱们经过梯度降低训练可塑的链接行为,以便他们能够帮助之前训练的网络适应将来的环境。虽然演化这种可塑性神经网络是 进化计算长期研究的领域。据咱们所知,这里介绍的工做首次代表能够经过梯度降低优化可塑性网络。由于最近人工智能领域的重大突破是以基于梯度的方法为基础的(包括 图像识别机器翻译对弈)。使可塑性网络适应梯度降低训练可能会极大扩展这两种方法的力量。android

可微可塑性是如何工做的

在咱们的方法中,每一个链接都会有初始权重,包括决定链接可塑性的系数。更准确地说,神经元 i 的激活值 yi 计算以下:ios

可微可塑性方程

第一个等式是神经网络单元典型的激活函数,不包括输入权重的固定份量(绿色)和可塑性份量(红色)。可塑性份量的 Hi,j 项做为输入和输出的函数能够自动更新(正如在第二个等式指出的那样,其余公式也是能够的,在 这篇论文 中有讨论。)git

在初始训练期间,梯度降低调整结构参数 wi, jαi,j 这决定了固定和可塑性份量的大小。所以,在初始训练以后,智能体能够从持续性的经验中自动学习,由于每一个链接的可塑性份量都经过神经活动充分塑造以存储信息,让人想起动物(包括人类)中某些学习的形式。github

展现可微可塑性

为了展现可微可塑性的潜力,咱们将其应用于一些须要从不可预知刺激中快速学习具备挑战性的任务。后端

在图像重建任务中(图1)网络存储一组从未见过的天然图像;而后显示这些图像中的一张,但其中一半被擦除,而且网络必须从记忆中重建缺失的一半。咱们展现了可微可塑性能有效地训练具备数百万参数的大型网络来解决这个任务。重要的是,具备非塑性链接的传统网络(包括 LSTMs 等最早进的循环结构)没法解决此任务,而且花费至关多的时间来学习它极大简化的版本。网络

图像重建任务

图 1:图像补全任务(每一行都是单独的重建过程(episode))。在显示三张图像以后,网络得到部分图像而且必须从记忆中重建缺失的部分。非塑性网络(包括LSTM)没法解决此任务。源图像来自 CIFAR10 数据集机器学习

咱们还训练了可塑性网络来解决 Omniglot 任务(一个标准的“学会学习”任务)这须要学习从每人单独绘制的符号中识别一组陌生的手写符号。此外,该方法还能够应用于强化学习问题:可塑性网络在迷宫探索任务中赛过非塑性网络,其中智能体必须发现、记忆并反复到达迷宫内的奖励位置(图 2)。经过这种方式,将可塑性系数添加到神经网络这一简单的思想提供了一种真正新颖的方法 —— 有时是最好的方法 —— 解决普遍的须要从持续经验中不断学习的问题。函数

迷宫探索任务 —— 随机

迷宫探索任务 —— 应用可微可塑性

图 2:迷宫探索任务。智能体(黄色方块)尽量多地到达奖励地点(绿色方块)从而得到奖励(智能体在每次发现奖励时将其转移到随机地点)。在第 1 次探索迷宫时(左图),智能体的行为实质上是随机的。通过 300,000 次的探索(右图)以后,智能体已经学会记住奖励地点并向其自动寻路。

展望

实际上,可微可塑性为 学会学习元学习 这一经典问题提供了一种新的生物启发式方法,只需经过各类强大的方式利用梯度降低和基础构建块(可塑性链接),这种方法也能很是灵活,就像上述不一样任务所证实的那样。

此外,它打开了多个新研究途径的大门。例如,咱们是否能够经过链接可塑性来改进现有的复杂网络体系结构,如 LSTM?若是链接的可塑性受到网络自己的控制,那么它彷佛相似于 神经调质 影响生物大脑?可塑性是否提供了一种比单独循环网络更有效的记忆形式(请注意,循环网络将传入的信息存储在神经活动中,而可塑性网络将其存储在数量更多的链接中)?

咱们打算在将来的可微可塑性工做中研究这些以及其余使人兴奋的问题,并但愿其余人加入咱们的探索。为了鼓励对这种新方法的研究,咱们 在 GitHub 发布了上述实验的代码以及 描述咱们的方法和结果的论文

要想收到将来 Uber 人工智能实验室博客的文章,请注册为 咱们的邮件列表 或者你也能够订阅 Uber 人工智能实验室 YouTube 频道。若是您对加入 Uber AI 实验室感兴趣,请在 Uber.ai 上提交申请。

订阅咱们的资讯 以跟上 Uber 工程的最新创新。


掘金翻译计划 是一个翻译优质互联网技术文章的社区,文章来源为 掘金 上的英文分享文章。内容覆盖 AndroidiOS前端后端区块链产品设计人工智能等领域,想要查看更多优质译文请持续关注 掘金翻译计划官方微博知乎专栏

相关文章
相关标签/搜索