进入深度学习以前，想清楚这些问题！

时间 2019-11-16

标签进入深度学习以前清楚这些问题繁體版

原文原文链接

摘要：想学深度学习？内心能没点啥数吗？python

特别说明：这篇文章是为了解决那些对于深度学习彻底陌生而且正在计划进入这个领域的人。其目的是帮助他们批判性地思考该领域的复杂性，并帮助他们区分哪些是真正困难的事情，哪些是微不足道的事情。在我撰写和发表这篇文章时，我意识到这篇文章的语气过于挑衅，并且我不是一个好的做家，没有能力写一篇发人深省的文章。因此请用宽恕的心态来阅读文章。算法

如今我遇到不少想进入机器学习/人工智能领域的人，尤为是深度学习领域。有些人问我开始学习的最好方法是什么。显然，随着事情的发展，彷佛没有人可以拥有足够的时间得到博士学位。并且在大学中作这方面的技术研究，有时候会感受到在应用程序，技术和基础设施方面有点落后，因此这也就是为何人工智能的大师们都在科技巨头任职的缘由。如今几乎每家科技巨头都给博士生提供职位，延长实习期，这可让你在没有博士学位的状况下在机器学习领域取得成功的职业生涯。你最好的选择是什么取决于你自身的状况，但也取决于你想达到的目标。总之，拥有博士的头衔进入深度学习领域，你必需要沉得住气，由于你比其余人走的更深，同时花费的时间也须要更多。编程

有些事情其实很简单

我发现本身给予他人深度学习的通常建议是：深度学习很容易。在不选择一些难学的领域时，学习神经网络不该该成为目标，而是一种顺带手完成的事情。好比如今的学习python，你就能够顺手学习一些深度学习。可是，你必需要有一个这样的认知：网络

深度学习是强大的，由于它让事情变得简单。架构

深度学习为何这样的缘由是，它容许咱们将几个之前不可能完成的的学习问题称为过分拟合的问题，经过梯度降低将其影响最小化，这在理论上是超级简单的事情。深度学习处理咱们以前没法处理的天然信号包括：图像、视频、人类语言、语音、声音。可是几乎不管你想要在深度学习中完成什么目标，总能在很短的时间内完成：你将几个须要构建模块和想法（卷积、合并、复发）结合起来，若是你有足够的数据，你能够很快的将解决它。像TensorFlow、Theano、Lasagne、Blocks、Keras等愈来愈高级的开源性框架，将帮助你实现你的想法，达到你的目的。框架

挑选更难的东西

这并非说没有真正的新颖想法来自深度学习，也不是说深度学习就是今天发展的这个样子。在进行深度学习的时候，咱们也会遇到多方面的问题，解决这些问题应该是更具挑战性。好比，生成敌对网络和变分自动编码器是引发对几率/生成建模新兴趣的出色例子。理解为何/如何工做，以及如何推广/构建它们真的很难。一样，在理解这些深层神经网络为何以及如何真正起做用方面还有更多使人兴奋的研究方向。机器学习

在这个领域还有另一种感受，低级的深度学习正在消失。创建用于监督学习的深度神经网络，虽然仍在改进中，可是如今不少人认为那是很无聊的工做或许多人都能完成监督学习模型的构建（这是一个大胆的陈述，固然远非如此），今天咱们能够看到，模型的构建门槛已经低到一个中学生都可以完成，可是鉴于数据标注的问题，模型的精准度是一个巨大的挑战。因此，下一个目标就是无监督学习模型的构建，无监督学习模型确定会从深度学习工具包中受益，但它的发展也须要一种大相径庭的思惟方式，好比说须要熟悉信息论/几率/几何等知识。洞察如何使这些方法真正起做用的思惟方式，不大可能来自对目前神经网络架构的改进，而是会以一种脑洞形式的思惟方式开始。分布式

我我的认为今天大多数人经过学习深度学习，意味着他们正在学习使用一个相对简单的工具箱。在六个月的时间里，许多人会拥有这些技能。这些人没有必要花时间研究/学习那些太基础的东西，由于你可能会错过对工做产生真正影响的机会。把深度学习当成一个工具，而不是一个养家糊口的技术，这应该是将来的一个趋势。工具

回归本源

什么是最难学的例子？想一想Ian Goodfellow，Durk Kingma等做者在提出前面提到的算法时所使用的知识，如今从新发现的大部分相关内容在2000年初都进行了积极的研究。或许咱们都应该回顾学习一下经典的算法，如EM算法、变分推理、线性高斯系统的无监督学习、主成分分析、因子分析、卡尔曼滤波、慢特征分析。我我的也能够推荐Aapo Hyvarinen关于ICA的论文，若是你想了解一些关于深度学习前沿的技术，你应该尝试阅读（并理解）这个开创性的深层信念网络论文。oop

快速进阶到下一个技术边界
虽然深度学习是最近发生的最有趣的突破，但咱们也尝试押注将来可能得到相关性的领域：

· 几率编程和黑箱几率推理（带或不带深度神经网络）：若是对此领域的技术感兴趣能够关注一下Picture或者Josh Tenenbaum关于反向图形网络的论文或者在NIPS研讨会上介绍黑盒推理。在这里我须要引用个人一个朋友的话：

几率编程能够为贝叶斯ML提供Theano所作的工做

· 使用或不使用深度神经网络的MCMC和变分推理方法更好且可扩展。最近有不少关于这方面的工做。若是咱们让MCMC像随机梯度降低同样可靠，那么如今对于深层神经网络来讲，这可能意味着更多显性贝叶斯几率模型和分层图形模型的复苏，其中RBM仅仅是一个例子。

我之前见过这个吗？

一样的事情发生在几年前，这已经成为数据科学家的流行语。最初，使用Hadoop，Hive等是一件大事，几位早期的使用者取得了很是成功的职业生涯。在早期，你真正须要作的就是对小型分布式集群进行计数，而且你很快积累了成千上万的追随者，他们崇拜你是大数据先驱。

那时候人们看起来很疯狂，但从几年后就没有开始的新鲜感了，由于不少人如今都在使用Hadoop，并且如今Hadoop也有了新的竞争对手，像Amazon的Redshift这样的工具让事情变得更简单。在那些日子里，除非你以一种有趣的方式使用这些技术，不然这种技术优点会很快消失。在炒做周期的顶部，有数据科学实习、住宿训练计划、夜校培训计划等等。当你完成这些所谓的速成技术培训时，这些技能其实正在变得毫无心义和微不足道。如今深度学习的发展过程看起来跟它们很是类似。

总之，若是你即将进入深度学习，想一想这意味着什么，并尝试更加具体项目。想一想如今还有多少人在你的位置上，你将如何确保你学到的东西可以真正的为你创造价值。

总结

深度学习的研究领域涉及机器学习、统计学、优化、几何学等许多有趣的且很是复杂的课题。大多数人可能遇到的深度学习——乐高积木式的深度学习，它们是相对简单的，没有任何竞争力的。换句话说，这种深度学习将在将来几年成为一种基本的技能，并不能体现出你的不同凡响的价值。若是你对这个领域彻底陌生，重要的是要看到超越这个简单的表面，并选择一些更难掌握的概念。

数十款阿里云产品限时折扣中，赶忙点击领券开始云上实践吧！

本文由@阿里云云栖社区组织翻译。

文章原标题《Deep Learning is Easy - Learn Something Harder》，

译者：虎说八道，审校：袁虎。

阅读原文

本文为云栖社区原创内容，未经容许不得转载。