普通程序员如何转向AI方向(转）

时间 2019-11-30

原文原文链接

普通程序员如何转向AI方向

　　眼下，人工智能已经成为愈来愈火的一个方向。普通程序员，如何转向人工智能方向，是知乎上的一个问题。本文是我对此问题的一个回答的归档版。相比原回答有所内容增长。php

一. 目的html

　　本文的目的是给出一个简单的，平滑的，易于实现的学习方法，帮助 “普通” 程序员踏入AI领域这个门。这里，我对普通程序员的定义是：拥有大学本科知识；平时工做较忙；本身能获取的数据有限。所以，本文更像是一篇 “from the scratch” 的AI入门教程。git

二. AI领域简介程序员

　　AI，也就是人工智能，并不只仅包括机器学习。曾经，符号与逻辑被认为是人工智能实现的关键，而现在则是基于统计的机器学习占据了主导地位。最近火热的深度学习正是机器学习中的一个子项。目前能够说，学习AI主要的是学习机器学习。可是，人工智能并不等同于机器学习，这点在进入这个领域时必定要认识清楚。关于AI领域的发展历史介绍推荐看周老师写的《机器学习简介》。下面一个问题是：AI的门好跨么？其实很很差跨。咱们以机器学习为例。在学习过程当中，你会面对大量复杂的公式，在实际项目中会面对数据的缺少，以及艰辛的调参等。若是仅仅是由于以为这个方向将来会“火”的话，那么这些困难会容易让人放弃。考虑到普通程序员的特色，而要学习如此困难的学科，是否就是没有门路的？答案是否认的。只要制定合适的学习方法便可。github

三. 学习方法算法

　　学习方法的设定简单说就是回答如下几个问题：我要学的是什么？我怎样学习？我如何去学习？这三个问题归纳说就是：学习目标，学习方针与学习计划。学习目标比较清楚，就是踏入AI领域这个门。这个目标不大，所以实现起来也较为容易。“过大的目标时就是为了你往后放弃它时找到了足够的理由”。学习方针能够总结为 “兴趣为先，践学结合”。简单说就是先培养兴趣，而后学习中把实践穿插进来，螺旋式提升。这种方式学习效果好，并且不容易让人放弃。有了学习方针之后，就能够制定学习计划，也称为学习路线。下面就是学习路线的介绍。网络

四. 学习路线机器学习

　　我推荐的学习路线是这样的，以下图：jsp

图1 AI领域学习路线图工具

　　这个学习路线是这样设计的：首先了解这个领域，创建起全面的视野，培养起充足的兴趣，而后开始学习机器学习的基础，这里选择一门由浅入深的课程来学习，课程最好有足够的实验可以进行实战。基础打下后，对机器学习已经有了充足的了解，能够用机器学习来解决一个实际的问题。这时仍是能够把机器学习方法看成一个黑盒子来处理的。实战经验积累之后，能够考虑继续进行学习。这时候有两个选择，深度学习或者继续机器学习。深度学习是目前最火热的机器学习方向，其中一些方法已经跟传统的机器学习不太同样，所以能够单独学习。除了深度学习之外，机器学习还包括统计学习，集成学习等实用方法。若是条件足够，能够同时学习二者，一些规律对二者是共通的。学习完后，你已经具有了较强的知识储备，能够进入较难的实战。这时候有两个选择，工业界的能够选择看开源项目，以改代码为目的来读代码；学术界的能够看特定领域的论文，为解决问题而想发论文。不管哪者，都须要知识过硬，以及较强的编码能力，所以很能考察和锻炼水平。通过这个阶段之后，能够说是踏入AI领域的门了。“师傅领进门，修行在我的”。以后的路就要本身走了。

　　下面是关于每一个阶段的具体介绍：

　　0.领域了解　

　　在学习任何一门知识以前，首先第一步就是了解这个知识是什么？它能作什么事？它的价值在什么地方？若是不理解这些的话，那么学习自己就是一个没有方向的舟，不知道驶向何处，也极易有沉船的风险。了解这些问题后，你才能培养出兴趣，兴趣是最好的引路人，学习的动力与持久力才能让你应付接下来的若干个阶段。关于机器学习是什么，能作什么，它与深度学习以及人工智能的关系，能够看我写的博客从机器学习谈起：

　　1.知识准备　

　　若是你离校太久，或者以为基础不牢，最好事先作一下准备复习工做。“工欲善其事，必先利其器”。如下的准备工做很少，但足以应付后面阶段的学习。

数学：复习如下基本知识。线性代数：矩阵乘法；高数：求导；几率论：条件与后验几率。其余的一些知识能够在后面的学习的过程当中按需再补；
英文：常备一个在线英文词典，例如爱词霸，可以不吃力的看一些英文的资料网页；
FQ：能够随时随地上Google，这是一个很重要的工具。不是说百度查的不能看，而是不少状况下Google搜出来的资料比百度搜的几十页的资料还管用，尤为是在查英文关键字时。节省时间但是很重要的学习效率提高；

　　2.机器学习　

　　机器学习的第一门课程首推Andrew Ng的机器学习。这门课程有如下特色：难度适中，同时有足够的实战例子，很是适合第一次学习的人。cs229 这门课程我这里不推荐，为何，缘由有如下：

时间：cs229 的时间太早，一些知识已经跟不上当今的发展，目前最为火热的神经网络一笔带过。而Cousera上神经网络但是用了两个课时去讲的！并且很是详细；
教学：Ng在cs229 时候的教学稍显青涩，多是面对网络教学的缘由。有不少问题其实他都没有讲清楚，并且下面的人的提问其实也很烦躁，你每每不关心那些人的问题。这点在Coursera上就明显获得了改善，你会发现Ng的教学水平大幅度改善了，他会对你循循善诱，推心置腹，由浅入深的教学，在碰到你不明白的单词术语时也会叫你不要担忧，更重要的，推导与图表不要太完善，很是细致清晰，这点真是强力推荐；
字幕：cs229 的字幕质量比Coursera上的差了一截。Coursera上中文字幕翻译通过了多人把关，质量颇有保证；
做业：cs229 没有做业，虽然你能够作一些，但不会有人看。这点远不如Coursera上每周有deadline的那种做业，并且每期做业提交上去都有打分。更重要的是，每期做业都有实际的例子，让你手把手练习，并且能看到本身的成果，成就感满满！

　　3.实践作项目　

　　学习完了基础课程，你对机器学习就有了初步了解。如今使用它们是没有问题的，你能够把机器学习算法看成黑盒子，放进去数据，就会有结果。在实战中你更须要去关心如何获取数据，以及怎么调参等。若是有时间，本身动手作一个简单的实践项目是最好的。这里须要选择一个应用方向，是图像（计算机视觉），音频（语音识别），仍是文本（天然语言处理）。这里推荐选择图像领域，这里面的开源项目较多，入门也较简单，可使用OpenCV作开发，里面已经实现好了神经网络，SVM等机器学习算法。项目作好后，能够开源到到 Github 上面，而后不断完善它。实战项目作完后，你能够继续进一步深刻学习，这时候有两个选择，深度学习和继续机器学习；

　　4.深度学习

　　深度学习：深度学习是目前最火热的研究方向。有如下特色：知识更新快，较为零碎，没有系统讲解的书。所以学习的资源也相对零散，下面是一些资源介绍。其中不推荐的部分并不表明很差，而是在这个初学阶段不合适：

推荐，UFLDL：很是好的DL基础教程，也是Andrew Ng写的。有很详尽的推导，有翻译，且翻译质量很高；
推荐，Deep learning (paper)：2015年Nature上的论文，由三位深度学习界的大牛所写，读彻底篇论文，给人高屋建瓴，一览众山小的感受，强烈推荐。若是只能读一篇论文了解深度学习，我推荐此篇。这篇论文有同名的中文翻译；
推荐，Neural networks and deep learning：这本书的做者很是擅长以浅显的语言表达深入的道理，虽然没有翻译，可是阅读并不困难；
推荐，Recurrent Neural Networks：结合一个实际案例告诉你RNN是什么，整篇教程学完之后，会让你对RNN如何产生做用的有很清晰的认识，而这个效果，甚至是读几篇相关论文所没有的；

不推荐，Neural Networks for Machine Learning - University of Toronto | Coursera：深度学习创始人教的课，最大的问题是太难，并且老先生的吐字有时不是很标准；
不推荐，Deep Learning (book)：一样也是由深度学习大牛所写的书，但感受就像是第二做者，也就是他的学生所写的。不少内容都讲了，可是感受也没讲出什么内容来，只是告诉你来自那篇论文，这样的话可能直接阅读论文更合适。
不推荐，cs231n：李菲菲的课程，颇有名，专门讲CNN。可是这门课程有一个最大的问题，就是没有字幕，虽然有youtube的自动翻译字幕，但有还不如没有。

　　5.继续机器学习　

　　深度学习未必就是将来的必定主流，至少一些大牛是这么认为的。传统的机器学习有以下特色，知识系统化，有相对经典的书。其中统计学习（表明SVM）与集成学习（表明adaboost）是在实践中使用很是多的技术。下面是相关资源：

推荐，机器学习(周志华)：若是是在之前，机器学习方面的经典教材首推PRML，但如今周老师的书出来之后，就再也不是这样了。首先推荐读周老师的书。这本书有一个特色，那就是再难的道理也能用浅显精炼的语言表达出来。正如周老师的名言：“体现你水平的地方是把难的东西讲容易了，而不是把容易的东西讲难，想把一个东西讲难实在太简单”；
不推荐，Pattern Recognition And Machine Learning：当前阶段不推荐。PRML是以贝叶斯的观点看待不少机器学习方法，这也是它的一大特点。但对于初学者来讲，这种观点其实并没有必要。并且此书没有中文翻译，当前阶段硬啃很容易放弃；

　　6.开源项目　

　　当知识储备较为充足时，学习能够再次转入实践阶段。这时候的实践仍然能够分两步走，学习经典的开源项目或者发表高质量的论文。开源项目的学习应该以尽可能以优化为目的，单纯为读代码而学习效果每每不太好。好的开源项目均可以在Github 里搜索。这里以深度学习为例。深度学习的开源优秀库有不少，例如torch，theano等等，这里列举其中的两个：

推荐，DeepLearnToolbox：较早的一个深度学习库，用matlab语言撰写，较为适合从刚学习的课程转入学习。遗憾的是做者再也不维护它了；
推荐，tensorflow：Google的开源库，时至今日，已经有40000多个star，很是惊人，支持移动设备；

　　7.会议论文　

　　较好的课程都会推荐你一些论文。一些著名的技术与方法每每诞生于一些重要的会议。所以，看往年的会议论文是深刻学习的方法。在这时，一些论文中的内容会驱使你学习数学中你不擅长的部分。有时候你会以为数学知识储备不够，所以每每须要学习一些辅助课程。当你看完足够的论文之后，在这个阶段，若是是在校学生，能够选择某个课题，以发论文为目的来学习研究。通常来讲，论文是工做的产物。有时候一篇基于实验的论文每每须要你写代码或者基于开源项目。所以开源项目的学习与会议论文的工做二者之间是有相关的。二者能够同时进行学习。关于在哪里看论文，能够看一下CCF推荐排名，了解一下这个领域里有哪些优秀的会议。下面介绍两个图像与机器学习领域的著名顶级会议：

CVPR：与另两个会议ICCV和ECCV合称计算机视觉领域的三大会，注意会议每一年的主页是变更的，所以搜索须要加上年份；
Conference on Neural Information Processing Systems：简称NIPS，许多重要的工做发表在这上面，例如关于CNN的一篇重要论文就是发表在上面；

原文地址：http://www.cnblogs.com/subconscious/p/6240151.html

　　8.自由学习　

　　自由学习：到这里了，能够说是进入这个门了。下面能够依据兴趣来自由学习。前阶段不推荐的学习资源也可随意学习，下面是点评：

cs229 ：Ng写的讲义很不错，其中关于SVM的推导部分很清晰，想学习SVM推荐；
Neural Networks for Machine Learning：大牛的视角跟人就是不同，看看Hinton对神经网络是怎么看的，每每会让你有种原来如此的感悟。其实看这门课程也等同于读论文，由于几乎每节课的参考资料里都有论文要你读；
CS231n: Convolutional Neural Networks for Visual Recognition：最新的知识，还有详细的做业。国内应该有团队对字幕进行了翻译，能够找找；
PRML：做为一门经典的机器学习书籍，是颇有阅读必要的，会让你对机器学习拥有一个其余的观察视角；

五. 总结

　　本文的目的是帮助对AI领域了解不深，但又想进入的同窗踏入这个门。这里只说踏入，是由于这个领域的专精实在很是困难，须要数年的积累与努力。在进行领域学习前，充分认识本身的特色，制定合适的学习方法是十分重要的。首先得对这个领域进行充分了解，培养兴趣。在学习时，保持着按部就班的学习方针，不要猛进的学习过难资源；结合着学习与实践相辅的策略，不要只读只看，实际动手才有成就感。学习某个资源时要有充分的目的，不是为了学开源项目而看代码，而是为了写开源项目而看；不是为了发论文而写论文，而是为了作事情而写论文。若是一个学习资源对你过难，并不表明必定是你的问题，多是学习资源的演讲或撰写人的问题。能把难的问题讲简单的人才是真正有水平的人。因此，必定要学习优质资源，而不是不分青红皂白的学习。最后，牢记以兴趣来学习。学习的时间很长，过程也很艰难，而只有兴趣才是让你锲而不舍，攻克难关的最佳助力。

　　谨以此文与在学海中乘舟的诸位共勉。我就是一名普通程序员，刚刚转入AI领域，还有不少不足。但愿此文能够帮助到你们。