想要接触人工智能吗？先要学会如何阅读论文

时间 2019-11-05

标签想要接触人工智能先要学会如何阅读论文繁體版

原文原文链接

凭借着对算法和AI的向往，终于有机会接触到人工智能的领域。如今的主要工做就是在OCR文字识别，期间也看了很多的论文，从CTPN到Faster RCNN，再到EAST和FOTS。最开始由于刚接触这个领域，不少名词看不懂，论文阅读很是吃力，后来随着知识的积累和深刻，如今阅读也变得轻松起来。最近关注爱可可老师的微博，恰好发现了这篇文章——《How to Read a Paper》，感受很是适合我这种英语很差、可是又须要阅读论文的人。git

本文就结合最近几个月阅读论文采的坑与《How to Read a Paper》结合，摸索一下大佬们的阅读方法。github

通常的机器学习工程师或者深度学习工程师，都要阅读大量的论文积累相关的领域知识。可是阅读论文自己却不多有人能传授一些经验，这篇文章提出了一种“三步法（three-pass method）”的方法，下面就来介绍一下。算法

背景

一般会有不少缘由须要阅读论文，好比回顾某个会议或者课程、对某个领域持续的关注、开拓新的领域等等。一个专业的学术研究员或者AI研究员可能须要花费几百个小时来阅读论文，所以高效的阅读论文，是一种必不可少的经验和技能。对于刚开始阅读论文的人来讲，须要通过不断的尝试和犯错，才能总结出经验和教训。做者凭借多年的阅读经验，总结出了阅读论文的“三步法”，下面就来看看究竟是如何操做的吧。机器学习

三步法

阅读论文最笨拙的方法就是从头读到尾，有的时候浪费了大量的时间还不知道做者到底说了什么。若是采用三步法，通常是这么个流程：学习

第一步，对论文的主题，对论文的核心内容有必定的了解
第二步，了解论文的核心思想
第三步，深刻理解论文、尝试复现

第一步

经过快速的浏览论文，对论文有一个总体的了解，而后决定是否有必要继续深刻阅读。这个阶段大概花费5-10分钟，主要会作下面的事情：搜索引擎

1 仔细阅读标题、摘要和介绍
2 粗略的阅读小节部分
3 浏览一下数学公式，对基本的理论有必定的把握
4 阅读结论
5 浏览相关引用，剔除读过的文章

经过这个阶段，检查一下本身可否回答下面几个问题：人工智能

1 分类方面：这篇文章属于那种类型？这篇文章的结论是经过什么指标衡量的？是否有现成的系统参考？是否有基础的模型理论参考？
2 内容方面：其余的论文有没有跟这个相似的？这篇论文有没有什么参考的核心理论？
3 准确性方面：这篇论文的结论可信吗？
4 贡献度方面：这篇论文有什么新的想法？
5 清晰度方面：这篇论文写得好吗？容易理解吗？

经过上面的信息，你就能够决定是否要继续深刻下去了。若是这篇文章你压根不感兴趣，或者你暂时还不能理解它，又或者认为做者的结论是错误的，那就不必继续阅读了。也能够把它暂时放在一边，过一段时间再来考虑要不要继续阅读。blog

另外，若是你也许要写论文，那么经过这个部分你应该也能了解到哪一部分是最重要的。首先必定要保证标题和副标题的连贯性、摘要的清晰程度，否则阅读者颇有可能阅读完摘要、扫过标题后，就放弃阅读了。索引

第二步

在第二步中，须要阅读的更仔细点，可是能够把论证的部分给去掉。在阅读的时候能够划重点、抓关键词进行标记，也能够把阅读时不理解的地方记下来。这样再次阅读的时候就能够多注意和思考这些问题，本身写论文的时候也会更注意到相似的点。three

1 仔细的阅读论文中的图片、表格以及其余说明，尤为是要注意图片，标注的信息是否正确？有没有标错？可信么？若是发现错误，那么这篇文章颇有可能不是什么好文章。
2 标记那些引用的还没阅读的论文，这样能够经过一篇论文在领域内引伸开，扩大对领域知识的了解。

第二个阶段大概须要花费一个小时的时间来仔细阅读，经过这个步骤就能够抓住论文的核心内容了。你能够尝试总结一下论文的主要内容、支撑的论点等等。

有时通过这个阶段仍是对论文不理解，这有多是由于刚刚接触这个领域，对于不少的概念和新名词都不了解，或者做者使用的一些论点论据难以理解，也多是做者对于一些关键点没有描述清楚。那么你能够选择：

1 把这篇论文先放在一边，但愿你本身的工做或者科研不会用到相关的内容
2 先阅读一下相关的背景资料引用论文，再回来看看
3 尝试进行第三个步骤

第三步

为了更好的了解论文中的内容，最关键的就是第三步了，这一步须要读者尝试复现论文。假设你如今有了跟做者同样的思路，那么如何来复现它？经过复现的过程，就能轻松的理解文章的核心点，而且发现一些隐藏的坑和结论。

这一步就须要更加关注论文的细节了，须要理解和挑战论文中的每个结论，甚至你能够本身想一想有没有其余的思路。经过这种方式，就能够把一些虚拟的经验变成本身的真实经验了。对于如今这个开放的互联网时代，最简单的办法就是去github里面搜搜有没有现成的代码，直接阅读别人公开的源码。

这个步骤可能会花费几个小时、几天甚至几个月。通过这个阶段，你能够轻松的在脑海中重现整个论文的思路和结构，你也能抓住论文隐藏的结论，论文以外的工做，实验过程当中潜在的问题以及分析的方法。

最后

阅读论文总的来讲仍是一个经验活，最起码须要有几十篇的阅读量，才能进入一个陌生的领域。经过这个“三步法”，你能够快速的判断这篇论文是否值得深刻阅读，是不是你感兴趣的话题。

对于如何扩展知识、怎么筛选论文，能够经过下面的方法。

首先须要一个学术性的搜索引擎，好比Google学术、CiteSeer，输入3-5个关键词进行搜索。
而后经过快速通读论文，了解论文的相关工做。
接下来，能够经过搜索做者的明细，查找他的其余文章，加入阅读列表中。
查看关键做者最近的发表以及相关的顶级会议，通常能发表到顶级会议的论文都属于质量很高的论文。
最后关注顶级会议最近的录入论文，快速浏览相关的内容，能帮你了解相关领域的发展状况。

但愿读者都能在本身感兴趣的领域快速积累起来，将来也会持续的关注爱可可老师的微博，真的颇有用！

参考

How to Read a Paper
爱可可老师的微博