想要接触人工智能吗?先要学会如何阅读论文

凭借着对算法和AI的向往,终于有机会接触到人工智能的领域。如今的主要工做就是在OCR文字识别,期间也看了很多的论文,从CTPN到Faster RCNN,再到EAST和FOTS。最开始由于刚接触这个领域,不少名词看不懂,论文阅读很是吃力,后来随着知识的积累和深刻,如今阅读也变得轻松起来。最近关注爱可可老师的微博,恰好发现了这篇文章——《How to Read a Paper》,感受很是适合我这种英语很差、可是又须要阅读论文的人。git

本文就结合最近几个月阅读论文采的坑与《How to Read a Paper》结合,摸索一下大佬们的阅读方法。github

通常的机器学习工程师或者深度学习工程师,都要阅读大量的论文积累相关的领域知识。可是阅读论文自己却不多有人能传授一些经验,这篇文章提出了一种“三步法(three-pass method)”的方法,下面就来介绍一下。算法

背景

一般会有不少缘由须要阅读论文,好比回顾某个会议或者课程、对某个领域持续的关注、开拓新的领域等等。一个专业的学术研究员或者AI研究员可能须要花费几百个小时来阅读论文,所以高效的阅读论文,是一种必不可少的经验和技能。对于刚开始阅读论文的人来讲,须要通过不断的尝试和犯错,才能总结出经验和教训。做者凭借多年的阅读经验,总结出了阅读论文的“三步法”,下面就来看看究竟是如何操做的吧。机器学习

三步法

阅读论文最笨拙的方法就是从头读到尾,有的时候浪费了大量的时间还不知道做者到底说了什么。若是采用三步法,通常是这么个流程:学习

  • 第一步,对论文的主题,对论文的核心内容有必定的了解
  • 第二步,了解论文的核心思想
  • 第三步,深刻理解论文、尝试复现

第一步

经过快速的浏览论文,对论文有一个总体的了解,而后决定是否有必要继续深刻阅读。这个阶段大概花费5-10分钟,主要会作下面的事情:搜索引擎

  • 1 仔细阅读标题、摘要和介绍
  • 2 粗略的阅读小节部分
  • 3 浏览一下数学公式,对基本的理论有必定的把握
  • 4 阅读结论
  • 5 浏览相关引用,剔除读过的文章

经过这个阶段,检查一下本身可否回答下面几个问题:人工智能

  • 1 分类方面:这篇文章属于那种类型?这篇文章的结论是经过什么指标衡量的?是否有现成的系统参考?是否有基础的模型理论参考?
  • 2 内容方面:其余的论文有没有跟这个相似的?这篇论文有没有什么参考的核心理论?
  • 3 准确性方面:这篇论文的结论可信吗?
  • 4 贡献度方面:这篇论文有什么新的想法?
  • 5 清晰度方面:这篇论文写得好吗?容易理解吗?

经过上面的信息,你就能够决定是否要继续深刻下去了。若是这篇文章你压根不感兴趣,或者你暂时还不能理解它,又或者认为做者的结论是错误的,那就不必继续阅读了。也能够把它暂时放在一边,过一段时间再来考虑要不要继续阅读。blog

另外,若是你也许要写论文,那么经过这个部分你应该也能了解到哪一部分是最重要的。首先必定要保证标题和副标题的连贯性、摘要的清晰程度,否则阅读者颇有可能阅读完摘要、扫过标题后,就放弃阅读了。索引

第二步

在第二步中,须要阅读的更仔细点,可是能够把论证的部分给去掉。在阅读的时候能够划重点、抓关键词进行标记,也能够把阅读时不理解的地方记下来。这样再次阅读的时候就能够多注意和思考这些问题,本身写论文的时候也会更注意到相似的点。three

  • 1 仔细的阅读论文中的图片、表格以及其余说明,尤为是要注意图片,标注的信息是否正确?有没有标错?可信么?若是发现错误,那么这篇文章颇有可能不是什么好文章。
  • 2 标记那些引用的还没阅读的论文,这样能够经过一篇论文在领域内引伸开,扩大对领域知识的了解。

第二个阶段大概须要花费一个小时的时间来仔细阅读,经过这个步骤就能够抓住论文的核心内容了。你能够尝试总结一下论文的主要内容、支撑的论点等等。

有时通过这个阶段仍是对论文不理解,这有多是由于刚刚接触这个领域,对于不少的概念和新名词都不了解,或者做者使用的一些论点论据难以理解,也多是做者对于一些关键点没有描述清楚。那么你能够选择:

  • 1 把这篇论文先放在一边,但愿你本身的工做或者科研不会用到相关的内容
  • 2 先阅读一下相关的背景资料引用论文,再回来看看
  • 3 尝试进行第三个步骤

第三步

为了更好的了解论文中的内容,最关键的就是第三步了,这一步须要读者尝试复现论文。假设你如今有了跟做者同样的思路,那么如何来复现它?经过复现的过程,就能轻松的理解文章的核心点,而且发现一些隐藏的坑和结论。

这一步就须要更加关注论文的细节了,须要理解和挑战论文中的每个结论,甚至你能够本身想一想有没有其余的思路。经过这种方式,就能够把一些虚拟的经验变成本身的真实经验了。对于如今这个开放的互联网时代,最简单的办法就是去github里面搜搜有没有现成的代码,直接阅读别人公开的源码。

这个步骤可能会花费几个小时、几天甚至几个月。通过这个阶段,你能够轻松的在脑海中重现整个论文的思路和结构,你也能抓住论文隐藏的结论,论文以外的工做,实验过程当中潜在的问题以及分析的方法。

最后

阅读论文总的来讲仍是一个经验活,最起码须要有几十篇的阅读量,才能进入一个陌生的领域。经过这个“三步法”,你能够快速的判断这篇论文是否值得深刻阅读,是不是你感兴趣的话题。

对于如何扩展知识、怎么筛选论文,能够经过下面的方法。

  • 首先须要一个学术性的搜索引擎,好比Google学术、CiteSeer,输入3-5个关键词进行搜索。
  • 而后经过快速通读论文,了解论文的相关工做。
  • 接下来,能够经过搜索做者的明细,查找他的其余文章,加入阅读列表中。
  • 查看关键做者最近的发表以及相关的顶级会议,通常能发表到顶级会议的论文都属于质量很高的论文。
  • 最后关注顶级会议最近的录入论文,快速浏览相关的内容,能帮你了解相关领域的发展状况。

但愿读者都能在本身感兴趣的领域快速积累起来,将来也会持续的关注爱可可老师的微博,真的颇有用!

参考

How to Read a Paper
爱可可老师的微博

相关文章
相关标签/搜索