Reddit 网友票选 2018 最佳论文（附阅读技巧）

时间 2020-09-19

标签 reddit 网友票选最佳论文阅读技巧栏目硅谷繁體版

原文原文链接

https://mp.weixin.qq.com/s/dQxbmSHouyAx13LxDKl8kQios

by 超神经

读论文这件事，对深刻了解细分领域的技术和难题来讲，重要性毋庸置疑。 

2018 年也出现了不少优质的论文，好比各大顶级学术会议上的获奖论文，咱们今天盘点的是 Reddit 网友心中那些 2018 帮助过他们的论文。

Reddit 网友：这篇论文我投一票

@beezlebub33 推荐论文：
《Large-Scale Study of Curiosity-Driven Learning》
大规模的好奇驱动学习研究
https://pathak22.github.io/large-scale-curiosity/git

推荐理由：
这篇文章的重要性体如今，它无需好的奖励机制，就在不少游戏中实现了优异的性能。重要的是它学会了经过预测去玩游戏，能辨别违反指望的行为，可以去探索未知的领域。这多是 AI 之后发展的方向：自我监督、无标签数据、会预测、好奇心、具备内动力等等。 github

人们尚未足够的时间去创造出有监督训练集，而且给这些数据集定义矩阵。但若是，给 AI 提供原始数据，而且它能够学习该系统的时空演变的内部表示，那么您能够经过定义目标，最终用 AI 将它实现。网络

@YBuzzinGA 推荐论文：
《Learning Unsupervised Learning Rules》
学习无监督学习法则
https://arxiv.org/abs/1804.00222.框架

推荐理由：
这篇文章是关于使用无监督学习来完成一些任务，它的特色在于，模型正在学习如何本身学习。机器学习

元学习是一个关键领域，学习那些学习规则会让 AI 去理解本身，而且去改善本身。若是你能够教一台计算机如何学习了解本身，那么咱们就有可能实现飞跃。 ide

@breadwithlice 推荐论文：
《Phrase-Based & Neural Unsupervised
Machine Translation》
基于短语和无监督神经机器翻译
https://arxiv.org/abs/1810.04805v1性能

推荐理由：
这篇文章里，仅使用单语料库，就能将完成翻译，并且不须要任何映射，字典或并行数据。
论文里使用了一种反向翻译技术，从A转换为B时，而后将B转换为A，这么作大大改善翻译器，而后切换A和B，这个结果使人惊喜！学习

@kartayyar 推荐论文：
《Pre-training of Deep Bidirectional Transformers
for Language Understanding 》
语言理解中深层双向法的预训练
https://arxiv.org/abs/1809.10756测试

推荐理由：
我喜欢它的地方：
很棒的创新理念，他们使用的遮蔽方法是很是有创意的。

他们用很简单的语句就说清楚了他们的核心理念。
在Github上有代码可重现的结果。
可以处理了多项不一样的任务。

@ndha1995 推荐论文：
《An Introduction to Probabilistic Programming》
几率规划导论
https://arxiv.org/abs/1809.10756

推荐理由：
这是我在2018年最喜欢的论文。

做者对几率规划进行了全面而严谨的介绍，并在最后一章中，介绍了最近关于深度神经网络，和几率规划相结合的研究。

读论文的硬核建议

就算知道了厉害的论文，除了喊着哇，真厉害，那怎么样才能看懂它们呢？ 

首先仍是想清楚你的动机，主动地想要探索和被动的完成任务，效果和体验就会彻底不一样了。咱们找到了一些硬核建议，嗯，就帮大家到这了。

批判性地阅读

这是一个很重要的态度。不要盲从做者的观点。相反，要去怀疑和求证。 

什么是批判性阅读？尝试着去提出问题。若是做者试图解决某个问题，他们是否正确的解决了？有没有做者没有考虑到简单方案？解决方案有哪些局限性（包括做者没注意到或明确认可的）？ 

做者的假设是否合理？鉴于假设，论文的逻辑是否明确合理，或者推理中是否存在缺陷？ 

若是做者提供数据，他们的数据能不能来证明他们的论点，他们是收集数据的路径是否合理？那他们解释数据的方式呢？换用其余数据会更好吗？ 

创造性地阅读

批判性地阅读一篇论文难度系数不是最高，由于毁坏比构建更容易。而创造性的阅读就涉及更难，更积极的思考。 

好比：本文有哪些很好的想法？这些想法是否有其余应用程序或扩展？它们能被进一步推广吗？是否存在会带来重大差别的改进？若是本身进行相关的探究，接下来会作些什么呢？ 

在阅读论文时作笔记

许多人都在读论文时记录笔记。这个方法是很不错的，用你喜欢的方式，把想到的任何问题或批注，通通记录下来。试着去找到做者的关键点。

大受好评的康奈尔笔记法

标记那些最重要或看似有问题的数据。这样的标记有助于理解论文，同时还也有助于以后的回顾。

在第一次阅读以后，
尝试用一两句话来总结论文

几乎全部优秀的论文都在提出一个具体问题的答案。若是你能简洁地描述一篇论文，你可能已经弄懂了到了做者的工做，包括他们想要解决的问题和最终的答案。一旦您专一于主要想法，再回过头去概述论文，就能更深刻的了解具体细节。

实际上，若是用一两句话总结论文很容易，那么能够来尝试另外一种方法，列出三个或四个要点大纲来总结主要思想。 

若是可能，
将论文与其余做品进行比较

总结论文是尝试肯定论文科学贡献的一种方法。但要真正掌握科学价值，你必须将论文与该领域的其余做品进行比较。去弄清楚这些想法是新颖的，仍是之前出现过？
 
值得一提的是，科学研究呈现的方式有多种。好比一些论文只提出新的想法，而其余人去实施验证，并展现其工做方式；还有一些人将以前想法结合在一块儿，并在一个新颖的框架下整合起来。了解该领域的其余工做能够帮助你更好的了解论文的价值。 

超神经小百科

无监督学习 Unsupervised learning

机器学习能够分为监督式学习、无监督式学习和半监督式学习。

无监督学习是不为训练集提供对应类别标识的学习方法。适用于有数据集但无标签的状况。

无监督学习中使用的数据是没有标记过的，而训练中也不知道输入数据对应的输出结果是什么。没有受到监督式加强 (告诉它何种学习是正确的)。

无监督学习只能默默的读取数据，本身寻找数据的模型和规律，好比聚类（把类似数据归为一组）和异常检测（寻找异常）。

无监督式学习的目的是去对原始资料进行分类，以便了解资料内部结构。其特色是仅对此种网络提供输入范例，而它会自动从这些范例中找出其潜在类别规则。当学习完毕并经测试后，也能够将之应用到新的案例上。