Reddit 网友票选 2018 最佳论文(附阅读技巧)

https://mp.weixin.qq.com/s/dQxbmSHouyAx13LxDKl8kQios

by 超神经

读论文这件事,对深刻了解细分领域的技术和难题来讲,重要性毋庸置疑。 

2018 年也出现了不少优质的论文,好比各大顶级学术会议上的获奖论文,咱们今天盘点的是 Reddit 网友心中那些 2018 帮助过他们的论文。

Reddit 网友:这篇论文我投一票

@beezlebub33 推荐论文:
《Large-Scale Study of Curiosity-Driven Learning》
大规模的好奇驱动学习研究
https://pathak22.github.io/large-scale-curiosity/git

Reddit 网友票选 2018 最佳论文(附阅读技巧)
推荐理由:
这篇文章的重要性体如今,它无需好的奖励机制,就在不少游戏中实现了优异的性能。重要的是它学会了经过预测去玩游戏,能辨别违反指望的行为,可以去探索未知的领域。这多是 AI 之后发展的方向:自我监督、无标签数据、会预测、好奇心、具备内动力等等。 github

人们尚未足够的时间去创造出有监督训练集,而且给这些数据集定义矩阵。但若是,给 AI 提供原始数据,而且它能够学习该系统的时空演变的内部表示,那么您能够经过定义目标,最终用 AI 将它实现。 网络

@YBuzzinGA 推荐论文:
《Learning Unsupervised Learning Rules》
学习无监督学习法则
https://arxiv.org/abs/1804.00222.框架

Reddit 网友票选 2018 最佳论文(附阅读技巧)
推荐理由:
这篇文章是关于使用无监督学习来完成一些任务,它的特色在于,模型正在学习如何本身学习。机器学习

元学习是一个关键领域,学习那些学习规则会让 AI 去理解本身,而且去改善本身。若是你能够教一台计算机如何学习了解本身,那么咱们就有可能实现飞跃。 ide

@breadwithlice 推荐论文:
《Phrase-Based & Neural Unsupervised
Machine Translation》
基于短语和无监督神经机器翻译
https://arxiv.org/abs/1810.04805v1性能

Reddit 网友票选 2018 最佳论文(附阅读技巧)
推荐理由:
这篇文章里,仅使用单语料库,就能将完成翻译,并且不须要任何映射,字典或并行数据。
论文里使用了一种反向翻译技术,从A转换为B时,而后将B转换为A,这么作大大改善翻译器,而后切换A和B,这个结果使人惊喜! 学习

@kartayyar 推荐论文:
《Pre-training of Deep Bidirectional Transformers
for Language Understanding 》
语言理解中深层双向法的预训练
https://arxiv.org/abs/1809.10756测试

Reddit 网友票选 2018 最佳论文(附阅读技巧)
推荐理由:
我喜欢它的地方:
很棒的创新理念,他们使用的遮蔽方法是很是有创意的。

他们用很简单的语句就说清楚了他们的核心理念。
在Github上有代码可重现的结果。
可以处理了多项不一样的任务。

@ndha1995 推荐论文:
《An Introduction to Probabilistic Programming》
几率规划导论
https://arxiv.org/abs/1809.10756
Reddit 网友票选 2018 最佳论文(附阅读技巧)
推荐理由:
这是我在2018年最喜欢的论文。

做者对几率规划进行了全面而严谨的介绍,并在最后一章中,介绍了最近关于深度神经网络,和几率规划相结合的研究 。

读论文的硬核建议

就算知道了厉害的论文,除了喊着哇,真厉害,那怎么样才能看懂它们呢? 

首先仍是想清楚你的动机,主动地想要探索和被动的完成任务,效果和体验就会彻底不一样了。咱们找到了一些硬核建议,嗯,就帮大家到这了。

批判性地阅读

这是一个很重要的态度。不要盲从做者的观点。相反,要去怀疑和求证。 

什么是批判性阅读?尝试着去提出问题。若是做者试图解决某个问题,他们是否正确的解决了?有没有做者没有考虑到简单方案?解决方案有哪些局限性(包括做者没注意到或明确认可的)? 

Reddit 网友票选 2018 最佳论文(附阅读技巧)

做者的假设是否合理?鉴于假设,论文的逻辑是否明确合理,或者推理中是否存在缺陷? 

若是做者提供数据,他们的数据能不能来证明他们的论点,他们是收集数据的路径是否合理?那他们解释数据的方式呢?换用其余数据会更好吗? 

创造性地阅读

批判性地阅读一篇论文难度系数不是最高,由于毁坏比构建更容易。而创造性的阅读就涉及更难,更积极的思考。 

好比:本文有哪些很好的想法?这些想法是否有其余应用程序或扩展?它们能被进一步推广吗?是否存在会带来重大差别的改进?若是本身进行相关的探究,接下来会作些什么呢? 

在阅读论文时作笔记

许多人都在读论文时记录笔记。这个方法是很不错的,用你喜欢的方式,把想到的任何问题或批注,通通记录下来。试着去找到做者的关键点。

Reddit 网友票选 2018 最佳论文(附阅读技巧)
大受好评的康奈尔笔记法

标记那些最重要或看似有问题的数据。这样的标记有助于理解论文,同时还也有助于以后的回顾。

在第一次阅读以后,
尝试用一两句话来总结论文

几乎全部优秀的论文都在提出一个具体问题的答案。若是你能简洁地描述一篇论文,你可能已经弄懂了到了做者的工做,包括他们想要解决的问题和最终的答案。一旦您专一于主要想法,再回过头去概述论文,就能更深刻的了解具体细节。

实际上,若是用一两句话总结论文很容易,那么能够来尝试另外一种方法,列出三个或四个要点大纲来总结主要思想。 

若是可能,
将论文与其余做品进行比较

总结论文是尝试肯定论文科学贡献的一种方法。但要真正掌握科学价值,你必须将论文与该领域的其余做品进行比较。去弄清楚这些想法是新颖的,仍是之前出现过?

值得一提的是,科学研究呈现的方式有多种。好比一些论文只提出新的想法,而其余人去实施验证,并展现其工做方式;还有一些人将以前想法结合在一块儿,并在一个新颖的框架下整合起来。了解该领域的其余工做能够帮助你更好的了解论文的价值。 

超神经小百科

无监督学习 Unsupervised learning

机器学习能够分为监督式学习、无监督式学习和半监督式学习。

无监督学习是不为训练集提供对应类别标识的学习方法。适用于有数据集但无标签的状况。

无监督学习中使用的数据是没有标记过的,而训练中也不知道输入数据对应的输出结果是什么。没有受到监督式加强 (告诉它何种学习是正确的)。

无监督学习只能默默的读取数据,本身寻找数据的模型和规律,好比聚类(把类似数据归为一组)和异常检测(寻找异常)。

无监督式学习的目的是去对原始资料进行分类,以便了解资料内部结构。其特色是仅对此种网络提供输入范例,而它会自动从这些范例中找出其潜在类别规则。当学习完毕并经测试后,也能够将之应用到新的案例上。

Reddit 网友票选 2018 最佳论文(附阅读技巧)