10篇机器学习和数据科学的好文,不要错过



做者 | Flavian Hautboisjavascript

翻译 | AI科技大本营(rgznai100)html

参与 | JeyZhang,波波


上个月,咱们发了不少文章。可是,机器学习和数据科学整个领域所发表的新文章更多。如何用一篇文章就能梳理好这些最新的内容呢?咱们苦思冥想,从中找出了这十篇有关神经网络、TensorFlow、数据可视化、生成式对抗网络(GAN)以及LSTM的最佳文章。前端


只此一篇,你就能把握住机器学习和数据科学整个领域的新内容,绝对不容错过。


若是你的阅读习惯是边看边动手作,请必定先备好Python环境。


咱们先从下面的漫画开始:java


图片翻译:
web

“这个问题已经困扰咱们不少年了。”算法

“不用纠结,让我用算法来替你解决它。”编程

6个月后…flask

“哇,你这问题确实好难。”“你不是说……”网络


➤1 —  Dash入门


Dash提供了一套全新的用于web的图表库,而这篇文章深刻介绍了Dash图表库是如何设计的,以及介绍了在Dash中如何有效地处理常见错误以及多重集成。文章中对Excel和R语言系统进行了很合理的对比。使用Dash进行图表实现时,一个技术上的挑战是,你须要维护一个flask应用以及拥有一个对ReactJS友好的前端。


Adil Baaj在咱们的博客上发布了一篇对比多种javascript图表库的文章。若是但愿入门Dash,能够阅读来自plotly的《Dash入门》。




➤2 —  Google发布用于目标检测的TensorFlow API


Google公司一直致力于让大数据领域最新研究的实现变得更加简单。本月他们在TensorFlow上发布了用于目标检测的API,也发布了适用于移动设备的版本。机器学习



➤3  — 初识生成式对抗网络(Generative Adversarial Networks, GAN)


这是一篇介绍如何训练一个神经网络来生成手写数字图片的教程。咱们很欣赏这种在对抗式网络这个新的研究方向上的实践技术,这又是一个在经典MNIST数据集上作的实验。在这篇文章中,你将得知训练生成式对抗网络是一件困难的事,是由于你须要在生成器与判别器的训练中找到平衡。本教程仅须要大概半小时就能读完,属同类教程中的佼佼者。



➤4  —  使用深度学习技术重构出高分辨率的音频


受到最近图像方面研究的启发,文章做者尝试用低质量的音频文件来重构出分辨率更高的音频,最终音频质量上没有取得大幅度的提升,但也必定程度上达到了目的。尽管实验结果上的提高并不显著,咱们仍然认为该篇文章为本月最佳文章之一。缘由以下:


  • 本文着重于重构VoIP语音,这点很巧妙。

  • 语音方面的研究工做比较复杂,而深度学习技术的应用除了在语音转文本应用领域以外,其余的较少见到。


咱们以为若是做者在卷积网络中使用频谱表示而不是时间表示的话,实验结果还能再提高一步。



➤5  —  探索LSTM


咱们破例收录了这篇文章(发表时间在5月30日,严格上说不是6月份的文章),由于文章写得特别好。这篇文章的前半部分是一个LSTM教程,后半部分深刻浅出对LSTM做了详解。详解部分使得本文很是有价值。审计 (Audit) 仍然是大数据算法中最困难的部分。正因如此,Edwin Chen作的可视化工具很是棒,由于它详细解析了LSTM的原理。


详见AI科技大本营的完整译文: 多图|入门必看:万字长文带你轻松了解LSTM全貌


➤6  —  怎样训练神经网络来自动写代码?

若是你阅读了前面关于LSTM的文章,那么你已经看到了一个关于生成Java程序的例子。来自Thibault Neveu的这篇文章也在尝试作一样的事情。文中使用TensorFlow而且比以前的文章更易于上手,而且更适合作快速阅读。


详见AI科技大本营的完整译文:
手把手教你自制编程AI:训练2小时,RNN就能写本身的代码


➤7  —  人工智能让制药业再创辉煌以及所面临的挑战


这篇文章介绍了如何使用生成式对抗网络来生成新的抗癌药物,思路很棒。在制药研究领域有一个Eroom定律,与摩尔定律正相反(随着时间推移,寻找新药的难度呈指数增加)。Mostapha Benhenda强烈呼吁研究人员在大数据与药理学交叉领域上的研究采起行动。



➤8  —  你所不知道的图表展现小技巧




注意到上面饼状图里一些奇怪的地方了吗?你应该注意到,不过你可能没有(至少我没)。这篇文章详细举例说明了用图表来作比较时的错误用法,从中你会学到在对比两种类似的数据时,图表展现的方式很是重要。


详见Andrew Gelman的原文


➤9 — 我在Kaggle上获胜的小技巧


Kaggle是一个数据科学方面在线竞赛平台。公司能够提交赛题以及相关数据集供参赛者解决。Kaggle是一个大型社区,你在上面有机会得到百万美金大奖。这篇文章的做者分享了他从开始时的新手到后来比赛取得第五名的经验。咱们认为他总结的参赛小技巧也可供企业数据科学家参考,若是你想参与Kaggle上的竞赛,那么这篇文章将很是值得一读。



➤10 — 大数据的体现:Amazon收购全食超市的交易


最后再介绍一篇关于商业上Amazon收购Whole Foods超市的文章。随着大数据的研究逐渐渗透商界,咱们认为这类文章是这个列表的重要补充。从企业获取数据的角度来看,Amazon收购Whole Foods超市是明智之举。由于Amazon虽然是个大公司,可是数量上远不及Whole Foods超市多,因此收购将为其带来巨大的数据财富。



对于咱们选出来的本月十佳文章,你都有看过吗?你内心有没有其余更好的选项?欢迎在评论中告诉咱们,若是大家喜欢,我们下期再见。


相关文章
相关标签/搜索