4月份最热门的数据科学和机器学习GitHub开源库和Reddit话题

做者|PRANAV DAR
编译|zongmumask
编辑|Debra
AI 前线导读:当涉及到数据科学和机器学习时,GitHub 和 Reddit 是最受欢迎的两个平台。 前者是代码分享和协同工做的绝佳工具,然后者则是与全球数据科学爱好者交流的最佳平台。今年,咱们每月都会讨论最热门的 GitHub 开源项目,从本月起,咱们将包括 Reddit 上机器学习领域最有趣的话题。

更多干货内容请关注微信公众号“AI 前线”,(ID:ai-front)

4 月份一些很酷的 Python 项目开源了。 从 Deep Painterly Harmonization,一个使合成图片很真实的库,到 Swift for TensorFlow,这篇文章涵盖了上个月最出色的开源项目。python

git

咱们来看看四月关于数据科学和机器学习最热门的开源项目和 Reddit 上最有趣的讨论。github

下面连接能够查看过去三个月里最热门的开源项目:算法

  • 二月 swift

    https://www.analyticsvidhya.com/blog/2018/02/top-5-github-repositories-january-2018/微信

  • 三月网络

    https://www.analyticsvidhya.com/blog/2018/03/top-5-github-repositories-february-2018/
    架构

  • 四月框架

    https://www.analyticsvidhya.com/blog/2018/04/top-7-github-repositories-march-2018/
    less

GitHub 开源项目
Deep Painterly Harmonization



https://github.com/luanfujun/deep-painterly-harmonization

使合成图像看起来更加真实的技术已经发展了有些年头。 经过深度学习,这个任务将变得更有效率,合成效果也更真实。 开发人员提出新算法,可使外部元素与手绘完美融合,最终合成效果几乎与原始绘图没法区分。

上面的三张图片 - 第三帧是最终输出,若是没有前面的两张图片,是很难知道气球是后来合成进来的。 该算法比手动合成更精细,迄今为止,其精细程度手动编辑也很难实现。

你能够在这里 AVBytes 了解关于 Deep Painterly Harmonization 的更多信息。

https://www.analyticsvidhya.com/blog/2018/04/add-objects-paintings-images-seamlessly-amazing-python-script/

Swift For TensorFlow



https://github.com/tensorflow/swift


在上个月的 TensorFlow 开发者峰会上亮相,如今已经在 GitHub 上向整个社区开源。 开发团队的目标是为 TensorFlow 提供一个新的平台,这创建在 TensorFlow 强大的功能基础上,同时将其可用性提高到一个全新的水平。

因为该项目仍处于初始阶段,还不适合用于构建深度学习模型。 团队认可截止到开源面向社区,该项目离设想中的目标还有必定距离。 但其中还有不少潜力还没有开发。

咱们在这里

https://www.analyticsvidhya.com/blog/2018/04/swift-tensorflow-now-open-sourced-github/介绍了 Swift for TensorFlow 以供参考。

MUNIT: 多模态无监督图像转换



https://github.com/NVlabs/MUNIT

康奈尔大学的一个研究小组提出了多模态无监督图像到图像转换(MUNIT)框架,用于将图像从一个领域转换到另外一个领域。 其目的是将图像转换成指定领域的新图像(例如,将狗的图像转换为猫)。

先前存在的方法可以仅执行给定图像的一对一映射,不能对同一张图像产生不一样的输出。 然而,MUNIT 可以产生多个输出。 激动吧!

咱们在 AVBytes 上

https://www.analyticsvidhya.com/blog/2018/04/framework-for-unsupervised-image-to-image-translation/ 介绍了它的工做原理。

GluonNLP



https://github.com/dmlc/gluon-nlp

深度学习在天然语言处理领域取得了长足进步。 在互联网上出现过的有不少文字能够追溯到几个世纪! GluonNLP 是一个工具包,旨在让 NLP 任务变得更简单。 经过海量数据和构建的深度学习神经模型让文字处理更加容易。 这使得 NLP 研究变得更加高效。

该库拥有一个很好的文档,以及详细的使用示例。 该库还有一个针对新手的 60 分钟速成课程。

PyTorch GAN

https://github.com/eriklindernoren/PyTorch-GAN

该库是一个金矿。 该库收集了已经发表的关于 GAN(或生成敌对网络)研究论文的 PyTorch 实现。 目前列出了 24 种不一样的实现,每种实现都有其独特之处。 该列表包含 Adversarial Autoencoders,CycleGAN,Least Squares GAN,Pix2Pix 等实现。

Reddit 讨论话题
帮助用户理解研究论文

https://www.reddit.com/r/MachineLearning/comments/8b4vi0/d_anyone_having_trouble_reading_a_particular/

若是在理解任何研究论文时遇到困难,那么 Reddit 机器学习社区能够提供帮助。 这是一个很是棒的想法,它已经帮助不少人在快要放弃的时候找到了问题的答案并继续下去。

可是当你想要发帖时,要确保提供尽量详细的信息,好比文章摘要,被卡住的地方,你本身发现了什么,等等。这条评论总结得很好 - “把本身当作写论文的研究小组成员,而不是等待别人给你答案”。

关于机器智能的声明

https://www.reddit.com/r/MachineLearning/comments/8fmtr9/d_statement_on_nature_machine_intelligence/

关于研究应该是开源仍是封闭的争论已经持续了数十年。 最近,受欢迎的“天然”杂志宣布它将发布封闭式期刊。 这致使了一场针对他们的重大运动,许多有影响力的人(Jeff Dean, Ian Goodfellow 等)在一份请愿书中加入了他们的签名,声明他们不会向这样的出版物投稿。

关于研究结果是否应该开源给社区有不一样的看法。 这是一个值得了解的话题,强烈建议阅读整个主题,看看 ML 社区对这个主题的见解。

Michael Jordan 关于 AI 现状的演讲

https://www.reddit.com/r/MachineLearning/comments/8daqki/d_very_sobering_presentation_on_the_current_state/

Michael Jordan 是伯克利的著名教授,在最近的一次演讲中他详细地谈了咱们离真正的机器智能还有多远。 这是一个思路清醒的演讲,听完会让人对这个问题产生思考。

这个主题已经产生了超过 100 条评论,用户充分发表了他们关于 AI 现状的想法。 用户的深刻讨论让这个话题变得更有意思。 这个话题仍在讨论中,加入他们吧。

科学家计划创建巨型欧洲 AI 中心与美国竞争

https://www.reddit.com/r/MachineLearning/comments/8ekmqy/scientists_plan_huge_european_ai_hub_to_compete/

这个问题里面也有不少干货。 来自欧洲和美国各地的数据科学家和机器学习研究人员参与了关于 ML 的结构以及薪资的激烈讨论。这里能够得到关于 ML 项目和潜在薪酬架构的不少观点。

测量目标景观的内在维度

https://www.reddit.com/r/MachineLearning/comments/8f9dvm/ruberai_measuring_the_intrinsic_dimension_of/

这个主题是从 Uber 的视频中发展出来的,它将内在维度发展为神经网络的基本属性。 若是你对视频中提供的内容有任何疑问,社区已经详细回答了这些问题。 最棒的彷佛是人们喜欢将一篇研究论文转化为一段视频,这使得研究更容易理解。


更多干货内容请关注微信公众号“AI 前线”,(ID:ai-front)
相关文章
相关标签/搜索