实用的工具,有趣的人

1998年的9月4日,拉里·佩奇和谢尔盖·布林将Google带到这个世界。就在前几天,Google刚刚过了20岁生日。通过20年的发展,Google早已不是当初的小做坊了,而是发展成为被你们公认的全球最大的搜索引擎公司。20年间,Google不只在搜索技术上表现颇为出色,在大数据、云计算、AI等各个方面都有着巨大的贡献。
程序员


咱们都知道,现在世界已经从互联网时代走向大数据时代。数据几乎已经成为各个互联网公司的命脉,数据分析师这一职位也应运而生(虽然我本人不是数据分析师),可是我对数据分析很感兴趣。刚刚过完20岁生日的Google此次能够算是给数据分析师和数据分析爱好者们送上了一份大礼(果真是大公司,本身过生日还给咱们送礼)——一款叫作Google Dataset Search的搜索引擎。它是一款专门用来搜索数据集的搜索引擎,搜索结果中包括了数据集的建立者,发布时间,数据集的收集方式,数据集的使用条款以及对数据集的描述。web


还记得我当初自学大数据知识的时候,往往到了想要亲自动手试一试的时候,老是为找不到合适的数据集而苦恼。最后,我决定自学Python爬虫,想要什么数据都本身动手爬。然而,这种工做仍是挺繁琐的,也许对我这种自学的爱好者无所谓,反而还多掌握一门技术。但对于专门从事数据科学工做的人来讲可能会以为很痛苦。微信


随着Google Dataset Search的诞生,这种“巧妇难为无米之炊”的尴尬终于一去不复返了。如今你想要什么数据集均可以直接搜索,简直不要太方便。编辑器


这个网站的地址是:工具

https://toolbox.google.com/datasetsearch大数据


能够访问的同窗能够上去体验一下,目前仍是Beta版,没办法访问的同窗,看看这个界面先过过瘾吧。flex


以上就是今天要介绍的实用的工具。下面再来介绍一个有趣的人,一样是和DataSet Search有关。网站


要介绍的这我的呢,做为程序员必定很熟悉,就是Linux之父Linus Torvalds。怀着对大神的崇敬之情,我今天用Dataset Search搜索了一下Linus。结果果真没有令我失望,先来展现一下搜素结果。搜索引擎

第一条是Linus Torvalds Rants,能够理解为Linus的粗话(这是什么鬼?黑人问号脸)。google


咱们注意到数据集的描述为Linus2012年到2015年邮件的粗话合集。到这里有些怀疑这个数据集的真实性,不过对大神崇敬之情驱动着我点了进去,看看大神是怎么骂人的,

这是数据集的部分截图,连接也都是能够直接访问的。


总之,Linus大神说话仍是挺文明的,这种作法也很是有Linus的风格。(这里顺便提一下,Linus曾经在Linux内核代码中记录了女儿的生日)怎么样,是否是今天才发现原来Linus是如此有趣的人?


最后,国内某公司CEO说要“再”次击败Google,我以为他们仍是先多作些像这样有意义的事吧。

本文分享自微信公众号 - 代码洁癖患者(Jackeyzhe2018)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。

相关文章
相关标签/搜索