成为数据科学家的7本入门推荐书籍

本文成为数据科学家的7本入门推荐书籍翻译自[Tomi Mester]()的Wannabe Data Scientists! Learn the basics with these 7 books!
本文从属于笔者的程序猿的数据科学与机器学习实战手册系列,若是你想了解更多关于数据科学、机器学习、深度学习的资料能够参考面向程序猿的数据科学与机器学习知识体系及资料合集git


在过去的几年中我一直在阅读各式各样的数据科学方面的书籍资料,上述7本是我我的最为欣赏的,它们都是我认为的将数据科学的基础原理阐述的通俗易懂的颇有价值的资料。书读百遍,其义自见,即便你初看之下以为晦涩难懂,相信多读几遍也就慢慢理解了。另外若是你以为单纯阅读有点无聊的话,也能够带着看看我以前推荐的10个免费在线课程,相辅相成,相信你会学习的更快。github

1. Lean Analytics — by Croll & Yoskovitz

第一本书是教会你如何创建基本的以商业思惟去使用这些数据,虽然这本书自己定位是面向初学者,不过我以为你能够从中学到更多。你能够从本书中学到一条基本准则、6个基础的线上商业形态以及隐藏其后的数据策略。编程

2. Business value in the ocean of data — by Fajszi, Cser & Fehér

若是说Lean Analytics是关于面向初学者讲解商业逻辑加上数据,那么本书是面向大型公司来说解这些内容。听上去好像没啥新鲜的,不过每每初创企业与独角兽之间面对的问题是千差万别,本书中会介绍譬如保险公司是如何进行订价预测或者银行从业者们又在面临怎样的数据问题。segmentfault

3. Naked Statistics — Charles Wheelan

这本书我一直非常推荐,由于它不单单面向数据科学家,而是为任何一个行业的人提供基本的统计思惟,这一点偏偏是我认为很是关键的。这本书并无太多的长篇大论,而是以一个又一个的故事形式来说解统计思惟在公司运营中的重要做用。架构

4. Doing Data Science — Schutt and O’Neil

这算是最后一本非技术向的书了吧,这本书相较于上面三本更上一层楼,他深刻了譬如拟合模型、垃圾信息过滤、推荐系统等等方面的知识。机器学习

5. Data Science at the Command Line — Janssens

在介绍本书以前首先要强调下,千万不要畏惧编程,学习些简单的编程知识可以有助于你作更多有趣的事。你能够本身去获取、清洗、转化或者分析你的数据。不过我也不会一上来就扔出大堆的编程知识,我建议仍是从简单的命令行操做开始学起,而本书正是介绍如何只用命令行就帮你完成些数据科学的任务。学习

6. Python for Data Analysis — McKinney

Python算是近几年来很是流行的数据分析的语言了吧,人生苦短,请用Python。这本书算是个大部头了,有400多页吧,不过它首先为你介绍了Python的基础语法,所以学起来不会很困难吧。spa

7. I heart logs — Jay Kreps

最后一本书则是短小精悍,加起来才60多页吧。不过它对于数据收集和处理的技术背景有很好的概述,虽然不少分析家或者数据科学家并不会直接用到这些知识,可是至少你可以理解技术人员们能够用哪些架构去解决数据问题。命令行

相关文章
相关标签/搜索