摘要: 本文主要介绍七本关于机器学习和数据科学数学基础的经典教材,是一份不可多得的书单整理。算法
大多数人学习数据科学的重心放在编程上面,然而,要真正精通数据科学的话是不可以忽视数据科学背后的数据基础。本篇文章,将分享给读者我喜欢的七本有关于数据科学基础的书,下面将逐一为你们介绍这七本数学基础书,请你们开始“享受”吧!
首先要明确一点,咱们为何要为学习数据科学的数学基础而努力呢?如下是激励个人缘由:编程
在数学界中,若是你想建立一个关于数学书的列表并不包括伟大的俄国数学家,那是不可能的。因此,在本文列表中的第一本书籍天然而然就是由Vladimir Vapnik编写的统计学习理论。该书是七本书中最难找到的一本,固然,在中国这都不是事儿。Vladimir Vapnik也是支持向量机(SVM)算法的创造者,其维基百科页面上介绍了不少关于他的工做。机器学习
相似于Vladimir Vapnik的书,Duda是另外一个时代的经典书籍。首次发表于1973年,在25年后(2000年)获得更新,以后再也没有进行更新,但这并不妨碍本书成为一本重要的书籍。该书采用模式识别的方法,并涵盖了大量的算法。布局
此书如今有第二版,这本书也是我读过最先的书籍之一。初版和第二版都很好,其中第二版有更多的Python代码。与前两本书相似,该书也很是强调算法。学习
又一本经典教材,我使用的版本印刷得很是好,具备很高的参考价值。网站
Christopher M. Bishop编写的模式识别和机器学习(信息科学和统计学)也是一本深刻浅出且很是完善的书籍,参考价值高。阿里云
我喜欢Peter Flach的书籍,尽管购物网站上的一些评论说其有些冗长并缺乏代码,但我喜欢其整本书的布局(算法的分组:逻辑模型、线性模型以及几率模型)和主题的总体处理。人工智能
该书也被称做“花书”,内容很详细且知识新,涵盖你能想到的一切知识点。
两个值得推荐的其它资源:spa
机器学习的第一门课程(A First Course in Machine Learning, Second Edition (Machine Learning & Pattern Recognition))——Simon Rogers、Mark Girolami
这本书有初版和第二版,其中初版是我获得的第一本书,但我不建议初学者看这本书,但这不妨碍该书是本好书(尤为是第二版)。
机器学习:从概念的角度(Machine Learning: A Probabilistic Perspective )——Kevin Murphy
该书评价很高,但我没有亲自阅读它,所以没有放在列表中。
总结
除了“花书”之外,我不会推荐从头至尾的阅读。我偏心于按照主题阅读书籍,即将其做为参考书,当须要清楚哪部份内容时阅读相应的内容。经过阅读以上这些书籍使我以为本身很谦卑,知道的不多,而机器学习和数据科学领域是多么的广阔。
书籍是永恒的,也是不会抛弃本身的朋友,一直在那里等着你去相遇、相识。Vladimir Vapnik如今已经81岁高龄,Duda这本书首次出版与1973年,我估计50年后,这个行业的从业者仍将阅读它们,就像经受住时间考验的老朋友同样。这展现了基于数学方法的寿命,永不褪色和凋零!翻译
做者信息
Ajit Jaokar,数据科学家、教师
本文由阿里云云栖社区组织翻译。
文章原标题《7 Books to Grasp Mathematical Foundations of Data Science and Machine Learning》,译者:海棠,审校:Uncle_LLD。
详情请阅读原文