好久没写过博客了,一重开就给本身挖了这么一个大坑……html
最近一段时间看了《机器学习实战》这本书,感受写得不错,认真看了看。关于这本书的书评及购买事宜请移步豆瓣、京东、亚马逊等网站,这里很少说。不过有一点,感受这本书有个很好的地方是给出了各个算法的Python实现代码和讲解,要求不高的话能够拿来用了(懒)。在这里想好好写写从这本书中学到的东西,文中的代码和主要内容也将均来自这本书。git
目录github
第一部分 分类算法
第1章 机器学习基础机器学习
第3章 决策树性能
第4章 基于几率论的分类方法:朴素贝叶斯学习
第5章 Logistic回归大数据
第6章 支持向量机网站
第7章 利用Adaboost元算法提升分类性能
第二部分 利用回归预测数值型数据
第8章 预测数值型数据:回归
第9章 树回归
第三部分 无监督学习
第10章 利用K-均值聚类算法对未标注数据分组
第四部分 其余工具
第13章 利用PCA来简化数据
第14章 利用SVD简化数据
第15章 大数据与MapReduce
本书的主页:https://www.manning.com/books/machine-learning-in-action
书中的代码和所使用的数据集能够在主页或者这里(做者的GitHub版本库)找到。
书中有的代码均使用Python 2.7,并普遍使用了NumPy模块,若干章中还使用了Matplotlib模块进行绘图。能够安装Python 2.7的官方发行版,而后依次安装NumPy和Matplotlib模块(须要解决依赖)。在这里推荐直接安装Python发行版Anaconda,已经内置了不少科学计算所需的模块,可直接使用。