我入门是看了范淼和李超的《python机器学习机实践-----从零开始通往Kaggle竞赛之路》html
这本书须要掌握python语言,并熟练使用以下python包:pandas numpy matplotlib/seaborn sklearnpython
pandas是数据处理的一个库,经过http://www.cnblogs.com/chaosimple/p/4153083.html就能够学会个大概算法
numpy是处理多维数组的一个库,经过http://old.sebug.net/paper/books/scipydoc/numpy_intro.html也能学到个大概数组
matplotlib能够用来作可视化,经过http://old.sebug.net/paper/books/scipydoc/matplotlib_intro.html也能学到大概app
我通常使用seaborn作可视化,这个库是matplotlib的高级封装,经过http://blog.csdn.net/qq_34264472/article/details/53814653能够快速入门机器学习
https://www.kaggle.com/benhamner/d/uciml/iris/python-data-visualizations这个是seaborn作可视化很是好的例子学习
sklearn的总体性入门,我的以为看 范淼和李超的《python机器学习机实践-----从零开始通往Kaggle竞赛之路》就能够了spa
固然,上面这些都只是入门,要学会融会贯通,查看官网进行系统性学习是必须的;另外就是开始作项目,在看别人的代码,写本身的代码中熟悉各类语法和操做.net
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------htm
我学习东西,通常的思路都是先去找学习路径,常常上知乎。。
http://www.cnblogs.com/zhizhan/p/5826089.html这篇文章很是的好
总结下重点,
1,特征工程
目前的机器学习通常把大多数时间都花费在数据处理上(包括特征工程);
数据处理前须要先了解数据的大概,因此须要可视化
https://mp.weixin.qq.com/s/Nt9xKQQZLyWBmU_bMEsbtg这个是讲的比较好的一个例子
2,模型融合
模型融合简单来讲就是博采众长,分为bagging boosting stacking等
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------
有了上面的基础就算大概入门了,而后找几个kaggle的例子进行练手,同时看看别人都是怎么玩的
https://www.kaggle.com/kernels这里都是大神,按照各类类别或者本身喜欢的领域边看边写代码
看到下面的神图
参考自http://www.sv-europe.com/crisp-dm-methodology/
拜读起来!!!
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------
个人机器学习之旅,学了spark ml,看了几本理论(差很少忘了),看了公开课(吴恩达的),看了无数的文章,学会了大多数的调优
慢慢的有一种感受,这玩意还不成熟,总有一天会有一个大一统的模型出来,能够经过网页配置进行特征工程和机器学习调优,最终造成一个平台。
后来,果真看到了一个相似的http://blog.kaggle.com/2016/07/21/approaching-almost-any-machine-learning-problem-abhishek-thakur/
忽然感受,哪天是否是要失业了。。
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
深度学习貌似注重算法一些,为了避免失业,感受得不断丰富本身的武器库。加油加油!!