转载:本身学习使用html
python语言python
推荐看廖雪峰的python3教程。web
数据分析python基础算法
如list,tuple,dic,set等。我以后的博客会写到。数据库
python爬虫api
推荐一本书:《Python网络数据采集》(web Scraping with Python) Ryan Mitchell 写的,很是好。读完这本书+实战几回爬虫你就算熟练了。我以后写的爬虫博客也会以读这本书时的读书笔记来写。数组
实战推荐崔庆才的博客,也能够看我以后写的爬虫实战博客,我是按照他大框架来进行学习的。网络
数据的IO,EXCEL,CSV,JSON,SQL数据库。HDF5等。python爬虫
Numpy数组框架
Pandas 数据分析
Scipy 矩阵
Matplotlib 数据可视化
这一部分推荐看《Python数据分析》(Python Data Analysis)Lvan Idris写的。
对采集来或现成的数据进行预处理,数据清洗(推荐看《干净的数据=Clean data:数据清洗入门与实践》做者:Megan Squire),数据集成,数据变换,数据规约等。这一部分有兴趣能够看一本书 《Python数据分析与挖掘实战》。这本书看个框架就行。其实写的不咋的。浪费了我很久时间。
学习各类机器学习,数据分析算法。
算法原理推荐看《数据挖掘十大算法》做者:Xindong Wu,Vipin Kumar
python实现推荐看《Python数据分析与挖掘实战》+《Python数据分析》+《机器学习实战》
再往深就是深度学习,神经网络。
学习每个都须要付出很大量时间,精力与努力。但愿你是真的对数据挖掘,数据分析有兴趣。