python在数据科学方面须要用到的库:python
a。Numpy:科学计算库。提供矩阵运算的库。算法
b。Pandas:数据分析处理库机器学习
c。scipy:数值计算库。提供数值积分和常微分方程组求解算法。提供了一个很是普遍的特定函数集合。函数
d。Matplotlib:数据可视化库学习
e。Scikit-learn:机器学习库ip
安装顺序以下:ci
1.pip install numpy
2.pip install pandasget
3.pip install scipy数据分析
(sudo apt-get install libatlas-base-dev gfortran //这一步是后面安装scipy所必需的. 备注:这个我没有先安装,直接就安装scipy)
4.pip install matplotlib pandas
(安装matplotlib以前首先安装libpng。下载地址:http://pan.baidu.com/s/1o80C5Jk,解压进入该文件夹,输入python install setup.py。
安装freetype,下载地址:http://pan.baidu.com/s/1dE5yvbr,解压进入该文件夹,输入python install setup.py。
对于freetype.tar.bz2的包,先进行安装再解压,命令:yum install bzip2,bunzip2 freetype-2.6.3.tar.bz2,tar -xvf freetype-2.6.3.tar)
5.pip install -U scikit-learn
建议用pip进行安装。也能够用yum安装,apt-get安装。可是pip安装的包通常都比较新,因此建议用pip进行安装。
其实numpy,pandas,scipy,matplotlib能够直接下载一个anaconda就能够了。
具体能够看http://python.jobbole.com/86236/