在 Windows 中通过 pip 安装 Numpy,Scipy,Matplotlib,Pandas,StatsModels,Scikit-Learn,PyWavelets,Graphviz,TSNE

Numpy

Numpy 提供数组支持,以及相应的高效处理函数。由于 Numpy 还是很多高级扩展库的依赖库,通常在安装其他扩展库之前,需要完成 Numpy 的安装。

Downloads: 点击打开链接  

                      https://pypi.org/project/numpy/#files

在 Windows 中,可以通过 pip 安装:

 

  • 在 pip 所在目录下打开命令窗口,执行命令:

         pip install numpy.whl

例:pip install numpy-1.14.3-cp36-none-win_amd64.whl

Note: 这里下载的 wheel 文件的文件名不可随意更改,更改后可能出现错误:“xxx.whl is not a valid filename”

Numpy API REFERENCE: https://docs.scipy.org/doc/numpy/reference/c-api.html

Scipy

Scipy 提供矩阵支持,以及矩阵相关的数值计算模块。Scipy 依赖于 Numpy ,因此安装前需要先安装 Numpy。

Downloads:点击打开链接

                       https://github.com/scipy/scipy/releases

 

在 Windows 中,可以通过 pip 安装:

 

  • 在 pip 所在目录下打开命令窗口,执行命令:

         pip install scipy.whl

例:pip install scipy-1.1.0-cp36-none-win_amd64.whl

Scipy API REFERENCE:  https://docs.scipy.org/doc/scipy/reference/api.html

 

Matplotlib

 

Matplotlib 是强大的数据可视化工具,作图库,主要用于二维绘图和简单的三维绘图。通过 Matplotlib 可以快捷地用 Python 可视化数据,并且输出多种图像格式。

Matplotlib 的上级依赖库相对较多,具体包括(建议如下顺序安装各个库):

 

  • numpy:下载地址  https://pypi.org/project/numpy/#files
  • six: dateutil 和 cycler 依赖于 six 的 安装。下载地址  https://pypi.org/project/six/#files
  • dateutil:下载地址  https://pypi.org/project/python-dateutil/#files
  • pytz:下载地址  https://pypi.org/project/pytz/#files
  • pyparsing:下载地址  https://pypi.org/project/pyparsing/#files
  • kiwisolver:下载地址  https://pypi.org/project/kiwisolver/#files
  • setuptools:下载地址  https://pypi.org/project/setuptools/#files
  • cycler:下载地址  https://pypi.org/project/Cycler/#files

部分依赖库安装示例如下:

在 Windows 中,可以通过 pip 安装:

  • 在 pip 所在目录下打开命令窗口,执行命令:

         pip install xxx.whl

Note:出现 error “Could not find a version satisfies the requirments ... ...  ”,则说明存在依赖库未安装成功。

以上依赖库均安装成功后,方可安装 Matplotlib

 

在 Windows 中,可以通过 pip 安装:

  • 在 pip 所在目录下打开命令窗口,执行命令:

         pip install matplotlib.whl

例:pip install matplotlib-2.2.2-cp36-cp36m-win_amd64.whl 

安装示例:

参考链接:

http://www.numpy.org/

http://www.scipy.org/

http://www.matplotlib.org/

Matplotlib API REFERENCE: https://matplotlib.org/api/pyplot_summary.html#the-pyplot-api

 

Pandas

Pandas 主要用于数据的读取和处理,带有丰富的数据处理函数,支持时间序列分析功能,确实数据的处理等,是 Python 下最强大的数据分析和探索工具。Pandas 构建在 Numpy 之上。

Downloads: https://pypi.org/project/pandas/#files

在 Windows 中,可以通过 pip 安装:

  • 在 pip 所在目录下打开命令窗口,执行命令:

         pip install pandas.whl

安装完成后,需要安装 xlrdxlwt 库才能支持 Excel 的读写:

Downloads:https://pypi.org/project/xlrd/#files

                    https://pypi.org/project/xlwt/#files

安装方法与其他库相似,使用 pip 安装,执行命令: pip install xlrd   

                                                                                              pip install xlwt

Pandas API REFERENCE: http://pandas.pydata.org/pandas-docs/stable/api.html

Note:若要使用 pandas 读取数据库文件 read_sql,需要知道以下依赖:依赖SQLAlchemy库,而SQLAlchemy库依赖于 PyMySQL。

Pandas在读取数据(不管是csv、xls、sql),都是将全部数据读入内存中,因此在数据量较大时难以实现。所以pandas提供了 chunksize参数,以分块读取大数据文件。

StatsModels

StatsModels 主要用于数据的统计建模分析,支持与 Pandas 进行数据交互,其安装依赖于 Pandas 和 patsy。

Downloads: https://pypi.org/project/statsmodels/#files

                     https://www.lfd.uci.edu/~gohlke/pythonlibs/#statsmodels

在 Windows 中,可以通过 pip 安装:

  • 在 pip 所在目录下打开命令窗口,执行命令:

         pip install statsModels.whl

Pandas API REFERENCE:

 http://www.statsmodels.org/stable/generated/statsmodels.tsa.arima_model.ARIMA.fit.html#statsmodels.tsa.arima_model.ARIMA.fit

 

Scikit-learn

Scikit-learn 提供了完善的机器学习工具箱,包括数据预处理、分类、回归、聚类、预测和模型分析等。Scikit-Learn 的安装依赖于 Numpy、Scipy、Matplotlib。

Note: 依赖库的安装很重要,只有先把依赖库安装成功,然后安装 scikit-learn 就会很容易

Downloads: https://pypi.org/project/scikit-learn/#files

        在 Windows 中,可以通过 pip 安装:

  • 在 pip 所在目录下打开命令窗口,执行命令:

         pip install scikit-learn.whl

Scikit-Learn API REFERENCE:  http://scikit-learn.org/stable/modules/classes.html

 

PyWavelets

StatsModels 是一个较全面的信号处理库,其安装依赖于 Cython,Numpy,Matplotlib。

Downloads: https://pypi.org/project/Cython/#files        

                     https://pypi.org/project/PyWavelets/#files

在 Windows 中,可以通过 pip 安装:

  • 在 pip 所在目录下打开命令窗口,执行命令:

         pip install Pywavelets.whl

 

 

Graphviz

Graphviz 是一个跨平台、基于命令行的绘图工具。主要用于决策树生成后的格式转换,将决策树导出结果 “tree.dot”  转换为 PDF或 PNG 等格式。

Downloads:  http://www.graphviz.org/Download_windows.php

双击 .msi 文件进行安装,安装完成后将 dot.exe 的目录添加到系统环境变量

检查安装: dot -version

 

 

TSNE

TSNE 是聚类结果可视化工具,提供有效的数据降维方式,可以在2 维或3 维的空间中展示聚类结果。其安装依赖于 Cython,Numpy,Scipy

Downloads: https://pypi.org/project/tsne/#files

解压并运行 setup.py 进行安装