python科学计算和数据分析经常使用库
- NumPy
NumPy最强大的是n维数组,该库还包含基本的线性代数函数、傅立叶变换、随机函数和其余底层语言(如Fortran、C和C++)集成的工具。
- SciPy
SciPy创建在NumPy基础上,它是离散傅立叶变换、线性代数、优化和稀疏矩阵等多种高级科学和工程模块最有用的库之一。
- Matplotlib
Matplotlib主要用于绘制各类各样的图形,从直方图到线图、热力图,还可使用Latex命令在图像中添加数学符号。
- Pandas
Pandas主要用于结构化数据的运算和操做,普遍用于数据整理和预处理,其有助于提升Python在数据科学社区的使用。
- Scikit
Scikit主要用于机器学习,该库创建在NumPy、SciPy和matplotlib基础上,包含许多有效的机器学习和统计建模工具,如分类、回归、聚类和降维。
- Statsmodels
Statsmodels用于统计建模。Statsmodels是一个Python中提供用户探索数据、估计统计模型和执行统计测试的模组。可用于不一样类型数据的描述性统计,统计测试,绘图功能和结果统计。
- Seaborn
Seaborn用于数据可视化。Seaborn是一个用于在Python中制做有吸引力和翔实的统计图形库。它是基于matplotlib。Seaborn旨在使可视化成为探索和理解数据的核心组成。
- Bokeh
Bokeh用于在现代网络浏览器上建立交互式图表,仪表盘和数据应用程序。它赋予用户以D3.js的风格生成优雅简洁的图形。此外,它具备超大型或流式数据集的高性能交互能力。
- Blaze
Blaze将Numpy和Pandas的能力扩展到分布式和流式传输数据集。它能够用于从众多来源(包括Bcolz,MongoDB,SQLAlchemy,Apache Spark,PyTables等)访问数据。与Bokeh一块儿,Blaze能够做为在巨型数据块上建立有效可视化和仪表盘的强大的工具。
- Scrapy
Scrapy用于网络爬虫。它是获取特定模式数据的很是有用的框架。它从网站首页url开始,而后挖掘网站内的网页内容来收集信息。
- SymPy
SymPy用于符号计算。它具备从基本算术符号到微积分,代数,离散数学和量子物理学的普遍能力。另外一个有用的功能是将计算结果格式化为LaTeX代码。
- Requests Requests用于web访问。它相似于标准python库urllib2,可是代码更容易。你会发现与urllib2的微妙差别,可是对于初学者来讲,Requests可能更方便。
欢迎关注本站公众号,获取更多信息