图解pandas模块21个经常使用操做

点击上方“超哥的杂货铺”，轻松关注
web

Pandas 是 Python 的核心数据分析支持库，提供了快速、灵活、明确的数据结构，旨在简单、直观地处理关系型、标记型数据。Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具，其长远目标是成为最强大、最灵活、能够支持任何语言的开源数据分析工具。通过多年不懈的努力，Pandas 离这个目标已经愈来愈近了。数组

下面对pandas经常使用的功能进行一个可视化的介绍，但愿能让你们更容易理解和学习pandas。微信

一、Series序列数据结构

系列(Series)是可以保存任何类型的数据(整数，字符串，浮点数，Python对象等)的一维标记数组。轴标签统称为索引。

二、从ndarray建立一个系列app

若是数据是ndarray，则传递的索引必须具备相同的长度。若是没有传递索引值，那么默认的索引将是范围(n)，其中n是数组长度，即[0,1,2,3…. range(len(array))-1] - 1]。函数

三、从字典建立一个系列工具

字典(dict)能够做为输入传递，若是没有指定索引，则按排序顺序取得字典键以构造索引。若是传递了索引，索引中与标签对应的数据中的值将被拉出。

四、序列数据的访问学习

经过各类方式访问Series数据，系列中的数据可使用相似于访问numpy中的ndarray中的数据来访问。spa

五、序列的聚合统计.net

Series有不少的聚会函数，能够方便的统计最大值、求和、平均值等

六、DataFrame(数据帧)

DataFrame是带有标签的二维数据结构，列的类型可能不一样。你能够把它想象成一个电子表格或SQL表，或者 Series 对象的字典。它通常是最经常使用的pandas对象。

七、从列表建立DataFrame

从列表中很方便的建立一个DataFrame，默认行列索引从0开始。

八、从字典建立DataFrame

从字典建立DataFrame，自动按照字典进行列索引，行索引从0开始。

九、列选择

在刚学Pandas时，行选择和列选择很是容易混淆，在这里进行一下整理经常使用的列选择。

十、行选择

整理多种行选择的方法，总有一种适合你的。

十一、返回指定行列

pandas的DataFrame很是方便的提取数据框内的数据。

十二、条件查询

对各种数值型、文本型，单条件和多条件进行行选择

1三、聚合

能够按行、列进行聚合，也能够用pandas内置的describe对数据进行操做简单而又全面的数据聚合分析。

1四、聚合函数

data.function(axis=0) 按列计算

data.function(axis=1) 按行计算

1五、分类汇总

能够按照指定的多列进行指定的多个运算进行汇总。

1六、透视表

透视表是pandas的一个强大的操做，大量的参数彻底能知足你个性化的需求。

1七、处理缺失值

pandas对缺失值有多种处理办法，知足各种需求。

1八、查找替换

pandas提供简单的查找替换功能，若是要复杂的查找替换，可使用map(), apply()和applymap()

1九、数据合并

两个DataFrame的合并，pandas会自动按照索引对齐，能够指定两个DataFrame的对齐方式，如内链接外链接等，也能够指定对齐的索引列。

20、更改列名（columns index）

更改列名我认为pandas并非很方便，但我也没有想到一个好的方案。

2一、apply函数

这是pandas的一个强大的函数，能够针对每个记录进行单值运算而不须要像其余语言同样循环处理。

整理这个pandas可视化资料不易，

若是你以为本文对其余人有帮助，

请分享给你的朋友，感谢感谢。

以清净心看世界；

用欢喜心过生活。

超哥的杂货铺，你值得拥有~

长按二维码关注咱们