图解pandas模块21个经常使用操做

点击上方“超哥的杂货铺”,轻松关注
web


Pandas 是 Python 的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具,其长远目标是成为最强大、最灵活、能够支持任何语言的开源数据分析工具。通过多年不懈的努力,Pandas 离这个目标已经愈来愈近了。数组


下面对pandas经常使用的功能进行一个可视化的介绍,但愿能让你们更容易理解和学习pandas。微信


一、Series序列数据结构

系列(Series)是可以保存任何类型的数据(整数,字符串,浮点数,Python对象等)的一维标记数组。轴标签统称为索引。



二、从ndarray建立一个系列app

若是数据是ndarray,则传递的索引必须具备相同的长度。若是没有传递索引值,那么默认的索引将是范围(n),其中n是数组长度,即[0,1,2,3…. range(len(array))-1] - 1]。函数


三、从字典建立一个系列工具

字典(dict)能够做为输入传递,若是没有指定索引,则按排序顺序取得字典键以构造索引。若是传递了索引,索引中与标签对应的数据中的值将被拉出。


四、序列数据的访问学习

经过各类方式访问Series数据,系列中的数据可使用相似于访问numpy中的ndarray中的数据来访问。spa


五、序列的聚合统计.net

Series有不少的聚会函数,能够方便的统计最大值、求和、平均值等



六、DataFrame(数据帧)

DataFrame是带有标签的二维数据结构,列的类型可能不一样。你能够把它想象成一个电子表格或SQL表,或者 Series 对象的字典。它通常是最经常使用的pandas对象。




七、从列表建立DataFrame

从列表中很方便的建立一个DataFrame,默认行列索引从0开始。



八、从字典建立DataFrame

从字典建立DataFrame,自动按照字典进行列索引,行索引从0开始。


九、列选择

在刚学Pandas时,行选择和列选择很是容易混淆,在这里进行一下整理经常使用的列选择。



十、行选择

整理多种行选择的方法,总有一种适合你的。






十一、返回指定行列

pandas的DataFrame很是方便的提取数据框内的数据。



十二、条件查询

对各种数值型、文本型,单条件和多条件进行行选择




1三、聚合

能够按行、列进行聚合,也能够用pandas内置的describe对数据进行操做简单而又全面的数据聚合分析。





1四、聚合函数

data.function(axis=0) 按列计算

data.function(axis=1) 按行计算



1五、分类汇总

能够按照指定的多列进行指定的多个运算进行汇总。




1六、透视表

透视表是pandas的一个强大的操做,大量的参数彻底能知足你个性化的需求。




1七、处理缺失值

pandas对缺失值有多种处理办法,知足各种需求。



1八、查找替换

pandas提供简单的查找替换功能,若是要复杂的查找替换,可使用map(), apply()和applymap() 



1九、数据合并

两个DataFrame的合并,pandas会自动按照索引对齐,能够指定两个DataFrame的对齐方式,如内链接外链接等,也能够指定对齐的索引列。



20、更改列名(columns index)

更改列名我认为pandas并非很方便,但我也没有想到一个好的方案。



2一、apply函数

这是pandas的一个强大的函数,能够针对每个记录进行单值运算而不须要像其余语言同样循环处理。



整理这个pandas可视化资料不易,

若是你以为本文对其余人有帮助,

请分享给你的朋友,感谢感谢。


以清净心看世界;

用欢喜心过生活。


超哥的杂货铺,你值得拥有~


长按二维码关注咱们


推荐阅读:

1.一场pandas与SQL的巅峰大战

2.一场pandas与SQL的巅峰大战(二)

3.一场pandas与SQL的巅峰大战(三)

4.一场pandas与SQL的巅峰大战(四)

5.一场pandas与SQL的巅峰大战(五)

6.一场pandas与SQL的巅峰大战(六)

7.一场pandas与SQL的巅峰大战(七)



本文分享自微信公众号 - 超哥的杂货铺(gh_a624b94bfdab)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。

相关文章
相关标签/搜索