利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操做

时间 2019-11-06

标签利用 python 进行数据分析 pandas 基础 series dataframe 基本栏目 Python 繁體版

原文原文链接

1、reindex() 方法：从新索引

针对 Series

从新索引指的是根据index参数从新进行排序。

若是传入的索引值在数据里不存在，则不会报错，而是添加缺失值的新行。

不想用缺失值，能够用 fill_value 参数指定填充值。

例如：

fill_value 会让全部的缺失值都填充为同一个值，若是不想这样而是用相邻的元素（左或者右）的值填充，则能够用 method 参数，可选的参数值为 ffill 和 bfill，分别为用前值填充和用后值填充：

针对 DataFrame

从新索引操做：

2、drop() 方法：丢弃数据

针对 Series

针对 DataFrame

不只能够删除行，还能够删除列：

3、索引、选取和过滤

针对 Series

须要注意一点的是，利用索引的切片运算与普通的 Python 切片运算不一样，其末端是包含的，既包含最后一个的项。比较：

赋值操做：

针对 DataFrame

DataFrame 中的 ix 操做：

4、算术运算和数据对齐

针对 Series

将2个对象相加时，具备重叠索引的索引值会相加处理；不重叠的索引则取并集，值为 NA：

针对 DataFrame

对齐操做会同时发生在行和列上，把2个对象相加会获得一个新的对象，其索引为原来2个对象的索引的并集：

和Series 对象同样，不重叠的索引会取并集，值为 NA；若是不想这样，试试使用 add() 方法进行数据填充：

5、函数应用和映射

将一个 lambda 表达式应用到每列数据里：

除了lambda 表达式还能够定义一个函数：

6、排序

针对 Series

针对 DataFrame

7、排名

8、带有重复值的轴索引

索引不强制惟一，例如一个重复索引的 Series：

安装步骤已经在首篇随笔里写过了，这里不在赘述。利用Python进行数据分析(1) 简单介绍

接下来一篇随笔内容是：利用Python进行数据分析(9) pandas基础: 汇总统计和计算，有兴趣的朋友欢迎关注本博客，也欢迎你们添加评论进行讨论。