利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操做


1、reindex() 方法:从新索引

针对 Series
 
从新索引指的是根据index参数从新进行排序。
若是传入的索引值在数据里不存在,则不会报错,而是添加缺失值的新行。
不想用缺失值,能够用 fill_value 参数指定填充值。
例如:
 
fill_value 会让全部的缺失值都填充为同一个值,若是不想这样而是用相邻的元素(左或者右)的值填充,则能够用 method 参数,可选的参数值为 ffill 和 bfill,分别为用前值填充和用后值填充:

针对 DataFrame
 
从新索引操做:

2、drop() 方法:丢弃数据
 
针对 Series
 
 
针对 DataFrame
 
不只能够删除行,还能够删除列:

3、索引、选取和过滤
 
针对 Series
 
 
须要注意一点的是,利用索引的切片运算与普通的 Python 切片运算不一样,其末端是包含的,既包含最后一个的项。比较:
 
赋值操做:
 
针对 DataFrame
 
 
DataFrame 中的 ix 操做:

4、算术运算和数据对齐
 
针对 Series
 
将2个对象相加时,具备重叠索引的索引值会相加处理;不重叠的索引则取并集,值为 NA:
 
针对 DataFrame
 
对齐操做会同时发生在行和列上,把2个对象相加会获得一个新的对象,其索引为原来2个对象的索引的并集:
 
和Series 对象同样,不重叠的索引会取并集,值为 NA;若是不想这样,试试使用 add() 方法进行数据填充:
 
5、函数应用和映射
 
将一个 lambda 表达式应用到每列数据里:
 
除了lambda 表达式还能够定义一个函数:
 
6、排序
 
针对 Series
 
针对 DataFrame
 
7、排名
 


8、带有重复值的轴索引
 
索引不强制惟一,例如一个重复索引的 Series:
 
安装步骤已经在首篇随笔里写过了,这里不在赘述。 利用Python进行数据分析(1) 简单介绍
接下来一篇随笔内容是:利用Python进行数据分析(9) pandas基础: 汇总统计和计算,有兴趣的朋友欢迎关注本博客,也欢迎你们添加评论进行讨论。
相关文章
相关标签/搜索