pandas读书笔记、从新索引

时间 2019-12-02

标签 pandas 读书笔记从新索引繁體版

原文原文链接

从新索引

pandas对象的一个重要方法是 reindex ,其做用是建立一个适应新索引的新对象。

#reindex函数的参数
reindex(index,method,fill_value,limit,level,copy)
#index:用做索引的新序列
#method:插值（填充）方式
#fill_value：在从新索引的过程当中，须要引入缺失值时使用的代替值
#limit：前向或后向填充时的最大填充量
#level：在MultiIndex的指定级别上匹配简单索引，不然选取其子集
#copy：默认为True，不管如何都复制，若是为False，则新旧相等就不复制

obj=Series([4.5,7.2,-5.3,3.6],index=['d','b','a','c'])
obj

#调用该Series的reindex将会根据新索引进行重排
#若是某个索引值当前不存在，就引入缺失值
obj2=obj.reindex(['a','b','c','d','e'])
obj2

#填充缺失值
obj.reindex(['a','b','c','d','e'],fill_value=0)

从新索引时，可能须要作一些插值处理。method选项能够达到此目的。函数

obj3=Series(['blue','purple','yellow'],index=[0,2,4])
obj3
obj3.reindex(range(6),method='ffill')

reindex的（插值）method选项

ffill或pad ——向前填充（或搬运）值

bfill或backfill——后向填充（或搬运）值

从新索引行spa

frame=DataFrame(np.arange(9).reshape(3,3),index=['a','c','d'],
               columns=['Ohio','Texas','California'])
frame

frame2=frame.reindex(['a','b','c','d'])
frame2

从新索引列

使用 columns关键字进行从新索引

states=['Texas','Utah','California']
frame.reindex(columns=states)

同时对行和列进行从新索引code

frame.reindex(index=['a','b','c','d'],columns=states).ffill()

利用ix的标签索引功能，从新索引任务能够变得更简洁：对象

frame.ix[['a','b','c','d'],states]

问题记录：blog

在同时对行和列进行索引时，书中代码是：索引

frame.reindex(index=['a','b','c','d'],method='ffill',columns=states)

可是会出现错误：pandas

ValueError: index must be monotonic increasing or decreasing

#不加ffill填充
frame.reindex(index=['a','b','c','d'],columns=states)

结果为it

查找资料后本身初步理解为：为了从新索引方法，你的索引必须是有序/单调/递增的顺序，由于列也是从新索引的，而不是单调增长或减小。io

书中的代码适合之前版本的pandas。class

资料连接：https://stackoverflow.com/questions/44868877/valueerror-index-must-be-monotonic-increasing-or-decreasing-including-index-co/46893526#46893526

解决：

frame.reindex(index=['a','b','c','d'],columns=states).ffill()

上面写法能够达到与书中一样的结果。