pandas读书笔记、从新索引

 
从新索引
 
pandas对象的一个重要方法是  reindex ,其做用是建立一个适应新索引的新对象。
#reindex函数的参数
reindex(index,method,fill_value,limit,level,copy)
#index:用做索引的新序列
#method:插值(填充)方式
#fill_value:在从新索引的过程当中,须要引入缺失值时使用的代替值
#limit:前向或后向填充时的最大填充量
#level:在MultiIndex的指定级别上匹配简单索引,不然选取其子集
#copy:默认为True,不管如何都复制,若是为False,则新旧相等就不复制
obj=Series([4.5,7.2,-5.3,3.6],index=['d','b','a','c'])
obj

#调用该Series的reindex将会根据新索引进行重排
#若是某个索引值当前不存在,就引入缺失值
obj2=obj.reindex(['a','b','c','d','e'])
obj2

#填充缺失值
obj.reindex(['a','b','c','d','e'],fill_value=0)

从新索引时,可能须要作一些插值处理method选项能够达到此目的。函数

obj3=Series(['blue','purple','yellow'],index=[0,2,4])
obj3
obj3.reindex(range(6),method='ffill')
reindex的(插值)method选项
ffill或pad ——向前填充(或搬运)值
bfill或backfill——后向填充(或搬运)值

 

 从新索引行spa

frame=DataFrame(np.arange(9).reshape(3,3),index=['a','c','d'],
               columns=['Ohio','Texas','California'])
frame

frame2=frame.reindex(['a','b','c','d'])
frame2
 
从新索引列
使用 columns关键字进行从新索引
states=['Texas','Utah','California']
frame.reindex(columns=states)

 

同时对行和列进行从新索引code

frame.reindex(index=['a','b','c','d'],columns=states).ffill()

 

利用ix的标签索引功能,从新索引任务能够变得更简洁:对象

frame.ix[['a','b','c','d'],states]

 

问题记录:blog

在同时对行和列进行索引时,书中代码是:索引

frame.reindex(index=['a','b','c','d'],method='ffill',columns=states)

可是会出现错误:pandas

ValueError: index must be monotonic increasing or decreasing
#不加ffill填充
frame.reindex(index=['a','b','c','d'],columns=states)

结果为it

查找资料后本身初步理解为:为了从新索引方法,你的索引必须是有序/单调/递增的顺序,由于列也是从新索引的,而不是单调增长或减小。io

书中的代码适合之前版本的pandas。class

资料连接:https://stackoverflow.com/questions/44868877/valueerror-index-must-be-monotonic-increasing-or-decreasing-including-index-co/46893526#46893526

解决:

frame.reindex(index=['a','b','c','d'],columns=states).ffill()

上面写法能够达到与书中一样的结果。

相关文章
相关标签/搜索