1六、DataFrame.sort_values( columns , inplace = True , ascending = False)app
以columns的value为基础对DataFrame排序;函数
若inplace为True,则用排序后的结果替换原来的数值,若为False,则仅仅返回排序后的结果,不对原 DataFrame 产生影响;排序
ascending 默认为 True ,升序排列,能够指定为 False ,降序排列。索引
1七、 pandas.isnull(DataFrame)pandas
返回一个 DataFrame ,原 DataFrame中为 null 值的位置的值为 True ,不为 null 值的位置的值为 False 。table
1八、 DataFrame.fillna( value , inplace = False )class
返回一个 DataFrame , 用 value 值替换原 DataFrame 中的 nan 值;基础
inplace 为 True 时替换原 DataFrame 的值,为 False 时仅仅返回排序后的结果,不对原 DataFrame 产生影响。搜索
1九、当 DataFrame 中有 nan 值时,对其所做计算获得的都会是 nan 值。方法
20、当 DataFrame 中有 nan 值时,两种方法对数据作处理:
1)经过 pandas.isnull() 函数获得反应 nan 值位置的 DataFrame ,将其中为 True 的值做为索引传入原 DataFrame 获得全部不为 null 值的数据;
2)经过 DataFrame.fillna() 函数将 nan 值替换为中值或平均值(平均值还不是得算,中值还不是得找,应该是用在其余列的数据颇有用的状况下)
写到这,看起来,这两种方法大概会结合起来使用。
2一、 DataFrame[columns].mean() 求 columns 列的均值,自带去 nan 的功能。
2二、 DataFrame.pivot_table( index = column1 , values = column2 , aggfunc = np.mean ) 数据透视表
index 告诉函数 group by 哪一个列
values 告诉函数咱们想要计算哪一列
aggfuc 告诉函数咱们想要作什么计算(默认为 mean() )。
2三、 DataFrame.dropna( axis = 1 ,subset = [ column1 , column2 ])
axis 为 1 时,将有 nan 值的列删除,
axis 为 0 时,将有 nan 值的行删除, subset 设置搜索范围。
2四、 DataFrame.loc[ RowNumber , ColumnName ]
返回指定列指定行的值。
2五、 DataFrame.reset_index( drop = True)
在排序后用来重建索引, drop 与 inplace 相似。
2六、DataFrame.loc[ 0 : 10 ] 与 DataFrame[ 0 : 10 ] 等价
2七、 DataFrame.apply( MethonName , axis = 0 )
将 DataFrame 的每一列( axis = 0 时)或者每一行( axis = 1 时)传入函数中,获得计算结果, axis 默认为 0 ;
能够这样理解,当 axis = 0 时,是对一列中的每行的值作操做,当 axis = 1 时,是对一行中的每列的值作操做,因此仍是 axis = 0 对应行, axis =1 对应列。
2八、DataFrame 由 Series 构成,每一行每一列都是一个 Series ,Series.value 为 ndarray 格式,也就是说列名做为 key , ndarray 做为 value 构成了一个 Series。
2九、 Series 的索引性质与 DataFrame 一致。