[Python学习笔记(二)] Pandas库基础学习——02

1六、DataFrame.sort_values( columns , inplace = True , ascending = False)app

  以columns的value为基础对DataFrame排序;函数

  若inplace为True,则用排序后的结果替换原来的数值,若为False,则仅仅返回排序后的结果,不对原 DataFrame 产生影响;排序

  ascending 默认为 True ,升序排列,能够指定为 False ,降序排列。索引

1七、 pandas.isnull(DataFrame)pandas

  返回一个 DataFrame ,原 DataFrame中为 null 值的位置的值为 True ,不为 null 值的位置的值为 False 。table

1八、 DataFrame.fillna( value , inplace = False )class

  返回一个 DataFrame , 用 value 值替换原 DataFrame 中的 nan 值;基础

  inplace 为 True 时替换原 DataFrame 的值,为 False 时仅仅返回排序后的结果,不对原 DataFrame 产生影响。搜索

1九、当 DataFrame 中有 nan 值时,对其所做计算获得的都会是 nan 值。方法

20、当 DataFrame 中有 nan 值时,两种方法对数据作处理:

  1)经过 pandas.isnull() 函数获得反应 nan 值位置的 DataFrame ,将其中为 True 的值做为索引传入原 DataFrame 获得全部不为 null 值的数据;

  2)经过 DataFrame.fillna() 函数将 nan 值替换为中值或平均值(平均值还不是得算,中值还不是得找,应该是用在其余列的数据颇有用的状况下)

  写到这,看起来,这两种方法大概会结合起来使用。

2一、 DataFrame[columns].mean() 求 columns 列的均值,自带去 nan 的功能。

2二、 DataFrame.pivot_table( index = column1 , values = column2 , aggfunc = np.mean )   数据透视表

  index 告诉函数 group by 哪一个列

  values 告诉函数咱们想要计算哪一列

  aggfuc 告诉函数咱们想要作什么计算(默认为 mean() )。

2三、 DataFrame.dropna( axis = 1 ,subset = [ column1 , column2 ])

  axis 为 1 时,将有 nan 值的列删除,

  axis 为 0 时,将有 nan 值的行删除, subset 设置搜索范围。

2四、 DataFrame.loc[ RowNumber , ColumnName ]

  返回指定列指定行的值。

2五、 DataFrame.reset_index( drop = True)

  在排序后用来重建索引, drop 与 inplace 相似。

2六、DataFrame.loc[ 0 : 10 ] 与 DataFrame[ 0 : 10 ] 等价

2七、 DataFrame.apply( MethonName , axis = 0 )

  将 DataFrame 的每一列( axis = 0 时)或者每一行( axis = 1 时)传入函数中,获得计算结果, axis 默认为 0 ;

  能够这样理解,当 axis = 0 时,是对一列中的每行的值作操做,当 axis = 1 时,是对一行中的每列的值作操做,因此仍是 axis = 0 对应行, axis =1 对应列。

2八、DataFrame 由 Series 构成,每一行每一列都是一个 Series ,Series.value 为 ndarray 格式,也就是说列名做为 key , ndarray 做为 value 构成了一个 Series。

2九、 Series 的索引性质与 DataFrame 一致。

相关文章
相关标签/搜索