[Python学习笔记(二)] Pandas库基础学习——02

1六、DataFrame.sort_values( columns , inplace = True , ascending = False)app

　　以columns的value为基础对DataFrame排序;函数

　　若inplace为True，则用排序后的结果替换原来的数值，若为False，则仅仅返回排序后的结果，不对原 DataFrame 产生影响;排序

　　ascending 默认为 True ，升序排列，能够指定为 False ，降序排列。索引

1七、 pandas.isnull(DataFrame)pandas

　　返回一个 DataFrame ，原 DataFrame中为 null 值的位置的值为 True ，不为 null 值的位置的值为 False 。table

1八、 DataFrame.fillna( value , inplace = False )class

　　返回一个 DataFrame ，用 value 值替换原 DataFrame 中的 nan 值；基础

　　inplace 为 True 时替换原 DataFrame 的值，为 False 时仅仅返回排序后的结果，不对原 DataFrame 产生影响。搜索

1九、当 DataFrame 中有 nan 值时，对其所做计算获得的都会是 nan 值。方法

20、当 DataFrame 中有 nan 值时，两种方法对数据作处理：

　　1）经过 pandas.isnull() 函数获得反应 nan 值位置的 DataFrame ，将其中为 True 的值做为索引传入原 DataFrame 获得全部不为 null 值的数据；

　　2）经过 DataFrame.fillna() 函数将 nan 值替换为中值或平均值（平均值还不是得算，中值还不是得找，应该是用在其余列的数据颇有用的状况下）

　　写到这，看起来，这两种方法大概会结合起来使用。

2一、 DataFrame[columns].mean() 求 columns 列的均值，自带去 nan 的功能。

2二、 DataFrame.pivot_table( index = column1 , values = column2 , aggfunc = np.mean ) 数据透视表

　　index 告诉函数 group by 哪一个列

　　values 告诉函数咱们想要计算哪一列

　　aggfuc 告诉函数咱们想要作什么计算（默认为 mean() ）。

2三、 DataFrame.dropna( axis = 1 ,subset = [ column1 , column2 ])

　　axis 为 1 时，将有 nan 值的列删除，

　　axis 为 0 时，将有 nan 值的行删除， subset 设置搜索范围。

2四、 DataFrame.loc[ RowNumber , ColumnName ]

　　返回指定列指定行的值。

2五、 DataFrame.reset_index( drop = True)

　　在排序后用来重建索引， drop 与 inplace 相似。

2六、DataFrame.loc[ 0 : 10 ] 与 DataFrame[ 0 : 10 ] 等价

2七、 DataFrame.apply( MethonName , axis = 0 )

　　将 DataFrame 的每一列（ axis = 0 时）或者每一行（ axis = 1 时）传入函数中，获得计算结果， axis 默认为 0 ；

　　能够这样理解，当 axis = 0 时，是对一列中的每行的值作操做，当 axis = 1 时，是对一行中的每列的值作操做，因此仍是 axis = 0 对应行， axis =1 对应列。

2八、DataFrame 由 Series 构成，每一行每一列都是一个 Series ，Series.value 为 ndarray 格式，也就是说列名做为 key ， ndarray 做为 value 构成了一个 Series。

2九、 Series 的索引性质与 DataFrame 一致。