[数据分析工具] Pandas 功能介绍(二)

条件过滤

咱们须要看第一季度的数据是怎样的,就须要使用条件过滤app

体感的温馨适湿度是40-70,咱们试着过滤出体感温馨湿度的数据函数

最后整合上面两种条件,在一季度体感湿度比较温馨的数据工具

列排序

数据按照某列进行排序spa

“by”参数可使用字符串,也能够是列表,ascending 的参数也能够是单个值或者列表3d

ascending 默认值是 Trueblog

列中的每行上的 apply 函数

在前一篇的增长列的部分,根据风速计算人体感受是否温馨,为了功能的演示,在这里使用 DataFrame 的 apply 方法,他会在指定列的每一个值上执行。详见代码:排序

均值和标准差

咱们经过 describe 方法查看的统计信息中均值和方差都是按照列统计呢,这里要说的,既能够按照列,还能够按照行索引

均值,行 df.mean(axis=0),列df.mean(axis=1)ip

方差,行 df.std(axis=0),列df.std(axis=1)字符串

DataFrame 转换为 Numpy

DataFrame 合并

链接合并

在两个 df 的结果一致的状况下,咱们能够简单两个 df 拼接起来

垂直(行)拼接,pd.concat([df1,df2],axis=0),水平(列)拼接,pd.concat([df1,df2],axis=1)

基于索引关键字合并

Pandas 还提供了像 SQL 同样的链接,内联,外联,左联,右联

做为咱们的示例数据,能够惟一标识一行的就是 Datatime 列

merged_df = df_1.merge(df_2, how='left', on='datetime')

在 DataFrame 中查找 NaN

每行有多少 NaN,df.isnull().sum()

Dataframe 中 NaN 的总数,上面统计出来的数量求和,df.isnull().sum().sum()

分组 Group By

分组在数据统计的时候常常使用。特别是统计数量、计算和、求平均值,等等。

咱们在这里统计一下每一个季度的假期数是多少

在统计一下,每一个季度的平均分风速是多少

定义范围

若是咱们想根据风力把风的等级区分出来,你可能可快就想到上面刚刚介绍的 apply,不过,如今介绍另一种方式

经过这两次的分享,咱们已经了解了 pandas 数据处理经常使用的方式方法。

文件内容简单说明:

文件地址:

 
相关文章
相关标签/搜索