金融量化分析【day111】：Pandas-分组与聚合

时间 2019-11-07

原文原文链接

1、分组与聚合

在数据分析中，咱们有时须要将数据拆分，在每个特定的组里进行运算python

a = pd.read_csv('601318.csv')
a

　　数据以下：函数

实验数据

df.groupby('key1').mean()

分组：拆分数据为若干组spa

聚合：组内应用某个函数3d

df.groupby('key1').mean()

df.groupby(['key1','key2']).mean()

df.groupby(len).mean()

df.groupby(lambda x:len(x)).mean()

df.groupby(lambda x:'zheng' if df.loc[x,'data2']>0 else 'fu').mean()

df.groupby('key1').get_group('b')

分组以后须要聚合函数来应用到每一组中code

内置聚合函数blog

一、自定义聚合函数get

df.groupby('key1').agg(lambda x:x.max())

二、多个聚合函数数据分析

三、不一样列应用不一样聚合函数class

df.groupby('key1').agg({'data1':'min','data2':'max'})

df2 = df.copy()
df3 = df.copy()
pd.concat([df,df2,df3])

pd.concat([df,df2,df3],keys=list('abc'))

pd.concat([df,df2,df3],ignore_index=True)

pd.concat([df,df2,df3],axis=1)

pd.concat([df,df2,df3],axis=1,ignore_index=True)

pd.merge(df,df2)

pd.merge(df,df2,on='key1')

pd.merge(df,df2)

pd.merge(df,df2,on=['key1','key2'])