有幸参加了阿里云举办的天池龙珠计划Python训练营。收获颇多。python
天天记录一些本身以前的知识盲点,需常常温习。阿里云
1、从0完成一个数据分析实战rest
一、今天是一个数据分析的小项目,学到最多的就是关于数据可视化这一部份内容。code
# 查看各代口袋妖怪的数量 df['generation'].value_counts().sort_values(ascending=False).plot.bar()
# 查看每一个系口袋妖怪的数量 df['type1'].value_counts().sort_values(ascending=True).plot.barh()
# 相关性热力图分析 plt.subplots(figsize=(20,15)) ax = plt.axes() ax.set_title("Correlation Heatmap") corr = df.corr() sns.heatmap(corr, xticklabels=corr.columns.values, yticklabels=corr.columns.values)
interested = ['hp', 'attack', 'defense', 'sp_attack', 'sp_defense', 'speed'] sns.pairplot(df[interested])
plt.subplots(figsize=(10,8)) ax = plt.axes() ax.set_title('Correlation Heatmap') corr = df[interested].corr() sns.heatmap(corr, xticklabels=corr.columns.values, yticklabels=corr.columns.values, annot=True, fmt='f', cmap='YlGnBu')
total_stats = df.total_stats plt.hist(total_stats,bins=35) plt.xlabel('total_stats') plt.ylabel('Frequency')
plt.subplots(figsize=(20,12)) ax = sns.violinplot(x='type1', y='total_stats', data=df, palette='muted')
sns.jointplot('base_egg_steps', 'experience_growth', data=df, size=5, ratio=3, color='g')
sns.jointplot('attack', 'hp', data=df, kind='kde')
plt.subplots(figsize=(10, 10)) sns.heatmap( df[df['type2']!='None'].groupby(['type1', 'type2']).size().unstack(), linewidth=1, annot=True, cmap='Blues' )