前言:python数据分析的基础知识,简单总结,主要是为了方便本身写的时候查看(大家可能看不太清楚T^T),发现有用的方法,随时补充,欢迎指正
数据分析专栏:python
一、matplotlib模块 pie(x,#绘图数据 labels=None,#添加标签 autopct='%.lf%%')#设置百分百格式 plt.show() 二、pandas模块 Series.plot(kind='pie'#选择画图类型 autopct='%.lf%%',#设置百分百格式 。。。 //用的时候查一查 )
一、matplotlib模块 垂直条形图: plt.bar(left,#x轴数据 height,#y轴数据 width=0.8,#条形图宽度 。。。 //用的时候查一查,多用天然就会了 ) 水平条形图: plt.barh(bottom=range(x.shape[0]#y轴的刻度 width=x.num,#指定y轴数值 tick_label=x.name,#指定y轴刻度标签 ) 堆叠条形图 +bottom参数便可 水平交错条形图 将刻度标签向右偏移便可 plt.xticks(np.arange(5)+0.2,names) 二、pandas模块 条形图: x.plot(kind='bar',#选择绘制的图的类型 width=0.8, ax=axes[0]#竖向 ax=axes[1]#横向 stacked=True#表示叠加值 ) 画交错图: df=pd.DataFrame(np.random.randint(5,10,size=(10,4)),columns=['a','b','c','d']) plt=df.plot(kind='bar') 三、seaborn模块这里不做过多介绍
一、matplotlib模块 plt.hist(x,#绘图数据 bins=10,#直方条形个数 ) 二、pandas模块 df.plot(kind='hist', bins=20,) //画核密度曲线 df.plot(kind='kde', color='red') 三、seaborn模块 sns.distplot(a,//数据 bins=10, hist=True, kde=True)
一、matplotlib模块 plt.boxplot(x,//数据 notch=None, ) 二、seaborn模块 绘制分组箱线图 sns.boxplot(x,y data=None,#数据 hue=None,#指定分组变量)
sns.violinplot(x,y,#x,y轴 hue,#指定分组变量 data=None#数据 )
一、matplotlib模块 plt.plot(x,y,#xy轴数据 label#标签 ) 二、pandas模块 data.plot(kind='line', style=['-','--',':']#画图格式 )
一、matplotlib模块 scatter(x,y,#数据 s=20#大小 ) 二、pandas模块 num.plot(x,y#标签 kind='scatter' title='name' ) 三、seaborn模块 sns.Implot(x,y,#数据标签 hue='name'#指定分组变量 data='data_name'#数据 )
改变散点图的s(大小)便可web
seaborn模块 sns.heatmap(data='df'#绘图数据 cmap='PuBuGn'#填充色 )