Python数据分析matplotlib可视化之绘图

Matplotlib是一个基于python的2D画图库,可以用python脚本方便的画出折线图,直方图,功率谱图,散点图等经常使用图表,并且语法简单。python

Python中经过matplotlib模块的pyplot子库来完成绘图。Matplotlib可用于建立高质量的图表和图形,也能够用于绘制和可视化结果。matplotlib是Python优秀的数据可视化第三方库,matplotlb.pyplot是绘制种类可视化图形的命令子库,至关于快捷方式 import matplotlib.pyplot as plt.数组

一、线形图dom

线性图是最基本的图表类型,经常使用于绘制连续的数据。经过绘制线形图,能够表现出数据的一种趋势变化。函数

Matplotlib的plot(X,Y)用来绘制线形图,在参数中传入X和Y的坐标便可。其中,X和Y轴坐标的数据格式能够是列表、数组和Series.工具

例1:坐标数据格式为series字体

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
data={'name':['Tom','Peter','Lucy','Max'],
 'sex':['female','female','male','male'],
 'math':[78,79,83,92],
 'city':['北京','上海','广州','北京']
 }
df=pd.DataFrame(data)
print(df)
 #DataFrame数据的行索引做为X轴,math列索引做为Y轴
plt.plot(df.index,df['math'],color='red',linestyle='-',linewidth=3,marker='D')
 #经过plot函数的color参数能够指定线条的颜色

linestyle参数能够指定线条的形状,spa

linewidth参数可指定线条的宽度,code

marker参数可对坐标点进行标记(默认状况下,坐标点是没有标记的),orm

结果:
 name sex math city #建立一个DataFrame数据
0 Tom female 78 北京
1 Peter female 79 上海
2 Lucy male 83 广州
3 Max male 92 北京
,

注意: 颜色设置要放在线条和点的样式的前面 ,颜色、线条和点的样式能够放置于格式字符串。对象

如:plt.plot(df.index,df[‘math’],‘co-’)
运行结果以下:
在这里插入图片描述
2. 柱状图

2.1 绘制柱状图主要是使用matplotlib的 bar函数 :

bar函数的color参数能够设置柱状图的填充颜色,

alpha参数能够设置透明度,

例如:

import matplotlib.pyplot as plt
data=[23,85,72,43,52]
plt.bar([1,2,3,4,5],data,color='royalblue',alpha=0.7)

运行结果:
在这里插入图片描述
bottom参数用于设置柱状图的高度,以此绘制堆积柱状图;

width参数 用于设置柱状图的宽度, 以此能够绘制并列柱状图 。

grid函数用于绘制格网,经过对参数的个性化设置,能够绘制出个性的格网

例如:

import numpy as np
 import matplotlib.pyplot as plt
 data1=[23,85,72,43,52]
 data2=[42,35,21,16,9]
 width=0.3
 plt.bar(np.arange(len(data1)),data1,color='royalblue',alpha=0.7,width=width)
 plt.bar(np.arange(len(data2))+width,data2,color='green',alpha=0.7,width=width)
 plt.grid(color='black',linstyle='--',linewidth=3,axis='y',alpha=0.6)

运行结果:
在这里插入图片描述

Bar函数的经过barh函数能够绘制水平柱状图

import numpy as np
 import matplotlib.pyplot as plt
 data1=[23,85,72,43,52]
 plt.barh(np.arange(len(data1)),data1,color='green',alpha=0.5)

如图所示:
在这里插入图片描述

2.2 刻度与标签:

现实中的柱状图的X轴是有刻度标签的,上述实例中未设置。在matplotlib中,

经过 xticks函数 设置图标的X轴的刻度和刻度标签, yticks函数 设置y轴的刻度和标签。

经过xlabel 和 ylabel 方法给X轴和Y轴添加标签,

经过title方法为图表添加标题

例如:

import numpy as np
 import matplotlib.pyplot as plt
 data1=[23,85,72,43,52]
 labels=['A','B','C','D','E']
 plt.xticks(range(len(data1)),labels) #设置刻度和标签
 plt.xlabel('Class') #plt.xlabel、ylabel、title方法分别给X轴和Y轴,图标题添加标签。
 plt.ylabel('Amounts')
 plt.title('Example')
 #plt.bar(range(len(data1)),data)
 plt.bar(np.arange(len(data1)),data1,color='royalblue',alpha=0.7)
 plt.grid(color='black',linstyle='--',linewidth=3,axis='y',alpha=0.6)

运行结果:
在这里插入图片描述

图例是标识图表元素的重要工具, 在bar函数中传入label参数表示图例名称,经过legend函数便可绘制出图例。

data1=[23,85,72,43,52]
data2=[42,35,21,16,9]
width=0.3
plt.bar(np.arange(len(data1)),data1,width=width,label='one')
plt.bar(np.arange(len(data2))+width,data2,width=width,label='two')
plt.legend()

结果以下:
在这里插入图片描述
2.4 文本注解:

例如:在柱状图中加入文本数字,能够很清楚的知道每一个类别的数量。经过text函数能够在指定的坐标(x,y)上加入文本注释

data=[23,85,72,43,52]
labels=['A','B','C','D','E']
plt.xticks(range(len(data)),labels) #设置刻度和标签
plt.xlabel('Class') 
plt.ylabel('Amounts')
plt.title('Example')
plt.bar(range(len(data)),data)
for x,y in zip(range(len(data)),data):
plt.text(x,y,y,ha='center',va='bottom') #文本注解 # 第一个参数是x轴坐标
 # 第二个参数是y轴坐标
 # 第三个参数是要显式的内容

在这里插入图片描述
3.散点图:

Matpltlib中 scatter函数能够用来绘制散点图,传入X和Y轴坐标。Scatter(X,Y)

利用Numpy建立一组随机数

import numpy as np
import matplotlib.pyplot as plt
X=np.random.randn(100)
Y=np.random.randn(100)
plt.scatter(X,Y,color='red',marker='D')

散点图:
在这里插入图片描述
4. 直方图

matplotlib的 hist()函数 用来绘制直方图。

直方图与条形图的区别:

直方图是用面积表示各频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,所以其宽度与高度均有意义;

条形图(柱状图)是用条形的长度表示各种频数的多少,其宽度是固定的。

因为分组数据具备连续性,直方图的各矩形一般是连续排列,而条形图是分开排列;条形图主要是用于展现分类数据,而直方图则主要用于展现数据型数据。

x=np.random.normal(size=100)
plt.hist(x,bins=30)

在这里插入图片描述
5. 自定义设置

Matplotlib的图像位于Figure对象中,实际上就是建立了一个空的图像窗口。可经过figure函数能够建立一个新的Figure,用于绘制图表

fig=plt.figure(figsize=(10,6)) #figsize参数能够设置图表(整个图)的长宽比

ax1=fig.add_subplot(2,2,1) #不能经过空figure绘图,必须用add_subplot()建立一个或者多个子subplot绘图区才能绘图

意思是:绘制2*2两行两列共4个子subplot图像

ax2=fig.add_subplot(2,2,2) # 在建立Figure对象过程当中,经过add_subplot函数建立子图,用于绘制图形

ax3=fig.add_subplot(2,2,3)

years=[1950,1960,1970,1980,1990,2000,2010]

gdp=[300.2,543.3,1075.9,2862.5,5979.6,10289.7,14958.3]

ax1.scatter(years,gdp) #选用不一样的ax变量,则能够在对应的subplot子图中绘图(散点图、线形图、柱状图)

ax2.plot(years,gdp)

ax3.bar(years,gdp)
在这里插入图片描述
plt.subplots能够轻松的建立子图,而axes的索引类型相似于二维数组,这样就能够对指定的子图进行绘制。Subplot函数中有3个参数:垂直绘图的数量、水平绘图的数量以及表示绘图位置的索引(基于行进行计算)

fig,axes=plt.subplots(2,2,figsize=(10,6)) 
axes[1,0].plot(years,gdp)
axes[0,0].scatter(years,gdp)
axes[0,1].bar(years,gdp)
axes[1,1].hist(years,gdp)

在这里插入图片描述
注意:当没有设置figsize时,建立多子图会显得拥挤。经过 plt…subplot_adjust方法能够设置子图的间距修改子图之间的间距(增长额外的空间以调整两个子图之间的距离)

subplots__adjust(left=None,bottom=None,right=None,top=None,wspace=None,hspace=None) ,其中前4个参数用于设置subplot子图的外围边距,wspace和hapace参数设置用于设置subplot子图间的边距。

fig,axes=plt.subplots(2,2) #未设置figsize时,默认状况下,各sudplot子图间都会留有必定的间距。
在这里插入图片描述

years=[1950,1960,1970,1980,1990,2000,2010]
gdp=[300.2,543.3,1075.9,2862.5,5979.6,10289.7,14958.3]
fig,axes=plt.subplots(2,2)
plt.subplots_adjust(wspace=0.3,hspace=0.3)
axes[1,0].plot(years,gdp)
axes[0,0].scatter(years,gdp)
axes[0,1].bar(years,gdp)
axes[1,1].hist(years,gdp)

在这里插入图片描述
6. 样式与字体:

Matplotlib自带了一些样式供用户使用,如 经常使用的ggplot样式,经过 plt.style.use(‘ggplot’) 函数便可调用该样式绘图。 **

Matplotlib默认为英文字体,若是绘制中出现汉字就会乱码,所以须要指定matplotlib的默认字体,这样就能够解决乱码的问题,

plt.rcParams[‘font.sans-serif’]=[‘simhei’] #指定默认字体

plt.rcParams[‘axes.unicode_minus’]=False #解决保存图像时负号‘-’显示为方块的问题
在这里插入图片描述

相关文章
相关标签/搜索