%matplotlib inline
import numpy as np
import pandas as pd
from scipy import stats,integrate
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(color_codes=True)
#生成高斯数据随机种子
np.random.seed(sum(map(ord,"distributions")))
1.简单的单变量数据特征绘图javascript
x=np.random.normal(size=100)
#画直方图bins自动分组
sns.distplot(x,kde=False)
在distplot()中改变bins的个数,将数据分红30组css
sns.distplot(x,bins=30,kde=False)
2.查看数据分布状况html
x=np.random.gamma(6,size=200)
sns.distplot(x,kde=False,fit=stats.gamma)#fit=stats.gamma是拟合统计的曲线
3.根据均值和协方差生成数据html5
mean,cov=[0,1],[(1,.5),(.5,1)]
data=np.random.multivariate_normal(mean,cov,200)
df=pd.DataFrame(data,columns=["x","y"])
df
4.观测两个变量之间的分布关系最好用散点图python
sns.jointplot(x="x",y="y",data=df)
5.数据量大时经过颜色深浅来判别每一个区域的密度jquery
x,y=np.random.multivariate_normal(mean,cov,2000).T
with sns.axes_style("white"):#指定风格
sns.jointplot(x=x,y=y,kind="hex",color="k")
sns.jointplot(x=x,y=y,kind="kde",color="k")
sns.jointplot(x=x,y=y,kind="reg",color="k")
5.用鸢尾花数据来绘制两个变量间的关系图linux
iris=sns.load_dataset("iris")
sns.pairplot(iris)