按照pandas官网上10 Minutes to pandas的快速练习:数组
一 .对象建立:dom
导入练习所须要的工具包:函数
经过列表中的值建立序列Series,pandas在建立序列的同时会默认为列表中值建立索引:(np.nan 为空值)工具
经过NumPy数组建立DataFrame,同时默认建立时间索引和行标签:(spa
np.random.randn(6,4) 介绍:从正太分布中返回一个或多个样本值 ,例子中表示返回6行4列的随机数,不必定在(0,1]之间3d
np.random.rand(6,4)介绍:从(0,1]之间,产生6行4列的嵌套数组)code
经过将字典转化为相似序列Series的形式,建立DataFrame:对象
(pd.Categorical()函数:blog
pandas.
Categorical
(values,categories = None,ordered = None,dtype = None,fastpath = False )排序
values:像列表同样,categories:类别,能够定义类别,ordered:是否有序,dtype:categ的类型)
DataFrame每一列的数据类型:
使用<tab>可自动补全列名,并获取指定列的值:
二.查看数据
查看frame的头部和底部的数据:
显示DataFrame的索引,列标题和值:
DataFram的函数describe(),快速分析汇总数据:
汇总指标:count:记数,mean:平均值,std:标准差,min:最小值,max:最大值
对DataFrame中的数据进行行列转换:
按轴进行排序:(说明:axis=1,表示第一行,axis=0,表示第一列,降序排序)
按照值进行排序:
说明:按照'B'列,默认的升序进行排序)
三.获取数据
经过列名获取指定列名的列数据:
经过[],获取指定范围的切牌你数据:
经过标签获取数据:
经过标签得到截面数据:
获取多维截取数据:
获取标量数据:
说明:at()函数的定位速度优于loc:
经过位置获取数据: