panda核心数据结构

Series

Series是一维带标签的数组,数组里能够听任意的数据(整数、浮点数、字符串、python Object)等等python

建立函数:sql

  (1)s = pd.Series(data,index=index),其中index是一个列表,用来做为数据的标签,若是不指定索引,pandas自动分配整形的索引数据库

  (2)字典建立  s = pd.Series(dict,index = list('abcd')),建立的series对象的索引为字典的key 数组

性质

Series对象的性质:数据结构

  类ndarray对象函数

  类dict对象spa

  标签对齐操做3d

  结论一:series对象能够直接使用ndarray对象方法

 

 

  结论二:series对象能够像python字典对象同样操做

 

  结论三:标签对齐,进行操做时,索引自动对应作处理,若是找不到对应值,则为NaN对象

DateFrame

  DateFrame是二维带行标签和列标签的数组,能够把DateFrame想象成一个Excel表格或一个sql数据库的表格,还能够想象成一个series对象字典,它是pandas里最经常使用的数据结构blog

建立DateFrame对象

df = pd.DateFrame(data,index = index,columns = columns)    其中index是行标签,columns是列标签,data能够是下面的数据结构:

  (1)由一维numpy数组,list,Series构成的字典

  (2)二维numpy数组

  (3)另外的DateFrame对象

字典方式建立:

(1)Series对象构成的字典方式建立:

  (2)列表构成的字典方式建立

  注意:由series对象构成的字典,series元素能够不相等,但列表构成的字典,列表元素必须相等,否则会报错

列表建立

  (1)列表中元素由元组构成

  

  (2)列表中元素由字典构成

 

 从Series建立DataFrame

  注意:series为一维数组,故列索引只能有一列,否则会报错

性质

  先建立一个数组

 (1)查找

 

(2)赋值

(3)删除操做

(4)添加

(5)指定删除并获取结果

(6)指定位置插入

(7)assign在原来对象基础上作操做但不会改变原对象数据结构

Panel

Panel是三维带标签的数组,Pancel比较少用,但依然是最重要的基础数据结构之一.

Panel有三个标签:

  items:坐标轴 0,索引对应的元素是一个DataFrame

  magor_axis:坐标轴1,DataFrame里的行标签

  minor_axis:坐标轴 2,DataFrame里的列标签

建立方式:

  查看各维度索引

转换为DataFrame对象

相关文章
相关标签/搜索