Pandas所能知足的需求:数据库
具有按轴自动或显式数据对齐功能的数据结构。这能够防止许多因为数据未对齐以及来自不一样数据源(索引方式不一样)的数据而致使的常见错误。数组
集成时间序列功能数据结构
既能处理时间序列数据也能处理非时间序列的数据code
数据运算和约简(好比对某个轴求和)能够根据不一样的元数据(轴)编号执行。对象
灵活处理缺失数据索引
合并及其余出如今常见数据库中的关系型运算pandas
Series是一种相似一维数组的对象,它由一组数据(各类Numpy数据类型)以及一组与之相关的数据标签(即索引)组成class
Series的组成要素为两点:1.一组数据 2.与之对应的索引
建立:Series([data],index=[index])数据类型
"Data能够是列表(省略index)" obj = Series([3,4,-5,6]) "经过Python字典建立:键值自动做为索引" sdata = {'a':3,'b':4,'c':-5,'d':6} obj = Series(sdata) "自定义索引" obj = Series([3,4,-5,6],index=['a','b','c','d'])
应用:Series的方法方法
"经过索引选取单个值" In [7]: obj['a'] Out[7]: 3 "经过索引选取一组值" In [8]: obj[['a','c','d']] Out[8]: a 3 c -5 d 6 "数据组运算(Series能够看做一维数组),保留索引和值之间的连接" obj[obj > 0] obj[obj*2] np.exp(obj2)
"还能够将Series看成一个定长的有序字典" In [9]: "b" in obj Out[9]: True In [10]: "e" in obj Out[10]: False "Series实例方法" In [10]: obj.isnull() #检测缺失数据 "Series的索引能够经过赋值的方式就地修改" In [11]: obj.index = ['Bob','Steve','Jeff','Ryan'] Out[12]: Bob 3 Steve 4 Jeff -5 Ryan 6 dtype: int64