浅谈python的第三方库——pandas(一)

pandas做为python进行数据分析的经常使用第三方库,它是基于numpy建立的,使得运用numpy的程序也能更好地使用pandas。python

##1 pandas数据结构数组

###1.1 Series 注:因为pandas与numpy关系密切,因此在代码中常常将两者一同导入使用。数据结构

上图中,先利用numpy建立一个一维数组,再利用pandas的内置方法将其转换为pandas的序列类型Series。能够看到,pandas会自动将原有数据转换成一列,并添加行的索引。3d

###1.2 DataFrame pandas的第二种也是最具表明性的数据结构就是DataFrame。blog

显然,DataFrame就是矩阵类型的数据,只不过pandas中会给矩阵添加行列索引,以便使用与查找元素。索引

##2 建立DataFrame 因为Series能够视为DataFrame的一种简单状况,因此后面将主要介绍DataFrame,关于Series的状况能够类比过去。 从前一小节能够看到,pandas的数据能够经过运用内置方法转换numpy建立的数据获得,但也能够直接在pandas库内建立DataFrame。数据分析

建立DataFrame时,能够手动给数据添加行列名,不然pandas会自动添加形如“0,1,2,3”的行列名。 因为pandas基于numpy制做,因此numpy中的一些经常使用方法能够直接移植过来。pandas

pandas中也有shape方法查看矩阵大小。程序

##3 查找DataFrame的元素numpy

由于pandas中的矩阵容许自定义行列名,因此定位其中的元素分为以下几种方式:使用行列名称,使用行列位置,名称位置混合。

###3.1 行列名称定位

###3.2 行列位置定位

###3.3 名称位置混合定位

通常经常使用的仍是前两种定位手段,混合定位了解便可。

小结:做为pandas系列的开篇,本文就介绍到此,沿用numpy系列的模式,后面的博文将介绍pandas中关于DataFrame的经常使用方法。

相关文章
相关标签/搜索