Python数据处理库pandas基本使用

时间 2019-11-21

标签 python 数据处理 pandas 基本使用栏目 Python 繁體版

原文原文链接

---恢复内容开始---函数

　　pandas提供过便于操做数据的数据类型，也提供了许多分析函数和分析工具，使得数据分析易于操做。工具

1、pandas库中Series类型对象

　　Series能够生成数据的索引（自动索引和自定义索引），见下例：blog

Series可从标量（必须有index）、字典（直接应用Series函数）、ndarray、列表构建。索引

　　基本操做：相似于ndarray和字典类型。能够用自定义索引b['b']=7, 也能够用自动生成的自动索引b[1]=7，但注意不可混合使用。如get

b[['c', 'd', 0]]输出的第三个元素为NaN ，其切片和运算操做与ndarray基本相同，见下例：数据分析

　in 在列表或ndarray类型中表示某值是否在列表或ndarray中，而对于Series类型是判断是否在对象的索引列表中。pandas

　b.get('f', 100) 返回索引值'f'对应的值，若没有则返回100 。数据类型

　两个Series类型a+b相加，获得Series类型c，则c的索引值为a和b索引值的并，c的值分为两种状况，若索引值在a和b中都存在，则对应值相加；不然（只存在于a和b中的一个），对应值为空。im

　能够给Series对象起名字，如b.name='匹配'。

2、Pandas库的DataFrame类型

　　由索引和多列数据构成，能够理解为一个表格。其每列值的类型能够不一样，且既有行索引也有列索引，经常使用于表达二维数据。

可由二维ndarray对象、一维列表等、Series类型、其余DataFrame类型建立。见下例：

　对于字典dl={'one':[1,2,3], 'two':[9,8,7]} 也可直接用pd.DataFrame(dt,index=['a', 'b', 'c', 'd'])来建立。

　若要得到某个位置的数据，须要用到行列的联合索引，如d['a']['one']=1.0

　d['one']可得到one对应的一列对象，包括行索引值。

　d.ix['a']可得到a对应的一行对象，包括列索引值。

---恢复内容结束---