pandas库学习笔记(一)Series入门学习

Pandas基本介绍:python

pandas is an open source, BSD-licensed (permissive free software licenses) library providing high-performance, easy-to-use data structures and data analysis tools for the Python programming language.数组

 

咱们快速简单地看一下pandas中的基本数据结构,先从数据类型、索引、切片等简单操做开始。首先导入必要的域名空间:数据结构

 
 

咱们首先简单介绍一下数据结构:函数

Series 是一个一维数组结构的,能够存入任一一种python的数据类型(integers, strings, floating point numbers, Python objects, etc.)。最建立一个Series的最基本方法是:scala

>>> s = pd.Series(data, index=index)

这里,data指代许多不一样的数据类型:orm

  • a Python dict
  • an ndarray
  • a scalar value (like 5)

index指代一个标签轴链表(list),所以,根据data的数据类型不一样,咱们能够大体有以下方式新建Series:blog

一、  from ndarray索引

若是data是ndarray类型,那么index的长度必须与data同样。若是index值缺省,整数链表[0,1,2,…,len(data)-1]将会被自动初始化为index。ip

 

 

二、  from dictget

若是data是字典结构,index默认为字典中的key值。若是在建立时index被从新赋值,那么value将会与新建的index对应,若是index值不在字典的key值中,那么value将会被初始化为NaN。

 

 

注:NaN不是一个值,在pandas中表明缺省值。

 

三、  from scalar value

若是data是一个标量,index值必须被初始化,value值将会重复对应到每个index。

 

 

Series与ndarray相似

Series的操做与ndarray很是相似,可是Series能够应用numpy中的大多数函数,例如切片操做。

 

 

Series与dict相似

Series像一个固定大小的dict,能够经过index赋值或者取值。

 

Series矢量操做以及标签对齐运算

在数据分析时,numpy无需进行循环便可对每个值进行同等操做,Series也能够经过调用numpy中的函数达到预期运算结果。

 

相关文章
相关标签/搜索