Python———pandas数据处理

 

pandas模块

更高级的数据分析工具
基于NumPy构建
包含Series和DataFrame两种数据结构,以及相应方法
调用方法:
from pandas import  Series, DataFrame
import pandas as pd
Series
又像数组又像字典:
有序
通常是同构的
元素采用NumPy中的数据类型
既以按键索引,又可以按序号索引
默认创建:
 
以字典形式创建

以常规形式创建

 

Series算术运算中按照键来对齐

NaN和数字做运算,得NaN

 

 

DataFrame

很像一个Excel表格
含有一组有序的列
列内(应该)同构,列之间可以是不同的数据类型
既有列索引,也有行索引
以二维结构保存数据(高维数据视作二维表格的叠加)
 

改名?增加列

 

按列读取、、按行读取

 按行、列索引

 

 丢弃指定行、列

 插入列

过滤

 

按索引排序