pandas入门01---Series

时间 2019-11-13

标签 pandas 入门 series 栏目应用数学繁體版

原文原文链接

为了入门pandas，须要熟悉两个经常使用的工具数据结构：Series和DataFrame。数组

今天主要讲解Series。数据结构

Series是可以保存任何类型的数据(整数，字符串，浮点数，Python对象等)的一维标记数组。轴标签统称为索引（index）。函数

最简单的Series能够仅仅由一个数组造成： obj = pd.Series([4,7,-5,3]) print(obj)工具

结果以下：code

索引在左边，值在右边。对象

因为咱们不为数据指定索引，因此默认生成的索引是从0到N-1。能够经过values属性和index属性分别得到Series对象的值和索引。blog

print(obj.values)
print(obj.index)

对应结果以下：索引

一般须要建立一个索引序列，用标签标识每一个数据点：字符串

obj2 = pd.Series([4, 7, -5, 3],index=['d','b','a','c'])
print(obj2)
print(obj2.index)

能够在数据中选择数据时使用标签来进行索引：pandas

print(obj2['a'])
print(obj2['d','c','a'])

也能够使用布尔值数组进行过滤，例如：

print(obj2[obj2 > 0])
print(np.exp(obj2))

若是已经有数据包含在Python字典中，能够使用字典生成一个Series:

sdata = {'Ohio':35000,'Texas':71000,'Oregon':16000,'Utah':5000}
obj3 = pd.Series(sdata)
print(obj3)
states = ['California','Ohio','Oregon','Texas']
obj4 = pd.Series(sdata,index=states)
print(obj4)

结果以下：

因为‘California’没有出如今sdata键中，它对应的值是NaN（Not a Number），这是pandas中标记缺失值或NA值的方式。

pandas用isnull和notnull函数来检查缺失数据。

pd.isnull(obj4)
pd.notnull(obj4)
# 也能够这样表示
obj4.isnull()
obj4.notnull()

Series对象自身和其索引都有name属性：

obj4.name='population'
obj4.index.name='state'

能够经过按位置赋值的方式改变索引：

obj.index=['Bob','Steve','Jeff','Ryan']
print(obj)

结果以下：

1. pandas入门
2. pandas入门【二】
3. pandas入门(六)
4. 5_2 Pandas入门
5. Pandas入门
6. pandas入门(八)
7. pandas入门(九)
8. pandas入门(四)
9. pandas入门(二)
10. Pandas库入门
更多相关文章...
• Memcached入门教程 - NoSQL教程
• Neo4j数据库入门教程 - NoSQL教程
• YAML 入门教程
• Java Agent入门实战（一）-Instrumentation介绍与使用