Pandas.DataFrame的使用

时间 2019-11-24

标签 pandas.dataframe pandas dataframe 使用栏目 Spark 繁體版

原文原文链接

导入文件

import numpy as np
import pandas as pd
odata = pd.read_csv('example.csv')`复制代码

这三行代码就能够实现csv文件的导入，注意文件的路径python

删除行

Data1 = data.drop([16,17])复制代码

这句代码的意思是删除文件中的第16和17行，而且，后面第18和19并不会自动补到16和17的位置上去，行号从15之后就直接跳到18了安全

.drop()方法若是不设置参数inplace=True，则只能在生成的新数据块中实现删除效果，而不能删除原有数据块的相应行。也就是inplace属性能够对原来的数据进行删除操做
Inplace = True用法：bash

odata.drop(odata.index[[16,17]],inplace=True)复制代码

咱们要注意到用与不用inplace的区别，不用inplace的时候，咱们使用另一个变量Data1来暂时保存处理后的数据，而使用inplace的时候，咱们直接调用一个函数对原来的数据进行操做。值得注意的是，inplace属性并不会修改原来的文件，因此是安全的。也就是虽然直接对原来数据删除，但并不会删除到文件，只会在内存里操做原来变量。函数

删除列

del data['date']复制代码

代码如上所示，直接删除，注意这个del的方括号里只可以有一个参数。一次只能删除一列。ui

.pop()方法

.pop方法能够将所选列从原数据块中弹出，原数据块再也不保留该列，google

Data1=data.pop(‘latitude’)复制代码

.pop方法将单独的数据取出来，在咱们想要对某一块数据很感兴趣的时候很是实用。spa

.split()的使用

简单的Python的字符串分割

咱们在数据预处理的时候不少时候要对一串带有各类符号的数据进行处理。可是实际运行时咱们要将它们分开处理，因此须要用到python带的split函数来处理code

str = ('www.google.com')
print str
str_split = str.split('.')
print str_split复制代码

这样运行出来的结果是内存

www.google.com
[‘www’,‘google’,‘com’]复制代码

若是咱们想要设置分割的个数，就在split里面添加参数：字符串

str_split = str.split(‘.’,1)复制代码

这样得出的结果是：

www.google.com
[‘www’,’google.com’]复制代码

也就是只分割了第一个字符，第二个就没有分割了。
对于split函数，字符串和字符是同样的，好比咱们想要的数据被字符串“||”隔开，咱们要想分割也是一样写法：

str = ('WinXP||Win7||Win8||Win8.1')
print str
str_split = str.split('||')
print str_split复制代码

获得(注意是单引号，不由于是字符串而换成双引号)

[‘WinXP’,’Win7’,’Win8’,’Win8.1’]复制代码

Re模块的使用

咱们在处理实际数据的时候，每每须要根据多种分隔符来分割，好比对于'Beautiful, is; better*than\nugly'这样的字符串来讲，咱们要将其分割成独立的单词，仅仅用split就没法作到，由于split函数运行一次以后将数据转为list类型，split函数不能处理list数据，因此不能运行两次split。而且split函数并不能设置多个参数，因此python内置的re模块帮咱们解决这个问题。具体使用以下

Import re
a='Beautiful, is; better*than\nugly'
x= re.split('[,|; |\*|\n]',a)
print(x)复制代码

获得结果是：

[‘Beautiful’,’is’,’better’,’than’,’nugly’]复制代码