Python Pandas读取修改excel操做攻略

时间 2019-12-05

标签 python pandas 读取修改 excel 攻略栏目 Python 繁體版

原文原文链接

环境:python 3.6.8html

以某米赛尔号举个例子吧:python

>>> pd.read_excel('1.xlsx', sheet_name='Sheet2')
     名字   等级 属性1   属性2  天赋
0  四九幻曦  100  天然  None  21
1  圣甲狂战  100  战斗  None   0
2  时空界皇  100   光    次元  27

咱们在这里使用了pd.read_excel()函数来读取excel，来看一下read_excel()这个方法的API，这里只截选一部分常常使用的参数:ide

pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None)

io:很明显, 是excel文件的路径+名字字符串

(有中文的话python2的老铁须要使用decode()来解码成unicode字符串)
例如:函数

>>> pd.read_excel('例子'.decode('utf-8))

sheet_name:返回指定的 sheet
若是将 sheet_name指定为 None，则返回全表
若是须要返回多个表, 能够将 sheet_name指定为一个列表, 例如['sheet1', 'sheet2']
能够根据sheet的名字字符串或索引来值指定所要选取的sheetui

>>> # 如:
>>> pd.read_excel('1.xlsx', sheet_name=0)
>>> pd.read_excel('1.xlsx', sheet_name='Sheet1')
>>> # 返回的是相同的 DataFrame

name:若是没有表头, 可用此参数传入列表作表头
header:指定数据表的表头,默认值为0, 即将第一行做为表头
index_col:用做行索引的列编号或者列名，若是给定一个序列则有多个行索引。通常能够设定 index_col=False指的是pandas不适用第一列做为行索引。
usecols：读取指定的列, 也能够经过名字或索引值spa

>>> # 如:
>>> pd.read_excel('1.xlsx', sheet_name=1, usecols=['等级', '属性1'])
>>> pd.read_excel('1.xlsx', sheet_name=1, usecols=[1,2])
>>> # 返回的是相同的 DataFrame

直到某一天泰格尔升了一级, 能够这样改一下, 固然用.iloc或.loc对象均可以excel

>>> # 读取文件
>>> data = pd.read_excel("1.xlsx", sheet_name="Sheet1")

>>> # 找到 等级 这一列，再在这一列中进行比较
>>> data['等级'][data['名字'] == '泰格尔'] += 1
>>> print(data)

LOOK！他升级了！！code

>>> data
     名字   等级 属性1   属性2  天赋
0  艾欧里娅  100  天然     冰  29
1   泰格尔   81   电    战斗  16
2  布鲁克克  100   水  None  28

如今咱们将它保存htm

data.to_excel('1.xlsx', sheet_name='Sheet1', index=False, header=True)

index:默认为 True, 是否加行索引, 直接上图吧！

左为 False, 右为 True

header:默认为 True, 是否加列标, 上图吧！

左为 False, 右为 True

而 io, sheet_name参数用法同函数 pd.read_excel()

若是咱们多捕捉几只或者多加几种属性怎么办呢？这里给出参考：对象

新增列数据：
data['列名称'] = [值1, 值2, ......]

>>> data['特性'] = ['瞬杀', 'None', '炎火']
>>> data
     名字   等级 属性1   属性2  天赋    特性
0  艾欧里娅  100  天然     冰  29    瞬杀
1   泰格尔   80   电    战斗  16  None
2  布鲁克克  100   水  None  28    炎火

新增行数据，这里行的num为excel中自动给行加的id数值
data.loc[行的num] = [值1，值2， ...], (注意与.iloc的区别)

>>> data.loc[3] = ['小火猴', 1, '火', 'None', 31, 'None']
>>> data
     名字   等级 属性1   属性2  天赋    特性
0  艾欧里娅  100  天然     冰  29    瞬杀
1   泰格尔   80   电    战斗  16  None
2  布鲁克克  100   水  None  28    炎火
3   小火猴    1   火  None  31  None

说完了增长一行或一列，那怎样删除一行或一列呢？可使用.drop()函数

>>> # 删除列, 须要指定axis为1，当删除行时，axis为0
>>> data = data.drop('属性1', axis=1) # 删除`属性1`列
>>> data
     名字   等级   属性2  天赋    特性
0  艾欧里娅  100     冰  29    瞬杀
1   泰格尔   80    战斗  16  None
2  布鲁克克  100  None  28    炎火
3   小火猴    1  None  31  None

>>> # 删除第3,4行，这里下表以0开始，而且标题行不算在类, axis用法同上
>>> data = data.drop([2, 3], axis=0)
>>> data
     名字   等级 属性2  天赋    特性
0  艾欧里娅  100   冰  29    瞬杀
1   泰格尔   80  战斗  16  None

>>> # 保存
>>> data.to_excel('2.xlsx', sheet_name='Sheet1', index=False, header=True)

你们具体能够参考官网提供的API:http://pandas.pydata.org/pand...