工做中,你们常常会使用excel去处理数据以及展现,可是对于部分工做咱们能够借助程序帮忙实现,达到高效解决问题的效果,好比将接口返回的json解析并保存结果到excel中,按必定规律处理excel中的数据而后写入到新的excel文件中,汇总来自多个文件的内容到一个excel中,等等。 平时在工做中遇到比较繁琐的数据须要写入到excel中,除非excel的内置公式能够处理,我会第一时间想到使用python处理。在这个过程当中,研究并尝试了一些工具,闲着没事,我整理并记录下来。
XlsxWriter | xlrd&xlwt&xlutils | OpenPyXL | Microsoft Excel API | |
---|---|---|---|---|
介绍 | 能够建立和写Excel 2007+ XLSX文件 | xlrd、xlwt、xlutils三大模块分别提供读、写和其余功能 | 能够读、写Excel 2007+ /xlsm/xltx/xltm文件 | 直接经过COM组件与Microsoft Excel进程通讯调用各类功能实现对excel文件操做 |
读 | ✘ | √ | √ | √ |
写 | √ | √ | √ | √ |
修改 | ✘ | √ | ⚠️ | √ |
.xls | ✘ | √ | ✘ | √ |
.xlsx | √ |
|
√ | √ |
大文件 | √ | ✘ | √ | ✘ |
功能 | 强 | 弱 | 通常 | 超强 |
速度 | 快 | 快 | 快 | 超慢 |
|系统|无限制|无限制|无限制|Windows + excel|html
|使用场景|* 须要建立xlsx文件
* 不须要读取已有文件
* 须要实现比较复杂的功能
* 数据量可能会比较大
* 须要跨平台|* 须要读取xls或者xlsx文件
* 要生成xls文件
* 须要对文件处理的功能不太复杂
* 须要跨平台|* 须要处理xlsx文件
* 须要修改已有文件或者在写入过程当中不断修改
* 须要对文件处理的功能比较复杂
* 数据量可能会很大
* 须要跨平台|* 须要处理各类文件格式
* 须要用到特别复杂功能
* 在修改文件时不但愿对原有信息形成任何意外破坏
* 数据量很小,或者愿意等待
* 仅在Windows中使用|python
XlsxWriter是我最终选择的用于写操做的工具。顾名思义,它只能用来写文件。 这应该是个比较新的项目,在GitHub上看它最先的提交是在2013年1月份。
其官方文档中宣称它支持(See the full documentation at: https://xlsxwriter.readthedocs.io):json
1 import xlsxwriter 2 # Create an new Excel file and add a worksheet. 3 workbook = xlsxwriter.Workbook('demo.xlsx') 4 worksheet = workbook.add_worksheet() 5 # Widen the first column to make the text clearer. 6 worksheet.set_column('A:A', 20) 7 # Add a bold format to use to highlight cells. 8 bold = workbook.add_format({'bold': True}) 9 # Write some simple text. 10 worksheet.write('A1', 'Hello') 11 # Text with formatting. 12 worksheet.write('A2', 'World', bold) 13 # Write some numbers, with row/column notation. 14 worksheet.write(2, 0, 123) # 第二3行第1列 15 worksheet.write(3, 0, 123.456) # 第四行第1列 16 # Insert an image. 17 worksheet.insert_image('B5', 'logo.png') 18 workbook.close()
xlrd&xlwt主要是针对Office 2013或更早版本的XLS文件格式。xlutils使用须要依赖xlrd和xlwt,扩充这两个库的功能。(更多信息请见:http://www.python-excel.org/)api
支持XLS格式 XlsxWriter和OpenPyXL都不支持XLS格式,从这个角度看,xlrd&xlwt仍然有必定的不可替代性。
1 import xlwt 2 from datetime import datetime 3 style0 = xlwt.easyxf('font: name Times New Roman, color-index red, bold on', 4 num_format_str='#,##0.00') 5 style1 = xlwt.easyxf(num_format_str='D-MMM-YY') 6 wb = xlwt.Workbook() 7 ws = wb.add_sheet('A Test Sheet') 8 ws.write(0, 0, 1234.56, style0) 9 ws.write(1, 0, datetime.now(), style1) 10 ws.write(2, 0, "hello world") 11 ws.write(3, 0, 1) 12 ws.write(3, 1, 3) 13 ws.write(3, 2, xlwt.Formula("A4+B4")) 14 wb.save('example.xls')
1 import xlrd 2 # 打开文件 3 workbook = xlrd.open_workbook('example.xls') 4 sheet2_name = workbook.sheet_names() # 获取全部sheet名称 5 print(sheet2_name) 6 # 根据sheet索引或者名称获取sheet内容 7 sheet1 = workbook.sheet_by_index(0) # sheet索引从0开始 8 # sheet1 = workbook.sheet_by_name('sheet2') 9 # sheet1的名称,行数,列数 10 print(sheet1.name, sheet1.nrows, sheet1.ncols) 11 # 获取整行和整列的值(数组) 12 rows = sheet1.row_values(2) # 获取第三行内容 13 cols = sheet1.col_values(0) # 获取第1列内容 14 print(rows) 15 print(cols) 16 # 获取单元格内容 17 print(sheet1.cell(2, 0).value.encode('utf-8')) 18 print(sheet1.cell_value(2, 0).encode('utf-8')) 19 print(sheet1.row(2)[0].value.encode('utf-8')) 20 # 获取单元格内容的数据类型 21 print(sheet1.cell(2, 0).ctype)
输出: ['A Test Sheet'] A Test Sheet 4 3 ['hello world', '', ''] [1234.56, 43262.66097222222, 'hello world', 1.0] b'hello world' b'hello world' b'hello world' 1
OpenPyXL是比较综合的一个工具,能读能写能修改,功能还算能够但网上有人说有很大的缺陷。(更多信息请见:http://www.python-excel.org/, https://openpyxl.readthedocs.io/en/stable/index.html)
from openpyxl import Workbook wb = Workbook() # grab the active worksheet ws = wb.active # Data can be assigned directly to cells ws['A1'] = 42 # Rows can also be appended ws.append([1, 2, 3]) # Python types will automatically be converted import datetime ws['A2'] = datetime.datetime.now() # Save the file wb.save("sample.xlsx")
from openpyxl import Workbook
from openpyxl.compat import range
from openpyxl.utils import get_column_letter
wb = Workbook()
dest_filename = 'book.xlsx'
ws1 = wb.active
ws1.title = "range names"
for row in range(1, 5):
ws1.append(range(0, 10))
ws2 = wb.create_sheet(title="Pi")
ws2['F5'] = 3.14
ws3 = wb.create_sheet(title="Data")
for row in range(2, 10):
for col in range(27, 40):
_ = ws3.cell(column=col, row=row, value="{0}".format(get_column_letter(col)))
wb.save(filename=dest_filename)
1 from openpyxl import load_workbook 2 wb = load_workbook(filename='book.xlsx') 3 sheet_ranges = wb['range names'] 4 print(sheet_ranges['D2'].value)
输出:
3数组
大部分Windows环境的开发人员都会选择Microsoft Excel API。实际上不只仅是Python,几乎各类语言都有相应的方法使用它,由于核心的逻辑彻底是由Microsft Excel自身提供的。语言相关的部分只是负责跟Windows的COM组件进行通讯。
在Python中首先须要安装Python for Windows extensions(pywin32),具体的文档能够查阅Win32 Modules和Python COM。
固然你还必需要安装某一个版本的Microsoft Office Excel,它内部的DLL负责实际的操做。缓存
一个包装器,他提供了一个接口去读、写、操做数据。经过该包装器能够根据场景下载安装不一样的插件(好比前面提到的:xlrd、xlwt、OpenPyXL、XlsxWriter),而后使用该包装器可使用相同的一套api去操做excel。
不过该工具若是是公司使用须要支付必定费用,大概$10,我的使用的话是免费的。(详情可参见:https://pypi.org/project/pyexcel/)。app
可用插件以下:
ide
1 import pyexcel as p # make sure you had pyexcel-xls installed 2 a_list_of_dictionaries = [ 3 { 4 "Name": 'Adam', 5 "Age": 28 6 }, 7 { 8 "Name": 'Beatrice', 9 "Age": 29 10 }, 11 { 12 "Name": 'Ceri', 13 "Age": 30 14 }, 15 { 16 "Name": 'Dean', 17 "Age": 26 18 } 19 ] 20 pyexcel.save_as(records=a_list_of_dictionaries, dest_file_name="your_file.xls")
1 import pyexcel as p # make sure you had pyexcel-xls installed 2 records = p.iget_records(file_name="your_file.xls") 3 for record in records: 4 print("%s is aged at %d" % (record['Name'], record['Age'])) 5 p.free_resources()
输出:
Adam is aged at 28
Beatrice is aged at 29
Ceri is aged at 30
Dean is aged at 26工具