Python计算生态中那些著名的库-文本处理

PyPDF2

用来处理pdf文件的工具集html

提供了一批处理PDF文件的计算功能,支持获取信息、分隔/整合文件、加密解密等,彻底Python语言实现,不须要额外依赖,功能稳定python

官方网站:mstamy2.github.io/PyPDF2git

NLTK

天然语言文本处理第三方库github

提供了一批简单易用的天然语言文本处理功能,支持语言文本分类、标记、语法句法、语义分析等,是最优秀的Python天然语言处理库工具

官方网站:www.nltk.org网站

Python-docx

建立或更新Microsoft Word文件的第三方库加密

提供建立或更新.doc .docx等文件的计算功能,增长并配置段落、图片、表格、文字等功能htm

官方网站:python-docx.readthedocs.io/en/latest/i…图片

相关文章
相关标签/搜索