Python网络爬虫笔记（三）：下载博客园随笔到Word文档

时间 2021-01-06

栏目 Python 繁體版

原文原文链接

（一）说明在上一篇的基础上修改了下，使用lxml提取博客园随笔正文内容，并保存到Word文档中。操作Word文档会用到下面的模块： pip install python-docx 修改的代码（主要是在link_crawler()的while循环中增加了下面这段） 1 tree = lxml.html.fromstring(html) #解析HTML为统一的格式 2

>>阅读原文<<

相关文章

相关标签/搜索

python 网络爬虫

python网络爬虫

Python网络爬虫三

随笔---转载

python爬虫自学笔记

python小随笔

转载 | 笔记

Microsoft Office

网站品质教程

网站建设指南

网站主机教程

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公众号

欢迎关注本站公众号,获取更多信息

相关文章

>>更多相关文章<<