Python新手爬虫,简单制作抓取廖雪峰教程的小爬虫

先看几张对比图,分别是官网截图和抓取下来的 txt文档的截图,不算那难看的排版的话,内容是一致的,图片用 url替换了! 在整个抓取过程中,除了普通的文本以外,还需要处理 3个地方,分别是:代码、图片、视频,因为目前只写到了文本文件,所以直接抓到图片或者视频的地址,标识清楚后写入到 txt,这里可以在进一步,写到 word/pdf 或者其他文件,留待以后改进! Python 数据处理 Python
相关文章
相关标签/搜索