本文主要实现一个简单的爬虫,目的是从一个百度贴吧页面下载图片。html
本文主要实现一个简单的爬虫,目的是从一个百度贴吧页面下载图片。下载图片的步骤以下:java
获取网页html文本内容;
分析html中图片的html标签特征,用正则解析出全部的图片url连接列表;
根据图片的url连接列表将图片下载到本地文件夹中。python
运行上面脚本,过几秒种以后完成下载,能够在当前目录下看到图片已经下载好了:app
下面用requests库实现下载,把getHtmlContent和downloadJPG函数都用requests从新实现。python爬虫
输出:和前面同样。函数
原文连接:url
https://www.cnblogs.com/jiayongji/p/7118934.htmlspa
-END-code