python如何批量下载帖吧图片

初学python,感受用起来比c\c++顺手多了。(水平菜鸟,没有黑的意思)html

python能够快速写一些小脚本帮助平常上网,好比在帖吧看到很好的照片,可是比较多,一百多张摄影做品或者剧照什么的,一张一张下载起来何其傻逼呀。咱们学计算机的岂能吃素的,话很少说,开始。python

1.首先找到打开目标网页的源代码,找到图片的代码,比较烦,但通常是src=***.jpg之类的。反正帖吧是这样,有些网站可能有点小差别。c++

2.下一步的任务是获取html代码,python有个模块urllib里面有函数能够帮忙正则表达式

import re
import urllib

def  getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

那个re模块是正则表达式要用的。函数

ok,如今能够print检查一下html是否获取。(新手习惯~~)网站

3. 以后就能够获取图片了url

def getImg(html):
    reg = r"src = '(.+\.jpg)'width"
    imgre = re.compile(reg)
    imglist = re.findall(imgre,html)
    x = 0
    for imgurl in imglist:
        urllib.urlretrieve(imgurl,'%s,jpg' % x)
        x+=1

有两个地方解释一下,第二行的代码是正则表达式,可能因网页图片地址而异。
x变量则是编号图片,防止图片下载覆盖原来的文件。code

最后只要执行这两个函数就能够自动下载到脚本所在文件夹了htm

相关文章
相关标签/搜索