初学python,感受用起来比c\c++顺手多了。(水平菜鸟,没有黑的意思)html
python能够快速写一些小脚本帮助平常上网,好比在帖吧看到很好的照片,可是比较多,一百多张摄影做品或者剧照什么的,一张一张下载起来何其傻逼呀。咱们学计算机的岂能吃素的,话很少说,开始。python
1.首先找到打开目标网页的源代码,找到图片的代码,比较烦,但通常是src=***.jpg之类的。反正帖吧是这样,有些网站可能有点小差别。c++
2.下一步的任务是获取html代码,python有个模块urllib里面有函数能够帮忙正则表达式
import re import urllib def getHtml(url): page = urllib.urlopen(url) html = page.read() return html
那个re模块是正则表达式要用的。函数
ok,如今能够print检查一下html是否获取。(新手习惯~~)网站
3. 以后就能够获取图片了url
def getImg(html): reg = r"src = '(.+\.jpg)'width" imgre = re.compile(reg) imglist = re.findall(imgre,html) x = 0 for imgurl in imglist: urllib.urlretrieve(imgurl,'%s,jpg' % x) x+=1
有两个地方解释一下,第二行的代码是正则表达式,可能因网页图片地址而异。
x变量则是编号图片,防止图片下载覆盖原来的文件。code
最后只要执行这两个函数就能够自动下载到脚本所在文件夹了htm