google-images-download 用于批量下载图片
google-images-download 是个 Python 脚本。一条命令,就完成 Google 图片搜索和批量下载功能。而且,这工具还跨平台运行,Linux, Windows 和 macOS 都支持。简直是懒人福音。
首先,我们先指定图片要下载的位置,我把它指定到了「下载(Download)」这个文件夹:
cd ~/Downloads
然后,在终端里执行即可:
googleimagesdownload -k "谭卓" -l 20
这行代码中:
最后的 Error: 1 说明, 下载过程中,发生了一个错误。但程序依然正常地将下载流程运行完毕。
我们发现,下载的图片已经都存放在 ~/Downloads/downloads/谭卓 下面。google-images-download 非常贴心地,为我们建立子目录。
基本上,这一行命令就能帮我们解决正常情况下,批量下载图片的需求了。
然而,在有的情况下,我们需要下载的图片远远大于 20 张。比如说我看了半天照片,还是分不大清楚郝蕾和谭卓。那么为了彻底分清两位女演员,我打算再下载 200 张郝蕾的照片试试。
仿照刚才的命令,执行:
googleimagesdownload -k "郝蕾" -l 200
然后,你会发现报错了:
遇到问题,不要慌。你得认真看看错误提示。注意其中出现了一个关键词:chromedriver。这是个什么东西呢?
我们回到 google-images-download 的 github 页面,以 chromedriver 为关键词进行检索。你会立即找到如下结果:
原来,当我们下载的图片数量超过 100 张时,程序就必须调用 Selenium 和 chromedriver 才行。不知道它俩是啥无所谓,要了咱装就行了。
Selenium 在我们安装 google-images-download 的时候,就已经同时安装好了。现在我们只需要下载 chromedriver 即可
接下来我们就可以批量下载超过 100 张图片了。执行以下命令:
googleimagesdownload -k "郝蕾" -l 200 --chromedriver="./chromedriver"
我们会发现多了一个 参数 --chromedriver。它是用来告诉 google-images-download 解压后 chromedriver 的所在路径。这回机器勤勤恳恳,帮我们下载郝蕾的照片了
下载完毕后发现也有一些报错,部分图片没有正确下载。但这对总体结果没有太大影响。为了保险起见,建议你设置下载数量时,多设置一些。给自己留出安全边际嘛。
运行参数
我数了一下,一共有39项。篇幅所限,这里就不一一展开罗列了。但是其中几个特色参数,我还是希望提示你一下,因为你在实际工作中,很可能会觉得它们有用处。
最后还有一个参数,是 ---safe_search,它的作用是启用安全搜索,来保证搜索结果中,不会出现不利于精神文明建设的内容。