利用wget命令实现爬虫的简单抓取

wget命令相信很多人并不陌生,但是绝大多数仅仅是利用它下载文件使用。其实它还有个作用,就是爬取数据。 它虽然不如Python,Java手写代码那么灵活,但是对于需求简单的,用这个足够了。 话不多说,首先上抓取命令(以抓取博客园为例): wget -o /tmp/wget.log -P /root/data --no-parent --no-verbose -m -D www.cnblogs.c
相关文章
相关标签/搜索