pyspider爬虫教程(1):HTML和CSS选择

虽然以前写过 如何抓取WEB页面 和 如何从 WEB 页面中提取信息。但是感觉还是需要一篇 step by step 的教程,不然没有一个总体的认识。不过,没想到这个教程居然会变成一篇译文,在这个爬虫教程系列文章中,会以实际的例子,由浅入深讨论爬取(抓取和解析)的一些关键问题。 在 教程一 中,我们将要爬取的网站是豆瓣电影:http://movie.douban.com/ 你可以在: http:/
相关文章
相关标签/搜索