爬虫系列之豆瓣图书排行

豆瓣上有图书的排行榜,所以这次写了一个豆瓣的爬虫。 首先是分析排行榜的url 根据这个可以很容易的知道不同图书的排行榜就是在网站后面加上/tag/【类别】,所以我们首先要获得图书的类别信息。 这里可以将读书首页的热门标签给爬下来。             爬取标签内容并不难,代码如下: 1 def getLabel(url): #获得热门标签 2 html = getHTMLTe
相关文章
相关标签/搜索