爬虫:删除爬取内容中不须要的标签

问题:例如咱们使用爬虫爬取到一篇文章,可是该文章有一些影响标签(例如打赏),那么咱们可使用以下方法删除该标签: 方法一(字符串的strip): # 使用xpath寻找须要删除的div,若是该标签存在,那么在原文章理使用strip方法删除 del_div = response.xpath(del_xpath).extract_first() if del_div: article = art
相关文章
相关标签/搜索