Python爬虫开发从入门到实战

时间 2020-12-30

原文原文链接

Python爬虫开发从入门到实战（微课版）第1章绪论爬虫的主要目的是获取网页内容并解析。只要能达到这个目的，用什么方法都没有问题。关于获取网页，本书主要介绍了Python的两个第三方模块，一个是requests，另一个是爬虫框架Scrapy。关于解析网页内容，本书主要介绍了3种方式——正则表达式、XPath和BeautifulSoup。两种网页获取方式和3种网页解析方式可以自由搭配，随意

>>阅读原文<<