Python网络爬虫：利用BeautifulSoup爬取‘豆瓣读书’中的‘新书速递’条目

时间 2019-12-05

标签 python 网络爬虫利用 beautifulsoup 豆瓣读书新书速递条目栏目 Python 繁體版

原文原文链接

上一节用了正则表达式进行爬虫，那个方法关键在于正则表达式（Regular Expression以后简称RE）的书写，个人猜测是会有一些要提取的内容的RE写起来会很复杂，甚至很难写出来（固然，只是个人猜测，作的爬虫并很少），因此利用BeautifulSoup（以后简称BS）就不用写那些复杂的RE了，BS更多用到了一些属性，好比典型的find()、find_all()（这让我想起re里的findall

>>阅读原文<<