Python网络爬虫:利用BeautifulSoup爬取‘豆瓣读书’中的‘新书速递’条目

上一节用了正则表达式进行爬虫,那个方法关键在于正则表达式(Regular Expression以后简称RE)的书写,个人猜测是会有一些要提取的内容的RE写起来会很复杂,甚至很难写出来(固然,只是个人猜测,作的爬虫并很少),因此利用BeautifulSoup(以后简称BS)就不用写那些复杂的RE了,BS更多用到了一些属性,好比典型的find()、find_all()(这让我想起re里的findall
相关文章
相关标签/搜索