那些年,我爬过的北科(三)——爬虫进阶之多进程的使用

爬取多个页面 在爬虫基础之环境搭建与入门中,介绍了如何用Requests下载(爬取)了一个页面,并用BeautifulSoup这个HTML解析库来解析页面里面咱们想要的内容。html 显然,爬虫确定不是只让咱们爬取一个网页的,这样的工做,人也能够作。下面咱们来看:nladuo.cn/scce_site/这个页面。这个页面一共有10页,点击下一页以后能够看到在网页的url中多了个字段“2.html”
相关文章
相关标签/搜索