Python网络爬虫与信息提取（一）

时间 2020-12-30

原文原文链接

　　　　　　　　　　　　　　学习北京理工大学嵩天课程笔记课程体系结构：　　1、Requests框架：自动爬取HTML页面与自动网络请求提交　　2、robots.txt:网络爬虫排除标准　　3、BeautifulSoup框架：解析HTML页面　　4、Re框架：正则框架，提取页面关键信息　　5、Scrapy框架：网络爬虫原理介绍，专业爬虫框架介绍　　理念：The Website

>>阅读原文<<