Python网络爬虫与信息提取(一)

              学习 北京理工大学 嵩天 课程笔记  课程体系结构:   1、Requests框架:自动爬取HTML页面与自动网络请求提交   2、robots.txt:网络爬虫排除标准   3、BeautifulSoup框架:解析HTML页面   4、Re框架:正则框架,提取页面关键信息   5、Scrapy框架:网络爬虫原理介绍,专业爬虫框架介绍   理念:The Website
相关文章
相关标签/搜索