爬虫学习(一)

爬虫概念 是一种按照必定的规则,自动地抓取万维网信息的程序或者脚本,简单来讲就是一个网络机器人,是一个程序python 爬虫执行流程 1.提交url给网站服务器,服务器会响应一个信息给客户端 2.解析网页(提取咱们须要的有用信息) 3.保存信息,保存到文本文档,mysql数据库,EXCELmysql 爬虫分类 1.通用网络爬虫: 由种子url扩展到整个web 策略:深度优先,广度优先 2.聚焦网络
相关文章
相关标签/搜索