爬虫(初识爬虫)

1. 什么是爬虫 在互联网上一直爬行的蜘蛛, 若是遇到须要的资源, 那么它就会抓取下来(html内容);模拟浏览器快速 访问页面的内容. 2. 爬虫的实现步骤 - 分析须要获取的信息在网页源码中的规律 - 获取网页源码 - 解析页面内容 - 获取所须要的信息 示例:爬取百度贴吧图片 ''' url规律: https://tieba.baidu.com/p/5752826839?pn=1
相关文章
相关标签/搜索