爬虫(抓取静态页面和动态页面的区别,get请求和post请求的区别)

静态页面: 非结构化数据:HTMLcss 处理方式:正则表达式,xpath, beautifulsoup4html 静态页面中的数据都包含在网页的HTML中(通常都是get请求)前端 因此能够直接在网页的HTML中提取数据node 关键词通常都以查询字符串的方式拼接在URL中python 分析URL的变化能够进行多页爬取ajax python2:  urllib + urllib2    /   
相关文章
相关标签/搜索