爬虫（抓取静态页面和动态页面的区别，get请求和post请求的区别）

时间 2020-02-11

原文原文链接

静态页面：非结构化数据：HTMLcss 处理方式：正则表达式，xpath, beautifulsoup4html 静态页面中的数据都包含在网页的HTML中（通常都是get请求）前端因此能够直接在网页的HTML中提取数据node 关键词通常都以查询字符串的方式拼接在URL中python 分析URL的变化能够进行多页爬取ajax python2: urllib + urllib2 /

>>阅读原文<<