智联招聘抓取---scrapy框架和requests库两种方式实现

时间 2021-01-13

原文原文链接

#首先分析目标站点，分析得出结果是在json接口里，然后抓取企业信息需要再次请求页面进行抓取 #1.直接requests请求进行抓取保存 ##需要注意点：可能不同企业单页排版不一样，需要判断采取不同形式保存为csv文件注意格式，保证数据表格不换行需要添加 newline=’’ import requests import json from lxml import etree import c