智联招聘抓取---scrapy框架和requests库两种方式实现

#首先分析目标站点,分析得出结果是在json接口里,然后抓取企业信息需要再次请求页面进行抓取 #1.直接requests请求进行抓取保存 ##需要注意点: 可能不同企业单页排版不一样,需要判断采取不同形式 保存为csv文件注意格式,保证数据表格不换行需要添加 newline=’’ import requests import json from lxml import etree import c
相关文章
相关标签/搜索