前嗅ForeSpider数据采集教程:通过识别列表进行数据抽取

以孔夫子旧书网(http://www.kongfz.com/1004/)为例: 一.网站结构 1.网站截图说明 该网站为列表结构,可以通过识别列表的方式对全篇数据进行抽取。 网站列表页   2. 采集结果截图 采集数据结果   二. 配置模板 新建任务 新建任务   点击【下一步】,需要采集每一页检索结果并抽取数据,所以此处需要勾选【普通翻页】和【数据抽取】,如图: 新建采集任务   2.创建/选
相关文章
相关标签/搜索