前嗅ForeSpider脚本教程-连接过滤脚本

今天,小编给你们带来的教程为:前嗅ForeSpider脚本教程-连接过滤脚本,应用场景,地址/标题过滤。具体内容以下:ide

一.应用场景url

当可视化抽取到的连接包含不想要的连接地址时,须要进行过滤。可能用到的类是:string,使用到的全局对象是VALUE。对象

二.地址过滤blog

场景:连接地址有规律。教程

示例:可视化配置百度搜索以后的连接抽取,过滤掉不是列表连接和翻页连接的全部连接。字符串

脚本实例:string

If(VALUE.Find(“wd=”)!=-1||VALUE.Find(“url=”)!=-1)可视化

return true; //return true表明保留连接百度

else return false; //return false表明过滤连接配置

三.标题过滤

场景:连接标题有规律。

示例:过滤掉全部标题不为空字符串的连接,并返回连接标题为”关键词”。

脚本实例:

if(VALUE!=””)

return false; //表明过滤连接

else return “关键词”; //不然保留并覆盖标题为关键词

相关文章
相关标签/搜索