今天,小编给你们带来的教程为:前嗅ForeSpider脚本教程-连接过滤脚本,应用场景,地址/标题过滤。具体内容以下:ide
一.应用场景url
当可视化抽取到的连接包含不想要的连接地址时,须要进行过滤。可能用到的类是:string,使用到的全局对象是VALUE。对象
二.地址过滤blog
场景:连接地址有规律。教程
示例:可视化配置百度搜索以后的连接抽取,过滤掉不是列表连接和翻页连接的全部连接。字符串
脚本实例:string
If(VALUE.Find(“wd=”)!=-1||VALUE.Find(“url=”)!=-1)可视化
return true; //return true表明保留连接百度
else return false; //return false表明过滤连接配置
三.标题过滤
场景:连接标题有规律。
示例:过滤掉全部标题不为空字符串的连接,并返回连接标题为”关键词”。
脚本实例:
if(VALUE!=””)
return false; //表明过滤连接
else return “关键词”; //不然保留并覆盖标题为关键词