Heritrix架构学习笔记(二)

2、中央控制器CrawlController 该类是一次抓取任务中的核心组件。塔将决定整个抓取任务的开始和结束。编程 org.archive.crawler.framework Class CrawlController 在它的Field声明中,看到的一部分代码,以下图所示:函数 public class CrawlController implements Serializable, Repor
相关文章
相关标签/搜索