java 爬虫大型教程(二)

java 爬虫大型教程(二) 编写基本的爬虫 1. 实现PageProcessor 这部分我们直接通过CdnRepoPageProcessor这个例子来介绍PageProcessor的编写方式。PageProcessor定制分为三个部分,分别是爬虫的配置、页面元素的抽取和链接的发现。 import us.codecraft.webmagic.Page; import us.codecraft.we
相关文章
相关标签/搜索