.NetCore实践爬虫系统（二）自定义规则

时间 2021-01-17

原文原文链接

回顾上篇文章NetCore实践爬虫系统（一）解析网页内容我们讲了利用HtmlAgilityPack，输入XPath路径，识别网页节点，获取我们需要的内容。评论中也得到了大家的一些支持与建议。下面继续我们的爬虫系统实践之路。本篇文章不包含依赖注入/数据访问/UI界面等，只包含核心的爬虫相关知识，只能作为Demo使用，抛砖引玉，共同交流。抽象规则爬虫系统之所以重要，正是他能支持各种各样的数据。

>>阅读原文<<