Nutch2 WebPage写入数据库的过程分析

版本: Nutch 2.2.1 本文经过InjectJob来追踪webpage的定义、建立、传递、序列化、写入数据库的整个过程。从源码中摘录了重要的代码行,并标明其所在文件名、行号。 1. 定义 schema schema直接写在源代码里面: //file:org/apache/nutch/storage/WebPage.java //line: 42 public class WebPage e
相关文章
相关标签/搜索