Nutch读取网页字段

http://blog.163.com/bit_runner/blog/static/53242218201141393943980/   一、Nutch的一些读取命令   1.查看crawldb数据库   查看url地址总数和它的状态及评分:bin/nutch readdb url/crawldb/ -stats 查看每个url地址的详细内容,导出数据:bin/nutch readdb url/
相关文章
相关标签/搜索