nutch0.9实现抓取动态网页部署笔记

一:准备工作:     1:下载nutch,地址是:http://www.apache.org/dist/lucene/nutch/     2:下载JDK6(一定要是jdk6的版本,否则会报错),地址是: http://java.sun.com/javase/downloads/index.jsp      3:下载Cygwin(是一个在windows平台上运行的unix模拟环境的软件),地址是
相关文章
相关标签/搜索