1,版本是个很重要的问题
apache
nutch上面有介绍和nutch配合使用的各框架的版本
框架
2,下载hbase,放在opt/下url
3,tar -zxvf hbase-*spa
4,更改conf 下的 hbase-site.xml文件日志
添加属性:orm
<configuration>xml
<property>ip
<name>hbase.rootdir</name>get
<value>hbase-data</value>it
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>/opt/hbase-0.94.27/data/zk-data</value>
</property>
</configuration>
5,启动hbase
6,下载nutch,解压
在conf /nutch-site.xml中
<property>
<name>storage.data.store.class</name>
<value>org.apache.gora.hbase.store.HBaseStore</value>
<description>Default class for storing data</description>
</property>
并去掉在ivy.xml中的gora-hbase的注释配置
在gora.properties中加入
gora.datastore.default=org.apache.gora.hbase.store.HBaseStore
7,在项目根部录下ant
8,若是在ant时出现错误,下载不了某个包时,能够自行下载而后上传到.ivy中的相应目录中
问题:
第一次我安装的是hbase-0.90,在inject时就卡住了,而后日志也没有是么提示,困扰了好几天,无奈之下,从新换了hbase,终于好了
InjectorJob: starting at 2015-10-28 23:29:20
InjectorJob: Injecting urlDir: urls/url
InjectorJob: Using class org.apache.gora.hbase.store.HBaseStore as the Gora storage class.
InjectorJob: total number of urls rejected by filters: 0
InjectorJob: total number of urls injected after normalization and filtering: 1
Injector: finished at 2015-10-28 23:29:24, elapsed: 00:00:03