第一步:打开terminal,进入根目录,运行命令:node
cd
第二步: 显示隐藏文件,这时尚未.ssh文件夹web
ls –a
第三步:生成密钥sql
ssh-keygen -t rsa -P ""
第四步,进入.ssh文件夹,运行:shell
cat id_rsa.pub >> authorized_keys
第五步: ssh登陆数据库
ssh localhost
Hadoop下载地址:http://hadoop.apache.org/releases.html
下载hadoop-2.7.3.tar.gz,大约204MB。
下载后解压缩:apache
sudo tar –zxvf hadoop-2.7.3.tar.gz
Hadoop有三种安装模式:单机模式、伪分布式模式、分布式模式。bash
解压安装文件以后,就是单机模式,运行wordcount测试是否安装成功。
第一步:在hadoop-2.7.3目录下新建input文件夹。markdown
sudo mkdir input
第二步:在input文件夹下新增2个文本文件用于测试。
echo 'hello world' > file1.txt echo 'hello hadoop' > file2.txt
第三步:运行wordcount例子
sudo ./bin/hadoop jar ./share/hadoop/mapreduce/hadoop- mapreduce-examples-2.7.3.jar wordcount input/ output
No news is good news,没waring、没error就说明正确运行。
第四步:查看运行结果:
cat output/part-r-00000
统计结果:
hadoop 1 hello 2 world 1
文件位置: hadoop-2.7.3/etc/hadoop/hadoop-env.sh 注释掉 HADOOP_OPTS
#export HADOOP_OPTS="$HADOOP_OPTS -Djava.net.preferIPv4Stack=true"
改成:
export HADOOP_OPTS="$HADOOP_OPTS -Djava.net.preferIPv4Stack=true -Djava.security.krb5.realm= -Djava.security.krb5.kdc="
文件位置: hadoop-2.7.3/etc/hadoop/core-site.xml
修改成以下配置:
<configuration> <property> <name>hadoop.tmp.dir</name> <value>/usr/local/Cellar/hadoop-2.7.3/hdfs/tmp</value> <description>A base for other temporary directories</description> </property> <property> <name>fs.default.name</name> <value>hdfs://localhost:9000</value> </property> </configuration>
其中/Users/bee/Documents/bd/hadoop-2.7.3/hdfs/tmp能够自定义. fs.default.name 保存了NameNode的位置,HDFS和MapReduce组件都须要用到它,这就是它出如今core-site.xml 文件中而不是 hdfs-site.xml文件中的缘由。
<configuration> <property> <name>mapred.job.tracker</name> <value>localhost:9010</value> </property> </configuration>
变量mapred.job.tracker 保存了JobTracker的位置,由于只有MapReduce组件须要知道这个位置,因此它出如今mapred-site.xml文件中。
变量dfs.replication指定了每一个HDFS数据库的复制次数。 一般为3, 因为咱们只有一台主机和一个伪分布式模式的DataNode,将此值修改成1。
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration>
./bin/hadoop namenode -format
运行启动命令:
./sbin/start-all.sh
查看进程:
jps
启动成功以后能够看到NodeManager、NameNode、SecondaryNameNode、ResourceManager这几个进程。
2338 NodeManager 2389 Jps 1900 NameNode 2108 SecondaryNameNode 2238 ResourceManager
访问HDFS的web端口: http://localhost:50070
http://hbase.apache.org/
下载后解压缩。
查看Hbase版本:
./bin/hbase version
启动Hbase:
./bin/start-hbase.sh
进入Hbase shell:
./bin/hbase shell
文件位置: hbase-1.2.4/conf/hbase-env.sh 开启HBASE_MANAGES_ZK,改值默认是注释的,做用是:使用自带的ZooKeeper。咱们为了方便,使用Hbase自带的ZooKeeper:
export HBASE_MANAGES_ZK=true
<property> <name>hbase.rootdir</name> <value>hdfs://localhost:9000/hbase</value> </property> <property> <name>hbase.cluster.distributed</name> <value>true</value> </property>
启动以前,先启动hadoop:
./sbin/start-all.sh
再启动hbase:
./bin/start-hbase.sh