Hadoop的安装及一些基本概念解释

  • 1.准备Linux环境
  • 准备linux环境(通常采用租用云服务的方式比较方便)
    2.安装JDk
  • 首先查看是否有java环境 javac
  • apt -get install openjdk-7-jdk 回车,,下载安装jdk vi /etc/profile 进入系统文件配置jdk环境变量
  • export  JAVA_HOME=/usr/lib/jvm/java-7-openjdk-am64

. export JRE_HOME=$JAVA_HOME/jre export CLASSPATH=$JAVA_HOME/lib;$JRE_HOME/lib:$CLASSPATH export PATH=$JAVA_HOME/lib;$JRE_HOME/bin:$PATHjava

  • :wq . source /tec/profile 使得配置文件生效 . Javac 查看是否安装成功 3.配置Hadoop配置文件
  • (1).下载 -. 安装hadoop
  • . 手动下载并安装hadoop,因为库里面没有该文件,须要使用wget命令
  • . wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-1.2.1/hadoop-1.2.1.tar.gz -. 在当前目录下面查看是否已下载成功
  • . mv hadoop-1.2.1.tar.gz /opt/ 将hadoop压缩包复制到opt目录下面
  • tar -zxvf hadoop-1.2.1.tar.gz 解压缩
  • . 配置文件在conf文件下(有四个文件)
  • . ①vi hadoop-env.sh 里面须要配置java jdk路径
  • . echo $JAVA_HOME
  • . ②vi core-site.xml文件
  • . 配置三个属性
  • . <property> 配置hadoop工做目录
  • <name>hadoop.tmp.dir</name>
  • . <value>/hadoop</value>默认在/hadoop下面
  • . </property>
  • .
  • . <property> 配置namenode目录
  • . . <name>dfs.name.dir</name>
  • . <value>/hadoop/name</value>
  • . </property>
  • .
  • . <property> 文件系统该如何访问*
  • . <name>dfs.default.name</name>
  • . <value>hdfs://localhost:9000</value>域名/端口号
  • . . </property>
  • . .
  • . ③vi hdfs-site.xml
  • . 配置文件系统数据的存放目录
  • . . <property>
  • . <name>dfs.data.dir</name>
  • . . <value>/hadoop/data</value>
  • . </property>
  • . ④vi mapred-site.xml 配置任务调用器该如何去访问
  • . <property>
  • . <name>mapred.job.tracker</name>
  • . . <value>主机:端口号</value>
  • . </property>
  • . vi /ect/profile 配置hadoop环境变量(跟java同样)
  • . export HADOOP_HOME=/opt/hadoop-1.2.1
  • export PATH=$HADOOP_HOME/bin
  • . source /etc/profile市配置文件生效
  • . 输入hadoop 查看是否配置成功
  • . 在执行hadoop以前须要对namenode进行格式化
  • . hadoop namenode -format
  • . 格式化后执行 start-all.sh命令
  • . 使用jps命令 查看当前运行的那些java进程
  • . hadoop fs -ls 下面有那些文件
  • . 2、hadoop基本概念
  • . HDFS 和MapReduce
  • . 未完待续。。。。
相关文章
相关标签/搜索