本文档基于hbase-0.96.1.1-cdh5.0.2,对HBase配置&启动脚本进行分析
date:2016/8/4
author:wangxljava
剔除window相关脚本,咱们主要分析配置文件与.sh文件shell
conf ├── hadoop-metrics2-hbase.properties ├── hbase-env.sh ├── hbase-policy.xml ├── hbase-site.xml ├── log4j.properties └── regionservers bin ├── graceful_stop.sh ├── hbase ├── hbase-cleanup.sh ├── hbase-common.sh ├── hbase-config.sh ├── hbase-daemon.sh ├── hbase-daemons.sh ├── local-master-backup.sh ├── local-regionservers.sh ├── master-backup.sh ├── regionservers.sh ├── rolling-restart.sh ├── start-hbase.sh ├── stop-hbase.sh └── zookeepers.sh
咱们依据集群的构建步骤,先分析集群服务脚本,从中穿插配置文件,最后分析自带shell执行流程。apache
#start-hbase.sh 1.执行"$bin"/hbase-config.sh [--->hbase-config.sh] 2.若是带参为autorestart,则commandToRun="autorestart",不然commandToRun="start" 3.设置distMode=HBASE_ENV_INIT,也就是hbase-config.sh中设置的HBASE_ENV_INIT[只要HBASE_ENV_INIT无值且${HBASE_CONF_DIR}/hbase-env.sh存在就为true] $distMode为false,则hbase-daemon.sh $commandToRun master $@ $distMode为true,则 "$bin"/hbase-daemons.sh --config "${HBASE_CONF_DIR}" $commandToRun zookeeper "$bin"/hbase-daemon.sh --config "${HBASE_CONF_DIR}" $commandToRun master "$bin"/hbase-daemons.sh --config "${HBASE_CONF_DIR}" \ --hosts "${HBASE_REGIONSERVERS}" $commandToRun regionserver "$bin"/hbase-daemons.sh --config "${HBASE_CONF_DIR}" \ --hosts "${HBASE_BACKUP_MASTERS}" $commandToRun master-backup 4.转向hbase-daemons.sh [--->hbase-daemons.sh]
#hbase-config.sh 1.设置HBASE_HOME为本脚本所在目录 2.判断参数个数,能够设置--config或--hosts[注:通常无] 3.HBASE_CONF_DIR设置为$HBASE_CONF_DIR或$HBASE_HOME/conf[优先前者] 4.HBASE_REGIONSERVERS为$HBASE_REGIONSERVERS或$HBASE_CONF_DIR/regionservers 5.HBASE_BACKUP_MASTERS为$HBASE_BACKUP_MASTERS或$HBASE_CONF_DIR/backup-masters 6.设置Thrift JMX参数,条件是: HBASE_JMX_OPTS字符长度非0 && HBASE_THRIFT_JMX_OPTS无值 成立则:HBASE_THRIFT_JMX_OPTS="$HBASE_JMX_OPTS -Dcom.sun.management.jmxremote.port=10103" HBASE_THRIFT_JMX_OPTS有值,则设置并导出HBASE_THRIFT_OPTS=$HBASE_THRIFT_JMX_OPTS 7.设置REST JMX参数,条件是: HBASE_JMX_OPTS字符长度非0 && HBASE_REST_JMX_OPTS无值 成立则:HBASE_REST_JMX_OPTS="$HBASE_JMX_OPTS -Dcom.sun.management.jmxremote.port=10105" HBASE_REST_JMX_OPTS有值,则设置并导出HBASE_REST_OPTS=$HBASE_REST_JMX_OPTS 8.HBASE_ENV_INIT无值且${HBASE_CONF_DIR}/hbase-env.sh存在,执行"${HBASE_CONF_DIR}/hbase-env.sh",并export HBASE_ENV_INIT="true" [--->hbase-env.sh] 9.HBASE_REGIONSERVER_UID无值则HBASE_REGIONSERVER_UID="hbase"
#hbase-env.sh 设置并导出环境变量 1.JAVA_HOME 2.PID/LOG目录 3.SSH端口 4.内存参数 5.JMX 6.远程Debug
#hbase-daemons.sh 1.参数不足,打印帮助 2.执行"$bin"/hbase-config.sh [--->hbase-config.sh] 3.remote_cmd=cd hbase-0.96.1.1-cdh5.0.2; hbase-daemon.sh --config conf start master [省略了路径] 4.args=--hosts regionservers --config conf cd hbase-0.96.1.1-cdh5.0.2; hbase-daemon.sh --config conf start master [省略了路径] 5.command=master 6.进入case,判断command,进入exec "$bin/regionservers.sh" $args 7.转向regionservers.sh [--->regionservers.sh ]
#regionservers.sh 1.参数不足,打印帮助 2.执行"$bin"/hbase-config.sh [--->hbase-config.sh] 3.设置HOSTLIST 4.遍历HOSTLIST,SSH到各节点,执行操做hbase-daemon.sh [--->hbase-daemon.sh]
#hbase-daemon.sh 1.参数不足,打印帮助 2.执行"$bin"/hbase-config.sh [--->hbase-config.sh] 3.执行"$bin"/hbase-common.sh [--->hbase-common.sh] 4.获取参数,以 startStop=start command=regionserver 5.日志回滚函数(hbase_rotate_log),清楚zk函数(cleanZNode),启动前检查函数(check_before_start),等待完成函数(wait_until_done),略过 6.HBASE_LOG_DIR为"",则export HBASE_LOG_DIR="$HBASE_HOME/logs",并建立 7.HBASE_PID_DIR为"",则HBASE_PID_DIR=/tmp 8.HBASE_IDENT_STRING为"",则export HBASE_IDENT_STRING="$USER" 9.设置JAVA 10.导出HBASE_LOG_PREFIX和HBASE_LOGFILE,用于拼接日志文件名 11.export HBASE_ROOT_LOGGER=${HBASE_ROOT_LOGGER:-"INFO,RFA"},这里看一看出HBASE_ROOT_LOGGER不设置, HBASE_ROOT_LOGGER默认设置的是INFO,RFA,因此想更改日志为DRFA,得去修改hbase-env.sh中的HBASE_ROOT_LOGGER选项 12.拼接各类日志文件,如服务,pid,gc日志文件 13.HBASE_NICENESS为"",则export HBASE_NICENESS=0 14.进入case,选择start分支: check_before_start hbase_rotate_log $logout hbase_rotate_log $loggc echo starting $command, logging to $logout nohup $thiscmd --config "${HBASE_CONF_DIR}" internal_start $command $args < /dev/null > ${logout} 2>&1 & sleep 1; head "${logout}" 重点分析nohup $thiscmd --config "${HBASE_CONF_DIR}" internal_start $command $args < /dev/null > ${logout} 2>&1 & 直译:nohup hbase-daemon.sh --config conf internal_start master 2>&1 & 15.重复上诉步骤,再次进入case,选择internal_start分支: echo "`date` Starting $command on `hostname`" >> $loglog echo "`ulimit -a`" >> $loglog 2>&1 nice -n $HBASE_NICENESS "$HBASE_HOME"/bin/hbase \ --config "${HBASE_CONF_DIR}" \ $command "$@" start >> "$logout" 2>&1 & echo $! > $pid wait cleanZNode 16.最重要的一句话:nice -n 0 hbase -config conf master start 17.转向hbase脚本 [--->hbase]
#hbase 1.执行"$bin"/hbase-config.sh [--->hbase-config.sh] 2.参数无,打印帮助 3.COMMAND=$1,即COMMAND=master,判断hbase-env-$COMMAND.sh存在,则执行"$HBASE_HOME/conf/hbase-env-$COMMAND.sh" 4.JAVA_HEAP_MAX=-Xmx1000m,HBASE_HEAPSIZE不为"",JAVA_HEAP_MAX="-Xmx""$HBASE_HEAPSIZE""m" 5.CLASSPATH添加$JAVA_HOME/lib/tools.jar 6.CLASSPATH添加$HBASE_HOME/hbase-jars/hbase*.jar 7.CLASSPATH添加$HBASE_HOME/lib/*.jar 8.设置HBASE_LOG_DIR 9.添加hadoop依赖至CLASSPATH和JAVA_LIBRARY_PATH(hadoop-2.3.0-cdh5.0.2/lib/native) 10.CLASSPATH添加用户自定义HBASE_CLASSPATH/HBASE_CLASSPATH_PREFIX[咱们能够添加本身的jar至此] 11.COMMAND为("master" "regionserver" "thrift" "thrift2" "rest" "avro" "zookeeper")其中一个即为服务 为服务,则HBASE_OPTS="$HBASE_OPTS $SERVER_GC_OPTS" 其它,则HBASE_OPTS="$HBASE_OPTS $CLIENT_GC_OPTS" 12.根据对用COMMAND,设置对应CLASS,如CLASS='org.apache.hadoop.hbase.master.HMaster' 13.设置HBASE_OPTS,包含-Dhbase.log.dir -Dhbase.log.file -Dhbase.home.dir -Dhbase.id.str -Dhbase.root.logger -Djava.library.path=$JAVA_LIBRARY_PATH"(JAVA_LIBRARY_PATH不为空) 注意:-Dhbase.root.logger=${HBASE_ROOT_LOGGER:-INFO,console}",说明-Dhbase.root.logger默认使用的是HBASE_ROOT_LOGGER,而HBASE_ROOT_LOGGER默认都有值的,因此INFO,console基本不可能用 export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:$JAVA_LIBRARY_PATH" 为master和regionserver设置-Dhbase.security.logger 14.最后export CLASSPATH 15.执行exec "$JAVA" -Dproc_$COMMAND -XX:OnOutOfMemoryError="kill -9 %p" $JAVA_HEAP_MAX $HBASE_OPTS $CLASS "$@" 直译: java -Dproc_master -XX:OnOutOfMemoryError=kill -9 %p -Xmx1000m -XX:+UseConcMarkSweepGC -Xmx2048m -Xms2048m -Xmn1024m -XX:PermSize=100m -XX:MaxPermSize=100m -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:CMSInitiatingOccupancyFraction=70 -Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=n,address=8070 -Dhbase.log.dir=/opt/hadoop/hadoop-cluster/logs/hbase -Dhbase.log.file=hbase-hadoop-master-hadoop-dev-214.log -Dhbase.home.dir=/opt/hadoop/hadoop-cluster/modules/hbase-0.96.1.1-cdh5.0.2 -Dhbase.id.str=hadoop -Dhbase.root.logger=INFO,DRFA -Djava.library.path=/opt/hadoop/hadoop-cluster/modules/hadoop-2.3.0-cdh5.0.2/lib/native -Dhbase.security.logger=INFO,RFAS org.apache.hadoop.hbase.master.HMaster
#hbase-common.sh 内部就一个函数,waitForProcessEnd() ,Shared function to wait for a process end. Take the pid and the command name as parameters
1.graceful_stop.sh: move服务器上的全部region后,再stop/restart该服务器,能够用来进行版本的热升级 2.rolling-restart.sh:能够用来挨个滚动重启
启动整个集群(hbase-daemons.sh) -->启动节点同服务(hbase-daemons.sh) -->ssh分发(regionservers.sh) -->单机单服务(hbase-daemon.sh) -->构造Java服务(hbase) 其它:环境变量+加载JAR+OPTS+日志