Two Server模式就是把Azkaban和MySQL进行了分离,下面就介绍一下这种部署模式。java
node1:azkaban-web、azkaban-execnode
node2:MySQLmysql
这里本人将azkaban的相关服务放置到一台服务器中,将MySQL放置到另一台服务器中。web
两台服务器,服务器系统这里选择的是CentOS7。一台称之为node一、另一台称之为node2。sql
在node2上建立一个放置建表文件的目录:数据库
mkdir –p /home/script/azkabansql
到编译的目录中,将编译好的文件远程拷贝到目标主机:vim
cd /opt/azkaban/azkaban/azkaban-db/build/distributions/ scp azkaban-db-3.66.0-6-ge20c886.tar.gz root@node2:/home/script/azkabansql/
到node2上解压文件浏览器
cd /home/script/azkabansql tar -zxvf azkaban-db-3.66.0-6-ge20c886.tar.gz
以上为解压出来的文件,这里须要使用的就是红框框起来的sql文件。bash
在存放建表语句文件的目录下登陆MySQL,若是不在此目录的话,建表文件使用很是麻烦。服务器
mysql –u root –p
create database azkaban66; use azkaban66
本人的数据库中已经有一个azkaban的数据库在使用了,这里本人建立了一个新的数据库,以azkaban的版本号结尾,数据库的名字可按需建立。
这一步能够省略,你可使用原有的root帐户进行数据库的操做。
create user ‘azkaban’@’%’ identified by ‘azkaban’;
前一个azkaban是用户名,后一个azkaban是密码。
4.设置权限
给用户赋予权限
grant select,insert,update,delete on azkaban66.* to ‘azkaban’@’%’ with grant option; flush privileges ;
执行如下文件,进行建表:
source azkaban-db-3.66.0-6-ge20c886/create-all-sql-3.66.0-6-ge20c886.sql
若是不是在当前目录下进入MySQL的话,可使用绝对路径来进行文件导入。
下图为数据库中创建的表:
若是若是想要使azkaban在建立项目的时候description支持中文输入,那么这里就须要更改一个表的一个字段的字符集便可。
须要修改的表为projects表。
使用数据库链接工具Navicat for MySQL,链接到库,右键projects表,选择设计表,出现以下图的界面:
选中字段,修改字符集为utf8,而后保存便可。
有的时候,会上传的文件过大,超过MySQL接收的默认最大值,这里能够修改一下MySQL的默认最大值。
vim /etc/my.cnf max_allowed_packet=1024M
修改完成以后,重启数据库。
将编译好的文件拷贝到node2中规划的目录里去:
cd opt/azkaban/azkaban/azkaban-web-server/build/distributions/ cp azkaban-exec-server-3.66.0-6-ge20c886.tar.gz /opt/azkaban/ cd opt/azkaban/azkaban/azkaban-exec-server/build/distributions/ cp azkaban-web-server-3.66.0-6-ge20c886.tar.gz /opt/azkaban/ # 解压 cd /opt/azkaban/ tar -zxvf azkaban-web-server-3.66.0-6-ge20c886.tar.gz tar -zxvf azkaban-exec-server-3.66.0-6-ge20c886.tar.gz
解压以后,web下的文件夹列表以下:
exec下的文件夹列表以下:
官方网站上提示:
因此如今只有exec目录下少了一个文件。
官方的文档顺序,是先配置的exec,这里也先从exec开始配置。
进入exec的conf目录中,能够看到有以下三个个文件:
其中global.properties是一个空的文件。
编辑此文件,命令以下:
vim azkaban.properties
文件的原始内容,以下图:
由官方文档得知,exec能够配置两大项内容:
下面开始配置,可将原来的文件中,不须要的属性注释掉,或者将原始文件更名复制一份,再进行修改。
# Azkaban Personalization Settings # 能够将其余的属性注释掉或者删除,这里只配置时区这一项 default.timezone.id=Asia/Shanghai # Azkaban UserManager class # Loader for projects executor.global.properties=conf/global.properties azkaban.project.dir=projects # Velocity dev mode velocity.dev.mode=false # Azkaban Jetty server properties. # mail settings lockdown.create.projects=false cache.directory=cache # JMX stats jetty.connector.stats=true executor.connector.stats=true # Azkaban Executor settings executor.maxThreads=50 executor.flow.threads=30 # 这里添加一个端口配置 executor.port=12321 azkaban.execution.dir=executions # Azkaban plugin settings azkaban.jobtype.plugin.dir=plugins/jobtypes # Azkaban mysql settings by default. Users should configure their own username and password. database.type=mysql mysql.port=3306 mysql.host=MySQL的ip地址 mysql.database=azkaban66 mysql.user=azkaban mysql.password=azkaban mysql.numconnections=100
打开此文件,文件中已经配置好了
在exec的home目录下执行如下目录,启动exec服务:
bin/start-exec.sh
启动以后,home目录下的文件变为以下:
激活执行器有一个明显的地方能够看到,在数据库中executors表中,你能够查看当前服务器的active字段,没有激活的时候是0,激活以后是1。
若是不激活,那么在启动web的时候执行任务会报出找不到执行器的错误。
启动exec服务器以后,在exec服务器的home目录中当即执行以下命令,激活执行器:
curl -G "localhost:$(<./executor.port)/executor?action=activate" && echo
以下图:
通过后续的测试发现,每次重启exec服务器,都须要激活。
进入web的目录,执行以下命令:
keytool -keystore keystore -alias jetty -genkey -keyalg RSA
此命令是固定的,不须要更改什么。以下是执行过程:
[root@node1 azkaban-web-server-3.66.0-6-ge20c886]# keytool -keystore keystore -alias jetty -genkey -keyalg RSA Enter keystore password: #密码 Re-enter new password: #密码 What is your first and last name? [Unknown]: What is the name of your organizational unit? [Unknown]: What is the name of your organization? [Unknown]: What is the name of your City or Locality? [Unknown]: What is the name of your State or Province? [Unknown]: What is the two-letter country code for this unit? [Unknown]: Is CN=Unknown, OU=Unknown, O=Unknown, L=Unknown, ST=Unknown, C=Unknown correct? [no]: y Enter key password for <jetty> (RETURN if same as keystore password): #密码 Re-enter new password: #密码
此时在看web目录之下,多了一个keystore文件。
若是是在别的目录之下进行的这个命令操做,在相应的目录下会有这个文件,只要将这个文件拷贝到web目录下便可。
此文件在conf目录下:
cd conf/
由上图能够看到,conf目录下存在四个文件。
cp azkaban.properties azkban.properties.model #复制一份,以避免出错 vim azkaban.properties
以下图,为原始的azkaban.properties文件中的内容:
下面进行内容修改:
# Azkaban Personalization Settings azkaban.name=#按规划填写 azkaban.label=#按规划填写 azkaban.color=#FF3601 azkaban.default.servlet.path=/index web.resource.dir=/opt/azkaban/azkaban-web-server-3.66.0-6-ge20c886/web/ default.timezone.id=Asia/Shanghai # Azkaban UserManager class user.manager.class=azkaban.user.XmlUserManager user.manager.xml.file=/opt/azkaban/azkaban-web-server-3.66.0-6-ge20c886/conf/azkaban-users.xml # Loader for projects executor.global.properties=conf/global.properties azkaban.project.dir=projects # Velocity dev mode velocity.dev.mode=false # Azkaban Jetty server properties. jetty.maxThreads=25 jetty.port=8081 jetty.ssl.port=8443 jetty.keystore=keystore jetty.password=azkaban jetty.keypassword=azkaban jetty.truststore=keystore jetty.trustpassword=azkaban # Project Manager settings project.temp.dir=/temp project.version.retention=3 # Azkaban Executor settings executor.port=12321 # mail settings mail.sender=xxxxx@xxx.xx mail.host=smtp.263.net mail.user=xxxx@xxx.xx mail.password=********* # 如下两项能够不填 job.failure.email= job.success.email= lockdown.create.projects=false cache.directory=cache # JMX stats jetty.connector.stats=true executor.connector.stats=true # Azkaban plugin settings azkaban.jobtype.plugin.dir=plugins/jobtypes # Azkaban mysql settings by default. Users should configure their own username and password. database.type=mysql mysql.port=3306 mysql.host=ip地址 mysql.database=azkaban66 mysql.user=azkaban mysql.password=azkaban mysql.numconnections=100 #Multiple Executor azkaban.use.multiple.executors=true azkaban.executorselector.filters=StaticRemainingFlowSize,MinimumFreeMemory,CpuStatus azkaban.executorselector.comparator.NumberOfAssignedFlowComparator=1 azkaban.executorselector.comparator.Memory=1
在web的home目录下建立文件plugins/jobtypes,命令以下:
midir –p plugins/jobtypes
添加azkaban的用户,在此文件中操做,文件原始内容以下图:
若是要添加用户,就按照<user/>的格式添加便可。
此文件和exec中的内容是同样的。
mail.sender、mail.host、mail.user、mail.password这四项每一项配置都不能少,端口能够不配置,并且mail.sender和mail.user的值是同样的,少一项或者配错一项都会报出错误,错误信息以下:
2018/12/28 15:56:01.187 +0800 ERROR [EmailMessage] [Azkaban] Connecting to SMTP server failed, attempt: 0 javax.mail.AuthenticationFailedException: 500 Error: bad syntax at com.sun.mail.smtp.SMTPTransport$Authenticator.authenticate(SMTPTransport.java:823) at com.sun.mail.smtp.SMTPTransport.authenticate(SMTPTransport.java:756) at com.sun.mail.smtp.SMTPTransport.protocolConnect(SMTPTransport.java:673) at javax.mail.Service.connect(Service.java:295) at azkaban.utils.JavaxMailSender.connect(JavaxMailSender.java:34) at azkaban.utils.EmailMessage.connectToSMTPServer(EmailMessage.java:220) at azkaban.utils.EmailMessage.retryConnectToSMTPServer(EmailMessage.java:230) at azkaban.utils.EmailMessage.sendEmail(EmailMessage.java:213) at azkaban.utils.Emailer.sendEmail(Emailer.java:220) at azkaban.utils.Emailer.alertOnSuccess(Emailer.java:153) at azkaban.executor.selector.ExecutionControllerUtils.alertUser(ExecutionControllerUtils.java:123) at azkaban.executor.ExecutionFinalizer.finalizeFlow(ExecutionFinalizer.java:98) at azkaban.executor.RunningExecutionsUpdater.updateExecutions(RunningExecutionsUpdater.java:131) at azkaban.executor.RunningExecutionsUpdaterThread.run(RunningExecutionsUpdaterThread.java:54)
在网上看到一个说这个错误信息解决方法的,要改源码,实际上是配置信息写错了。
azkaban.jobtype.plugin.dir=plugins/jobtypes这一项必定要配置,而且建立文件夹,否则会报错,错误信息以下:
2018/12/28 15:50:30.898 +0800 ERROR [FlowTriggerScheduler] [Azkaban] unable to get scheduled flow triggers java.lang.NullPointerException at azkaban.flowtrigger.quartz.FlowTriggerScheduler.getScheduledFlowTriggerJobs(FlowTriggerScheduler.java:132) at azkaban.webapp.servlet.FlowTriggerServlet.handlePage(FlowTriggerServlet.java:140) at azkaban.webapp.servlet.FlowTriggerServlet.handleGet(FlowTriggerServlet.java:55) at azkaban.webapp.servlet.LoginAbstractAzkabanServlet.doGet(LoginAbstractAzkabanServlet.java:123) at javax.servlet.http.HttpServlet.service(HttpServlet.java:668) at javax.servlet.http.HttpServlet.service(HttpServlet.java:770) at org.mortbay.jetty.servlet.ServletHolder.handle(ServletHolder.java:511) at org.mortbay.jetty.servlet.ServletHandler.handle(ServletHandler.java:401) at org.mortbay.jetty.servlet.SessionHandler.handle(SessionHandler.java:182) at org.mortbay.jetty.handler.ContextHandler.handle(ContextHandler.java:766) at org.mortbay.jetty.handler.HandlerWrapper.handle(HandlerWrapper.java:152) at org.mortbay.jetty.Server.handle(Server.java:326) at org.mortbay.jetty.HttpConnection.handleRequest(HttpConnection.java:542) at org.mortbay.jetty.HttpConnection$RequestHandler.headerComplete(HttpConnection.java:928) at org.mortbay.jetty.HttpParser.parseNext(HttpParser.java:549) at org.mortbay.jetty.HttpParser.parseAvailable(HttpParser.java:212) at org.mortbay.jetty.HttpConnection.handle(HttpConnection.java:404) at org.mortbay.jetty.bio.SocketConnector$Connection.run(SocketConnector.java:228) at org.mortbay.jetty.security.SslSocketConnector$SslConnection.run(SslSocketConnector.java:713) at org.mortbay.thread.QueuedThreadPool$PoolThread.run(QueuedThreadPool.java:582)
Multiple Executor的几项必须配置,否则的话会报出如下错误:
2018/12/28 15:43:28.406 +0800 ERROR [StdOutErrRedirect] [Azkaban] Exception in thread "main" 2018/12/28 15:43:28.406 +0800 ERROR [StdOutErrRedirect] [Azkaban] java.lang.IllegalArgumentException: azkaban.use.multiple.executors must be true. Single executor mode is not supported any more. 2018/12/28 15:43:28.407 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.ExecutorManager.checkMultiExecutorMode(ExecutorManager.java:240) 2018/12/28 15:43:28.407 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.ExecutorManager.setupExecutors(ExecutorManager.java:229) 2018/12/28 15:43:28.407 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.ExecutorManager.initialize(ExecutorManager.java:155) 2018/12/28 15:43:28.407 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.ExecutorManager.start(ExecutorManager.java:168) 2018/12/28 15:43:28.407 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.webapp.AzkabanWebServer.launch(AzkabanWebServer.java:235) 2018/12/28 15:43:28.407 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.webapp.AzkabanWebServer.main(AzkabanWebServer.java:226)
若是使用的是CDH平台安装的hadoop相关的软件,那么在启动Azkaban的时候日志第一行会出现以下的错误信息:
Error: HADOOP_HOME is not set. Hadoop job types will not run properly.
这个错误不影响Azkaban正常的执行hadoop相关的脚本。
这是由于CDH平台集成的Hadoop没有在profile中添加环境变量,这里须要在profile文件中添加两个环境变量。操做以下:
vim /etc/profile
要添加的内容以下:
export HADOOP_HOME=/opt/cloudera/parcels/CDH export HADOOP_CONF_DIR=/etc/hadoop/conf.cloudera.yarn
添加完成source,让文件生效。
source /etc/profile
以上两条变量的值是CDH的目录,填写的时候,查看一下,本身的CDH安装是不是这两个目录,若是不是,值要根据本身的目录进行修改。
而后重启Azkaban web,日志中的错误消失,取代是以下内容:
Using Hadoop from /opt/cloudera/parcels/CDH
启动命令以下:
bin/start-web.sh
在浏览器中输入:ip:8443,会出现以下图的登陆界面:
由上图能够看出,红块的地方是填写的azkaban.name和azkaban.labe两项的值,这里本人打了码,配置完成大家便可看到本身的成果。
如下是本人准备的一个简答的脚本的job文件,weather.job:
type=command command=/usr/java/default/jdk/bin/java -jar /home/script/Weather.jar failure.emails=xxx@xxx.xx success.emails=xxx@xxx.xx
上面两项邮箱相关的,一项是执行成功发送邮件,一项是执行失败发送邮件。邮箱自行填写。若是这里不填写邮箱,那么就不会给你发送执行结果。
将文件打成zip的压缩包上传到测试项目中,选择执行。
执行成功,也有邮件发送。
以上为整个Two Server模式配置的整个过程和踩过的坑。
下一遍: