使用ConstructR启动akka集群node
akka集群有两种启动方式。一种是手动加入节点(在akka中节点叫作Node); 另外一种是经过在配置中指定seed node。seed node是集群的通讯节点,用来进行集群的建立和选举。一般咱们会在配置文件中配置一系列的seed node,当新的节点想要加入集群时,只要与其中任何一个取得通讯便可。须要注意,当启动第一个节点时,这个节点必定要配置在seed node第一个位置。git
在继续下文以前先介绍一下咱们目前的服务状况。咱们有三台WEB Server,这三台server挂在Amazon的ELB上。这三台server都是无状态的。项目部署使用code deploy,因为三台server都是无状态的,因此部署很是简单。从ELB任意摘下一台server,重启,而后再挂到ELB。github
当咱们尝试引入akka cluster到项目中时,现有的无状态部署方式便再也不适用了。首先咱们最初的指望是引入集群但尽可能少带来项目启动的复杂性。手动加入节点的方式被淘汰。而使用seed node现有部署脚本就要改。由于seed node决定了必定要有一台服务器优先启动。redis
纠结了一段时间后,想到一个解决方案。借助redis来启动集群。redis能够作两件事情,分布式锁和存储seed node。分布式锁的意义在于防止多台server同时启动形成cluster分裂。这个方案具体细节是:当节点启动时,首先问redis是否已有启动节点,若是没有则以本身为seed node建立集群;若是已有seed,则加入集群。这看起来是一个可行的方案。在写第一行代码以前,本着不重复造轮子的原则,去Google groups search了一下,找到了constructR这个工具。服务器
当我看了它的介绍以后发现和咱们方案的核心思路是同样的,可是constructR实现的更精细一些。它抽象出一个状态机用于控制集群启动是状态的流转。我直接盗图了:
<image w=800 h=470 describe= name=Notes_1483621897775.png>maven
在状态流转的过程当中,任何一步出现异常都会停掉当前actor system。ConstructR官方给出的底层存储是etcd,可是也有consul,redis,和zookeeper的实现。分布式
ConstructR的使用也很是简单:第一步添加依赖,第二步添加ConstructR akka的扩展,第三步配置ConstructR。官方文档已经提供了很是完整的基于etcd和sbt的配置,下边我列出我基于redis和gradle的配置:工具
// dependency repositories { jcenter() mavenCentral() maven { url "https://dl.bintray.com/everpeace/maven/" } } dependencies { compile('de.heikoseeberger:constructr-akka_2.11:0.13.2') compile('com.github.everpeace:constructr-coordination-redis_2.11:0.0.1') } // add constructr extension for akka akka.extensions = [ "de.heikoseeberger.constructr.akka.ConstructrExtension" ] // constructr conf redis { host = "localhost" port = 6379 db = 5 } constructr { coordination { class-name = "com.github.everpeace.constructr.coordination.redis.RedisCoordination" host = ${redis.host} port = ${redis.port} redis { db = ${redis.db} } } coordination-timeout = 3 seconds // Maximum response time for coordination service (e.g. etcd) join-timeout = 15 seconds // Might depend on cluster size and network properties max-nr-of-seed-nodes = 0 // Any nonpositive value means Int.MaxValue nr-of-retries = 2 // Nr. of tries are nr. of retries + 1 refresh-interval = 30 seconds // TTL is refresh-interval * ttl-factor retry-delay = 3 seconds // Give coordination service (e.g. etcd) some delay before retrying ttl-factor = 2.0 // Must be greater or equal 1 + ((coordination-timeout * (1 + nr-of-retries) + retry-delay * nr-of-retries)/ refresh-interval)! }
write on 2017-1-5gradle