storm源码阅读笔记之任务调度算法

时间 2019-11-17

标签 storm 源码阅读笔记任务调度算法栏目 Storm 繁體版

原文原文链接

3种Scheduler概述

EventScheduler：将系统中的可用资源均匀地分配给须要资源的topology，其实也不是绝对均匀，后续会详细说明
DefaultScheduler：和EvenetScheduler差很少，只不过会先将其它topology不须要的资源从新收集起来，再进行EventScheduler
IsolationScheduler：用户可定义这个topology的机器资源，storm分配的时候会优先分配这些topology，以保证分配给该topology的机器只为这一个topology服务

主要流程梳理：得到当前集群空闲资源->计算当前topology的executor信息（分配时会用得上）->计算可从新分配和可释放的资源->分配node

EventScheduler调度算法与Default相比少了一个计算可从新分配资源的环节，直接利用Supervisor中空闲的slot进行分配，在此再也不细讲。算法

这两种调度机制在通常状况下调度结果基本保持一致，因此一块儿来看：spa

集群初始状态code

接下来咱们提交3个topologyorm

sort-slots算法对可用slots进行处理，结果为{[s1 6700] [s2 6700] [s3 6700] [s4 6700] [s1 6701] [s2 6701] [s3 6701] [s4 6701] [s1 6702] [s2 6702] [s3 6702] [s4 6702] [s1 6703] [s2 6703] [s3 6703] [s4 6703]}
compute-executors算法计算后获得的Executor列表为：{[1 2] [3 4] [5 6] [7 8] [9 10] [11 12] [13 14] [15 16]}；注：格式为[start-task-id end-task-id]，共8个worker，第一个包含2个task，start-task-id为1，end-task-id为2，因此记为[1 2]，后面依次类推...compute-executors算法会在下一篇博客中详解
8个Executor在3个worker上的分布状态为[3，3，2]
分配结果为：
- {[1 2] [3 4] [5 6]} -> [s1 6700]
- {[7 8] [9 10] [11 12]} -> [s2 6700]
- {[13 14] [15 16]} -> [s3 6700]

分配后集群状态为：

可用的slot通过sort-slots后：{[s1 6701] [s2 6701] [s3 6701] [s4 6700] [s1 6702] [s2 6702] [s3 6702] [s4 6701] [s1 6703] [s2 6703] [s3 6703] [s4 6702] [s4 6703]}
comput-executors计算后获得的executor列表：{[1 1] [2 2] [3 3] [4 4] [5 5] [6 6] [7 7] [8 8] [9 9] [10 10]}
10个executor在5个worker上的分布为[2，2，2，2，2]
分配结果为：
- {[1 1] [2 2]} -> [s1 6701]
- {[3 3] [4 4]} -> [s2 6701]
- {[5 5] [6 6]} -> [s3 6701]
- {[7 7] [8 8]} -> [s4 6700]
- {[9 9] [10 10]} -> [s1 6702]

分配后集群状态为：

sort-slots后slot列表为：{[s1 6703] [s2 6702] [s3 6702] [s4 6701] [s2 6703] [s3 6703] [s4 6702] [s2 6704] [s3 6704] [s4 6703] [s4 6704]}
compute-executors后获得的executor列表为：{[1 2] [3 4] [5 6] [7 8] [9 10]}
5个executor在3个worker上的分布为：[2,2,1]
分配结果为：
- {[1 2] [3 4]} -> [s1 6703]
- {[5 6] [7 8]} -> [s2 6702]
- [9 10] -> [s3 6702]

分配后集群状态为：

如图，此任务调度方式也不是绝对均匀的，s1已经满负荷运转，而s4才刚使用一个slots。