TiDB Hackathon 2018 共评选出六组优秀项目,本系列文章将由这六组项目的成员主笔,分享他们的参赛经验和成果。咱们很是但愿本届 Hackathon 诞生的优秀项目可以在社区中延续下去,感兴趣的小伙伴们能够加入进来哦~mysql
本文做者是来自 DSG 团队的杨文同窗,他们的项目《天真贝叶斯学习机》在本届 Hackathon 中得到了三等奖+最佳创意奖。git
“在 TiDB Hackathon 2018 学习到很多东西,但愿明年再来”github
“pd ctl 天真学习机”算法
具体作法:用 naive bayes 模型来根据系统指标和人的 pd ctl 调用,来获得一个模型去根据系统指标去自动提供 pd ctl 调用的命令。sql
贝叶斯模型能够用来干这种事:json
好比一个妈妈根据天气预报来跟儿子在出们的时候叮嘱:bootstrap
天气预报[ 晴, 温度: 28, 风力: 中 ], 妈妈会说 [好好玩]
天气预报[ 雨, 温度: 15, 风力: 低 ], 妈妈会说 [带上伞]
天气预报[ 阴, 温度: 02, 风力: 大 ], 妈妈会说 [多穿点]...
复制代码
把这些输入输入到贝叶斯模型里之后, 模型能够根据天气预报来输出:bash
天气预报[ 晴, 温度: 00, 风力中], 模型会说 [ 多穿点:0.7, 好好玩0.2, 带上伞0.1]
天气预报[ 雨, 温度: 10, 风力大], 模型会说 [ 带上伞:0.8, 多穿点0.1, 好好玩0.1]
复制代码
这样经过一个妈妈的叮嘱就能够训练出一个也会根据天气预报给出叮嘱的模型。服务器
咱们能够把一个模型单独的部署在一个 pod 里, 暴露一个 service ,而后集群上每次有人去调用 pd_ctl 的时候就在后台用 rest call 到模型服务上记录一下操做(叮嘱)和当前的系统指标(比如天气预报). 这样慢慢用一段时间之后,积累的操做多了之后,就能够打开某个自动响应,或者打开自动建议应该执行的命令的功能。网络
这样模型能够在某一组系统指标出现以前相似学习过的状态以后,给出相应的建议,当这些建议都很正确的时候直接让 pd 直接采纳,彻底智能的自动化运做。
在跟导师交流探讨后发现,目前 PD 已经比较自动化了,不多须要人为介入进行操做,须要的时候也是比较复杂的场景,或者自动化运做比较慢的场景。
咱们团队在跟多名导师的沟通交流下,将初步想法进行了一些调整:
从热点调度策略入手,用热点调度策略的数值去用 naive bayes 模型去训练他们,而后再根据这些数值再去模型中去获取建议值。
统计建议值和热点调度策略进行比较;(从开始的测试结果来看,大概有 70% 匹配,可是咱们实测发现,使用咱们模型的建议值去真正的调度,热点 region 仍是很是均衡的)
三组对照试验:不进行调度,只打印调度数据;正常使用原来的热点调度策略;使用原来的热点调度策略的数值,可是使用模型训练的建议值进行实际调度;
首先,介绍一下咱们团队(DSG),分别来自:丹麦、北京(山西)、广州。
D 先生是在比赛前一天早上到达北京的,我是比赛前一天晚上从广州出发,于比赛当日早上 6:38 才抵达北京的。
说实话,时差和疲惫对于参赛仍是有一点影响的。
废话很少说,我就来回顾一下个人整个参胜过程。
彻底参考文档
测试 TiDB 集群,可能遇到的坑(MySQL 8 client On MacOSX):
mysql client connect : Unknown charset 255 (MySQL 8 Client 不支持字符集,须要指定默认字符集为 UTF8)
mysql -hx.x.x.x --default-character-set utf8
/model/service1
PUT 上报数据:{
"updates": [
[
"transfer leader from store 7 to store 2",
[
{
"feature_type": "Category",
"name": "hotRegionsCount1",
"value": "true"
},
{
"feature_type": "Category",
"name": "minRegionsCount1",
"value": "true"
},
{
"feature_type": "Category",
"name": "hotRegionsCount2",
"value": "true"
},
{
"feature_type": "Category",
"name": "minRegionsCount2",
"value": "true"
},
{
"feature_type": "Category",
"name": "srcRegion",
"value": "7"
}
]
],
]}
复制代码
/model/service1
POST 获取模型结果: 输入参数:上报的参数{
"predictions": [
{
"transfer leader from store 1 to store 2": 0.27432775221072137,
"transfer leader from store 1 to store 7": 0.6209064350448428,
"transfer leader from store 2 to store 1": 0.024587894827775753,
"transfer leader from store 2 to store 7": 0.01862719305134528,
"transfer leader from store 7 to store 1": 0.02591609468013258,
"transfer leader from store 7 to store 2": 0.03563463018518229
}
]}
复制代码
首先将 pd-server 替换到集群所在 ansible/resources/bin
目录下,那如何让集群上的 PD 更新生效呢?
更新:
$ ansible-playbook rolling_update.yml --tags=pd
复制代码
在实操过程当中, 若是你在更新到一半的时候就关门了,可能会致使整个 PD 挂掉(非集群环境),多是由于逻辑不严谨所致使的问题
直接中止了 ansible,致使 PD 集群机器节点有中止的状况,这个时候你能够经过如下命令启动它。
启动:
$ ansible-playbook start.yml --tags=pd
复制代码
你们都觉得能够经过配置来解决:(调度开关方法: 用 config set xxx 0 来关闭调度)
配置以下:(虽然找的地方错误了,可是错打错着,咱们来到了 Demo Time:
config set leader-schedule-limit 0
config set region-schedule-limit 0
scheduler add hot-region-scheduler
config show
config set leader-schedule-limit 4
config set region-schedule-limit 8
复制代码
实测发现,根本不生效,必需要改源代码。
func (h *balanceHotRegionsScheduler) dispatch(typ BalanceType, cluster schedule.Cluster) []*schedule.Operator {
h.Lock()
defer h.Unlock()
switch typ {
case hotReadRegionBalance:
h.stats.readStatAsLeader = h.calcScore(cluster.RegionReadStats(), cluster, core.LeaderKind)
// return h.balanceHotReadRegions(cluster) // 将这一行注释
case hotWriteRegionBalance:
h.stats.writeStatAsLeader = h.calcScore(cluster.RegionWriteStats(), cluster, core.LeaderKind)
h.stats.writeStatAsPeer = h.calcScore(cluster.RegionWriteStats(), cluster, core.RegionKind)
// return h.balanceHotWriteRegions(cluster) // 将这一行注释
}
return nil
}
复制代码
可是,咱们要的不是不调度,而只是不给调度结果:
func (h *balanceHotRegionsScheduler) balanceHotReadRegions(cluster schedule.Cluster) []*schedule.Operator {
// balance by leader
srcRegion, newLeader := h.balanceByLeader(cluster, h.stats.readStatAsLeader)
if srcRegion != nil {
schedulerCounter.WithLabelValues(h.GetName(), "move_leader").Inc()
// step := schedule.TransferLeader{FromStore: srcRegion.GetLeader().GetStoreId(), ToStore: newLeader.GetStoreId()} // 修改成不返回值或者返回 _
_ = schedule.TransferLeader{FromStore: srcRegion.GetLeader().GetStoreId(), ToStore: newLeader.GetStoreId()}
// return []*schedule.Operator{schedule.NewOperator("transferHotReadLeader", srcRegion.GetID(), srcRegion.GetRegionEpoch(), schedule.OpHotRegion|schedule.OpLeader, step)} // 注释这一行,并 return nil
return nil
}
// balance by peer
srcRegion, srcPeer, destPeer := h.balanceByPeer(cluster, h.stats.readStatAsLeader)
if srcRegion != nil {
schedulerCounter.WithLabelValues(h.GetName(), "move_peer").Inc()
return []*schedule.Operator{schedule.CreateMovePeerOperator("moveHotReadRegion", cluster, srcRegion, schedule.OpHotRegion, srcPeer.GetStoreId(), destPeer.GetStoreId(), destPeer.GetId())}
}
schedulerCounter.WithLabelValues(h.GetName(), "skip").Inc()
return nil
}
......
func (h *balanceHotRegionsScheduler) balanceHotWriteRegions(cluster schedule.Cluster) []*schedule.Operator {
for i := 0; i < balanceHotRetryLimit; i++ {
switch h.r.Int() % 2 {
case 0:
// balance by peer
srcRegion, srcPeer, destPeer := h.balanceByPeer(cluster, h.stats.writeStatAsPeer)
if srcRegion != nil {
schedulerCounter.WithLabelValues(h.GetName(), "move_peer").Inc()
fmt.Println(srcRegion, srcPeer, destPeer)
// return []*schedule.Operator{schedule.CreateMovePeerOperator("moveHotWriteRegion", cluster, srcRegion, schedule.OpHotRegion, srcPeer.GetStoreId(), destPeer.GetStoreId(), destPeer.GetId())} // 注释这一行,并 return nil
return nil
}
case 1:
// balance by leader
srcRegion, newLeader := h.balanceByLeader(cluster, h.stats.writeStatAsLeader)
if srcRegion != nil {
schedulerCounter.WithLabelValues(h.GetName(), "move_leader").Inc()
// step := schedule.TransferLeader{FromStore: srcRegion.GetLeader().GetStoreId(), ToStore: newLeader.GetStoreId()} // 修改成不返回值或者返回 _
_ = schedule.TransferLeader{FromStore: srcRegion.GetLeader().GetStoreId(), ToStore: newLeader.GetStoreId()}
// return []*schedule.Operator{schedule.NewOperator("transferHotWriteLeader", srcRegion.GetID(), srcRegion.GetRegionEpoch(), schedule.OpHotRegion|schedule.OpLeader, step)} // 注释这一行,并 return nil
return nil
}
}
}
schedulerCounter.WithLabelValues(h.GetName(), "skip").Inc()
return nil
}
复制代码
当修改了 PD 再从新编译获得 pd-server,将其放到
tidb-ansible/resources/bin/pd-server
并替换原来的文件,而后执行
ansible-playbook rolling_update.yml --tags=pd
,便可重启 pd-server 服务。
在调优的过程当中发现,当前 hot-region-scheduler
的调度时对于目标机器的选择并非最优的,代码以下:
简述:循环遍历 candidateStoreIDs 的时候,若是知足条件有多台,那么最后一个总会覆盖前面已经存储到 destStoreID 里面的数据,最终咱们拿到的 destStoreID 有可能不是最优的。
// selectDestStore selects a target store to hold the region of the source region.
// We choose a target store based on the hot region number and flow bytes of this store.
func (h *balanceHotRegionsScheduler) selectDestStore(candidateStoreIDs []uint64, regionFlowBytes uint64, srcStoreID uint64, storesStat core.StoreHotRegionsStat) (destStoreID uint64) {
sr := storesStat[srcStoreID]
srcFlowBytes := sr.TotalFlowBytes
srcHotRegionsCount := sr.RegionsStat.Len()
var (
minFlowBytes uint64 = math.MaxUint64
minRegionsCount = int(math.MaxInt32)
)
for _, storeID := range candidateStoreIDs {
if s, ok := storesStat[storeID]; ok {
if srcHotRegionsCount-s.RegionsStat.Len() > 1 && minRegionsCount > s.RegionsStat.Len() {
destStoreID = storeID
minFlowBytes = s.TotalFlowBytes
minRegionsCount = s.RegionsStat.Len()
continue // 这里
}
if minRegionsCount == s.RegionsStat.Len() && minFlowBytes > s.TotalFlowBytes &&
uint64(float64(srcFlowBytes)*hotRegionScheduleFactor) > s.TotalFlowBytes+2*regionFlowBytes {
minFlowBytes = s.TotalFlowBytes
destStoreID = storeID
}
} else {
destStoreID = storeID
return
}
}
return
}
复制代码
本次咱们只 hack 验证了 Write Region Leader 这部分,因此咱们重点关注一下监控和问题:
监控数据有必定的延时(粗略估计1-2分钟)
修改 tidb-bench 的 Makefile#load
模块对应的主机地址,而后执行 make tbl, make load
便可往服务器 load 数据了。
注意,这里你也须要进行一些配置修改:
--default-character-set utf8
犯的错:受限于本地-服务器间网络带宽,导入数据很慢。
$ ./go-ycsb run mysql -p mysql.host=10.9.x.x -p mysql.port=4000 -p mysql.db=test1 -P workloads/workloada
复制代码
注:go-ycsb
支持 insert,也支持 update,你能够根据你的须要进行相对应的调整 workloada#recordcount
和 workloada#operationcount
参数。
rust 一天速成……
Demo Time 的时候听好几个团队都说失败了。我之前也尝试过,可是被编译的速度以及耗能给击败了。
环境均可以把你 de 自信心击溃。
rustup install nightly
cargo run
...
复制代码
Mac 本地打包 Linux 失败:缺乏 std 库,经过 Docker 临时解决。
从比赛一开始,导师团就很是积极和主动,直接去每一个项目组,给予直接指导和建议,咱们遇到问题去找导师时,他们也很是的配合。
导师不只帮咱们解决问题(特别是热点数据构建,包括对于代码级别的指导),还跟咱们一块儿探讨课题方向和实际可操做性,以及能够达到的目标。
很是感谢!!!
咱们的准备和主动性真的不足,值得反思--也但愿你们之后不要怕麻烦,有问题就大胆的去问。
整个 Demo show 进行的很是顺利,为每个团队点赞!
不少团队的做品都让人尖叫,可想而知他们的做品是多么的酷炫和牛逼,印象中只有一个团队在 Demo 环境出现了演示时程序崩溃的问题(用Java Netty 基于 TiKV 作的 memcache(实现了大部分的协议))。
遗憾!!!
咱们 DSG 团队荣获三等奖+最佳创意两项大奖,可是很遗憾我未能跟团队一块儿分享这一刻。
由于我要赶着去火车站,因此在周日下午6点的时候,我跟队友和一些朋友作别后,我就去火车站了,后面几组的 Demo Show 也很很是遗憾未能参加。
得奖感言:
谢谢 DSG 团队,谢谢导师,谢谢评委老师,谢谢 PingCAP 给你们筹备了这么好的一次黑客马拉松比赛活动。
本次比赛的各个方面都作的完美,除了网络。
环境(必定要提早准备)----此次被坑了很多时间和精力;
配置文档中有一些注意事项,必定要认真阅读:ext4 必需要每台机器都更新;
[10.9.97.254]: Ansible FAILED! => playbook: bootstrap.yml; TASK: check_system_optional : Preflight check - Check TiDB server's RAM; message: {"changed": false, "msg": "This machine does not have sufficient RAM to run TiDB, at least 16000 MB."} - 内存不足的问题
能够在执行的时候增长参数来避免
ansible-playbook bootstrap.yml --extra-vars "dev_mode=True"
ansible-playbook unsafe_cleanup_data.yml
(https://github.com/pingcap/docs/blob/master/op-guide/ansible-operation.md)
后续杨文同窗会在 我的博客 中更新更多项目细节。