分布式 | MyCat如何迁移到DBLE之分片算法对比解析:patternrange分片

原创做者: 钟悦算法


关于做者架构

钟 悦  -  资深DBLE用户运维

某宇宙行资深架构师,在大型重点项目中使用 DBLE。spa

常年与 MySQL 纠缠不清,常常运用技术处理大企业病的技术or非技术问题的一个挨踢从业者。code

 

与 hash 算法的最终效果同样,这个算法也是先求模获得逻辑分片号,再根据逻辑分片号直接映射到物理分片的一种散列算法。xml

1. 用户须要在 rule.xml 中给出 patternValue 来定义逻辑分片数量中间件

2. 在 DBLE 的启动阶段,读取用户在 rule.xml 中给出的 mapFile,获得逻辑分片到物理分片的映射表blog

3. 在 DBLE 的运行过程当中,用户访问使用这个算法的表时,WHERE 子句中的分片索引值会被提取出来进行求模,获得逻辑分片号排序

4. 再根据逻辑分片号,查映射表,直接获得物理分片号索引

 

与MyCat的相似分片算法对比

中间件 DBLE MyCat
分片算法种类 patternrange 分区算法 取模范围约束

两种中间件的取模范围分片算法使用上无差异

 

开发注意点

【分片索引】1. 必须是整型数字或整型数字的字符串(能够为负数)

【分片索引】2. 最大物理分片配置方法是,在 mapFile 文件中,为每个逻辑分片指定单独的物理分片

例如:

0=0
1=1
...

【分片索引】3.  最小物理分片配置方法是,在 mapFile 文件中,为全部逻辑分片指定同一个物理分片

例如:

0-<逻辑分片数量>=0

【数据分布】1. 与分片索引值相关而与 INSERT 前后无相关性,因此在直接使用时没法保证数据分布均匀,但若是分片索引自己连续递增(交易流水号等),则能够期待数据分布较为平均,但反作用会致使范围语句

例如

SELECT ... WHERE shard_key BETWEEN 1 AND 100

变成跨分片查询

 

运维注意点

【扩容】1. 预先过量分片,而且不改变 patternValue,能够避免数据再平衡,只需进行涉及数据的迁移

【扩容】2. 若须要改变 patternValue,须要数据再平衡

【缩容】1. 预先过量分片,而且不改变 patternValue,能够避免数据再平衡,只需进行涉及数据的迁移

【缩容】2. 若须要改变 patternValue,须要数据再平衡

 

配置注意点

【配置项】1. 在 rule.xml 中,可配置项为 <property name="patternValue"> <property name="mapFile"><property name="defaultNode">

【配置项】2. 在 rule.xml 中配置 <property name="defaultNode"> 标签,非必须配置项,不配置该项的话,用户的分片索引值没落在 mapFile 定义的范围时,DBLE 会报错; 若须要配置,必须为非负整数,用户的分片索引值没落在 mapFile定义 的范围时,DBLE 会路由至这个值的 MySQL 分片

【配置项】3. 在 rule.xml 中配置 <property name="mapFile"> 标签,范围映射文件的路径:若在映射文件在 DBLE_HOME/conf 或其中,则可使用相对路径的形式配置,例如,映射文件是 DBLE_HOME/conf/map/table_map.txt 时,配置值就能够简写为 map/table_map.txt;映射文件在 DBLE_HOME/conf 目录之外时,须要使用绝对路径,但这种作法须要考虑用户权限等问题,所以不建议把映射文件放在 DBLE_HOME/conf 外。

【配置项】4. 编辑 mapFile 所配置的文件

记录格式为:<逻辑分片范围的最小值>-<逻辑分片范围的最大值>=<物理分片编号>

逻辑分片范围的最小值和逻辑分片范围的最大值必须是整型数字,取值范围为 Java 的长整型范围内,物理分片编号必须是非负整型数字,记录之间以换行分隔,一行仅能有一条记录,容许以 “//” 和 “#” 在行首来注释该行

【配置项】5. 读取 mapFile 时,DBLE 不会对其中的范围记录查重,也不会检查范围最小值和范围最大值相互之间谁更大

【配置项】6. mapFile 中逻辑分片范围的最小值很是重要,DBLE 读取 mapFile 时会对范围进行基于逻辑分片范围的最小值的插入排序,目前的最佳实践是人手确保范围与范围之间没有重叠

相关文章
相关标签/搜索