原创做者: 钟悦算法
关于做者架构
钟 悦 - 资深DBLE用户运维
某宇宙行资深架构师,在大型重点项目中使用 DBLE。spa
常年与 MySQL 纠缠不清,常常运用技术处理大企业病的技术or非技术问题的一个挨踢从业者。code
与 hash 算法的最终效果同样,这个算法也是先求模获得逻辑分片号,再根据逻辑分片号直接映射到物理分片的一种散列算法。xml
1. 用户须要在 rule.xml 中给出 patternValue 来定义逻辑分片数量中间件
2. 在 DBLE 的启动阶段,读取用户在 rule.xml 中给出的 mapFile,获得逻辑分片到物理分片的映射表blog
3. 在 DBLE 的运行过程当中,用户访问使用这个算法的表时,WHERE 子句中的分片索引值会被提取出来进行求模,获得逻辑分片号排序
4. 再根据逻辑分片号,查映射表,直接获得物理分片号索引
与MyCat的相似分片算法对比
中间件 | DBLE | MyCat |
---|---|---|
分片算法种类 | patternrange 分区算法 | 取模范围约束 |
两种中间件的取模范围分片算法使用上无差异
开发注意点
【分片索引】1. 必须是整型数字或整型数字的字符串(能够为负数)
【分片索引】2. 最大物理分片配置方法是,在 mapFile 文件中,为每个逻辑分片指定单独的物理分片
例如:
0=0 1=1 ...
【分片索引】3. 最小物理分片配置方法是,在 mapFile 文件中,为全部逻辑分片指定同一个物理分片
例如:
0-<逻辑分片数量>=0
【数据分布】1. 与分片索引值相关而与 INSERT 前后无相关性,因此在直接使用时没法保证数据分布均匀,但若是分片索引自己连续递增(交易流水号等),则能够期待数据分布较为平均,但反作用会致使范围语句
例如
SELECT ... WHERE shard_key BETWEEN 1 AND 100
变成跨分片查询
运维注意点
【扩容】1. 预先过量分片,而且不改变 patternValue,能够避免数据再平衡,只需进行涉及数据的迁移
【扩容】2. 若须要改变 patternValue,须要数据再平衡
【缩容】1. 预先过量分片,而且不改变 patternValue,能够避免数据再平衡,只需进行涉及数据的迁移
【缩容】2. 若须要改变 patternValue,须要数据再平衡
配置注意点
【配置项】1. 在 rule.xml 中,可配置项为 <property name="patternValue"> 和 <property name="mapFile"> 和 <property name="defaultNode">
【配置项】2. 在 rule.xml 中配置 <property name="defaultNode"> 标签,非必须配置项,不配置该项的话,用户的分片索引值没落在 mapFile 定义的范围时,DBLE 会报错; 若须要配置,必须为非负整数,用户的分片索引值没落在 mapFile定义 的范围时,DBLE 会路由至这个值的 MySQL 分片
【配置项】3. 在 rule.xml 中配置 <property name="mapFile"> 标签,范围映射文件的路径:若在映射文件在 DBLE_HOME/conf 或其中,则可使用相对路径的形式配置,例如,映射文件是 DBLE_HOME/conf/map/table_map.txt 时,配置值就能够简写为 map/table_map.txt;映射文件在 DBLE_HOME/conf 目录之外时,须要使用绝对路径,但这种作法须要考虑用户权限等问题,所以不建议把映射文件放在 DBLE_HOME/conf 外。
【配置项】4. 编辑 mapFile 所配置的文件
记录格式为:<逻辑分片范围的最小值>-<逻辑分片范围的最大值>=<物理分片编号>
逻辑分片范围的最小值和逻辑分片范围的最大值必须是整型数字,取值范围为 Java 的长整型范围内,物理分片编号必须是非负整型数字,记录之间以换行分隔,一行仅能有一条记录,容许以 “//” 和 “#” 在行首来注释该行
【配置项】5. 读取 mapFile 时,DBLE 不会对其中的范围记录查重,也不会检查范围最小值和范围最大值相互之间谁更大
【配置项】6. mapFile 中逻辑分片范围的最小值很是重要,DBLE 读取 mapFile 时会对范围进行基于逻辑分片范围的最小值的插入排序,目前的最佳实践是人手确保范围与范围之间没有重叠