分库分表,顾名思义就是把本来存储于一个库的数据分块存储到多个库上,把本来存储于一个表的数据分块存储到多个表上。那么关于分库分表,你了解多少呢?接下来,咱们将从什么是数据分片及如何进行分片两方面对DDM分库分表作一个阐释。html
什么是数据分片数据库
分片是解决数据库存储容量限制的直接途径。分片包括垂直分片与水平分片两种方式。架构
垂直分片并发
垂直分片又叫纵向分割,即以逻辑表为单位,把原有数据库切分红多个数据库。切分后不一样的表存储在不一样的数据库上。运维
垂直分片与业务架构设计有密切的联系。好比从业务领域对系统进行架构优化,分红多个子业务系统,各个子业务系统耦合度较低。子业务系统间以接口方式进行数据通讯和数据交换。分布式
垂直拆分后业务清晰,拆分规则明确,系统之间容易整合与扩展。通常用于数据库上层架构设计。高并发
垂直分片示意图 性能
水平分片大数据
水平分片又叫横向分割,即以逻辑表中的数据行记录为单位,把原有逻辑数据库切分红多个物理数据库分片,表数据记录分布存储在各个分片上。优化
水平分片主要用业务架构没法继续细分,而数据库中单张表数据量太大,查询性能降低的场景。经过水平分片,即解决单库容量问题,同时提升并发查询性能。
水平分片示意图
DDM实现了自动水平分片,应用无需关心某个数据该存储在哪一块分片上。
对逻辑表水平分片须要依据必定的分片规则,例如一个订单跟踪系统,咱们选取订单号(OrderId)做为拆分键,分别对“订单流水表”、“订单详情表”以及“物流跟踪表”进行水平拆分,拆分规则为对键值Hash后求模,则分片计算规则以下:
H(Key(OrderId)) = Hash(Key(OrderId))%N
其中,N表示一共有N个数据分片,H(Key(OrderId))表示该订单通过订单号Hash并求模后存储的分片编号。
分片后数据存储示意图
如何进行分片
在分布式数据库中,能够经过分库分表存储方式,轻松解决大数据量单表容量达到单机数据库存储上线的瓶颈。可是分库存储后,须要尽可能避免跨库JOIN操做带来的性能与资源消耗问题。
所以建立逻辑库和逻辑表时,须要根据实际状况肯定:
一、逻辑表分不分片?
DDM逻辑表支持全局表、分片表、单表三种类型。用户能够按照数据表的实际使用需求,选择最合适的逻辑表类型建立。
单表只在第一个分片建立表以及存储数据,全局表在每个分片建立表而且存储全量数据。分片表在每个分片建立表,数据按照拆分规则分散存储在分片中。
二、按什么规则分?
逻辑表的拆分键选择很是重要。建议按实际业务场景选择拆分键,不一样逻辑表,若是具备E-R关系,建议选择相同字段作拆分键,避免跨库JOIN操做。
在实际使用中,有如下建议供参考:
数据量在1000万如下的表,不建议分片。经过创建合适的索引,采起读写分离策略,单表也能够很好的解决性能问题。
数据量在1000万以上的表,建议分片。将数据分片存储后,既能解决单张表容量过大带来的性能瓶颈,同时提升并发支持。注意要选择合适的拆分键,提早作好规划。
业务读取尽可能少用多表JOIN,同一个事务避免跨分片。查询条件尽可能带上拆分键,避免全分片表扫描。
数据库中间件DDM将底层数据库存储引擎以集群方式管理起来,用户使用很是方便。应用程序不须要关心具体有多少分片。相似操做单机数据库,用户经过DDM管理控制台进行数据库运维,使用JDBC等驱动服务或SQL客户端链接数据库,进行数据读写。想要了解更多,欢迎点击分布式数据库中间件DDM查看。