TiDB 2.0 中,咱们引入了一个叫 Chunk 的数据结构用来在内存中存储内部数据,用于减少内存分配开销、下降内存占用以及实现内存使用量统计/控制,其特色以下:git
Chunk 本质上是 Column 的集合,它负责连续的在内存中存储同一列的数据,接下来咱们看看 Column 的实现。github
Column 的实现参考了 Apache Arrow,Column 的代码在 这里。根据所存储的数据类型,咱们有两种 Column:golang
Double
、Bigint
、Decimal
等Char
、Varchar
等哪些数据类型用定长 Column,哪些数据类型用变长 Column 能够看函数 addColumnByFieldType 。数据库
Column 里面的字段很是多,这里先简单介绍一下:缓存
用来表示这个 Column 有多少行数据。session
用来表示这个 Column 中有多少 NULL
数据。数据结构
用来存储这个 Column 中每一个元素是不是 NULL
,须要特殊注意的是咱们使用 0 表示 NULL
,1 表示非 NULL
,和 Apache Arrow 同样。app
存储具体的数据,无论定长仍是变长的 Column,全部的数据都存储在这个 byte slice 中。框架
给变长的 Column 使用,存储每一个数据在 data 这个 slice 中的偏移量。函数
给定长的 Column 使用,当须要读或者写一个数据的时候,使用它来辅助 encode 和 decode。
追加一个元素须要根据具体的数据类型调用具体的 append 方法,好比: appendInt64、appendString 等。
一个定长类型的 Column 能够用以下图表示:
咱们以 appendInt64 为例来看看如何追加一个定长类型的数据:
unsafe.Pointer
把要 append 的数据先复制到 elemBuf 中;上面第 1 步在 appendInt64
这个函数中完成,第 二、3 步在 finishAppendFixed 这个函数中完成。其余定长类型元素的追加操做很是类似,感兴趣的同窗能够接着看看 appendFloat32、appendTime 等函数。
而一个变长的 Column 能够用下图表示:
咱们以 appendString 为例来看看如何追加一个变长类型的数据:
上面第 1 步在 appendString 这个函数中完成,第 二、3 步在 finishAppendVar 这个函数中完成。其余边长类型元素的追加操做也是很是类似,感兴趣的同窗能够接着看看 appendBytes、appendJSON 等函数。
咱们使用 appendNull 函数来向一个 Column 中追加一个 NULL
值:
如上图所示:Chunk 中的 Row 是一个逻辑上的概念:Row 中的数据存储在 Chunk 的各个 Column 中,同一个 Row 中的数据在内存中没有连续存储在一块儿,咱们在获取一个 Row 对象的时候也不须要进行数据拷贝。提供 Row 的概念是由于算子运行过程当中,大多数状况都是以 Row 为单位访问和操做数据,好比聚合,排序等。
Row 提供了获取 Chunk 中数据的方法,好比 GetInt64、GetString、GetMyDecimal 等,前面介绍了往 Column 中 append 数据的方法,获取数据的方法能够由 append 数据的方法反推,代码也比较简单,这里就再也不详细介绍了。
目前 Chunk 这个包只对外暴露了 Chunk, Row 等接口,而没有暴露 Column,因此,写数据调用的是在 Chunk 上实现的对 Column 具体函数的 warpper,好比 AppendInt64;读数据调用的是在 Row 上实现的 Getxxx 函数,好比 GetInt64。
在重构前,TiDB 1.0 中使用的执行框架会不断调用 Child 的 Next 函数获取一个由 Datum 组成的 Row(和刚才介绍的 Chunk Row 是两个数据结构),这种执行方式的特色是:每次函数调用只返回一行数据,且不论是什么类型的数据都用 Datum 这个结构体来封装。
这种方法的优势是:简单、易用。缺点是:
在重构后,TiDB 2.0 中使用的执行框架会不断调用 Child 的 NextChunk 函数,获取一个 Chunk 的数据。
这种执行方式的特色是:
tidb_max_chunk_size
的 session 变量来控制,默认是 1024 行。由于 TiDB 是一个混合 TP 和 AP 的数据库,对于 AP 类型的查询来讲,由于计算的数据量大,1024 没啥问题,可是对于 TP 请求来讲,计算的数据量可能比较少,直接在一开始就分配 1024 行的内存并非最佳的实践( 这里 有个 github issue 讨论这个问题,欢迎感兴趣的同窗来讨论和解决)。这种执行方式的好处是:
采用了新的执行框架后,OLAP 类型语句的执行速度、内存使用效率都有极大提高,从 TPC-H 对比结果 看,性能有数量级的提高。
做者:张建