摘要:
2017云栖大会Hbase专场,阿里巴巴的天穆带来Ali-HBase的SQL实践与改进的演讲。本文主要从为何须要SQL开始谈起,进而讲解了SQL on Hbase,接着着重分享了Ali-Hbase SQL的优化与改进,最后对将来进行了展望。服务器
PPT下载请点击分布式
时间序列数据的存取:按照时间顺序追加新记录,按照时间范围查询数据,查询结果按时间倒排。咱们数据是按照时间产生的,最新写的数据必定写在表头,在分布式状况下全部操做都落在表头,则表头所在的服务器必然会成为写热点。优化
解决写热点问题就是打散、随机分布,使得任何一行数据都能分布在表的一个随机位置。这带来一个新的问题,数据再也不有序,没法按时间进行范围查询。spa