将来数据库应具有什么核心能力?

上周六,咱们开启了 The Future of Database 系列 的第一期直播,我司 CTO 黄东旭及 Engineering VP 申砾畅聊了“将来的数据库会是什么样?”这个颇具想象力的话题。

如下是第一期直播的部分文字&视频回顾 Enjoy ~数据库

视频连接https://www.bilibili.com/vide...后端

目前业界数据存储方案存在的问题?

  • 受限的 Scale 能力

    分库分表和一些「伪分库分表」的方案,仍然有天花板,带来了额外的运维和消耗。缓存

  • 碎片化

    回想一下最近几年后端的技术栈,有 NoSQL、缓存、Kafka、 离线数据仓库、Hadoop、HBase……不一样的工具可能面对的是某些特定、甚至「狭窄」的场景,为了应对一个复杂的业务,你们必然就要多种技术方案组合来覆盖全部的应用场景。这个过程当中天然会产生「数据孤岛」,打通孤岛的成本也是巨大的,Kafka 最近几年这么火也是正由于存储方案的多样致使的「数据孤岛」的问题正在显现。服务器

  • 在线业务与分析脱节

    如今你们构建存储系统的时候,默认会让在线业务与离线业务是分开的, 在线业务用 MySQL、MongoDB 等等,离线业务(或者分析系统)用 Hadoop 作数据分析,好像你们都是理所固然的认为:在线和离线就该这样,泾渭分明。less

    但目前有个趋势,分析的场景的需求愈来愈「实时」,或者说高时效的数据分析带来的业务价值受到重视,这就与你们惯性认知产生了本质的冲突:业务须要当日甚至实时的数据分析结果,但后端只能说今天的数据明天才能导出。还有一个问题是,各个部分维护团队也是分开的,当业务发生变化时,很难灵活地调整和适应。运维

致使以上这些问题出现的深层共性是:变化永远比计划快,你永远无法预测将来须要多少机器?业务会膨胀到多大?到底须要多“实时”的数据来作决策?ide

有没有可能存在一个应付更多变化、覆盖更多场景的系统?从前多是:个人工具箱里装了各类型号的锤子(工具软件),去应对不一样场景、形状的钉子,如今可能追求用一个锤子,快速、低成本的解决不一样的钉子(问题),以不变应万变工具

Real-Time HTAP 是解药吗?

聊到最近几年数据库领域的变化,申砾提到最近两年不少数据库打出了 HTAP 的标签,黄东旭分享了本身对“一个真正的 Real-Time HTAP 数据库”的理解:oop

1-real-time-htap

那么 Real-Time HTAP 价值在何处?应该在于它是一个简单、灵活的方案——可以将各个系统/团队集中在一个 Real-Time HTAP 系统上,节省成本并灵活应对业务变化。大数据

Real-Time HTAP 以后?

Real-Time HTAP 多是当下厂商们可以看获得的努力方向,那么在 Real-Time HTAP 以后的将来是什么呢?

或许五年以后有如下场景:

2-several-scenes

基于这些场景,将来数据库绕不开的核心能力应该是:智能、弹性调度能力

最近有个新概念是 Serverless,Severless 是伴随云(Cloud)诞生的概念。固然 Severless 不是没有服务器,通俗地说,Serverless 就是会根据你的实际需求状况,调整数据库的形态,例如业务流量峰值的时候快速的采购弹性的计算资源进行扩容,低峰的时候自动的释放多余的资源。因此能够把 Severless 当作智能、弹性调度的落地形式来理解,同时将来的数据库必定是跑在云上的。

第二期直播预告

主题

会 MySQL 就会大数据 - HTAP 的如今和将来

时间

4 月 18 日 本周六 20:00

主讲人

黄东旭,PingCAP 联合创始人兼 CTO

马晓宇,PingCAP 实时分析产品负责人

简介

上周咱们探讨了将来的数据库会走向何方,并透露了 TiDB 4.0 是一个具有将来数据库雏形的数据库。“Talk is cheap, show me the TiDB 4.0” ,本周我司 CTO 黄东旭&实时分析产品负责人马晓宇将会演示在高写入的 TP 负载下,如何运行大计算量的分析型请求、而且互相没有任何肉眼可见的延迟影响(想象一下吧,你的系统能够一边下订单一边出数据报表),另外还将展现一下其余的“参考系”在一样语句下的表现哦~

参与方式

点击【 这里 】,添加 TiDB Robot 为好友,回复【新特性】进群参与讨论~

相关文章
相关标签/搜索