让拆库拆表见鬼去吧! MySQL 扩展新玩法

随着数据量的激增,单机数据库存不下了,怎么办?这几乎是全部互联网公司都会遇到的问题。在过去,一直没有一个优雅的解决方案从根本上解决传统关系型数据库扩展性问题,而一般的作法是业务层要把代码改个遍,若是业务上已经用了 MySQL ,没有办法,只能去拆库拆表,动中间件,而这个过程对 DBA 是痛苦的,就算不死也要脱层皮。数据库

最近,一款国人主导开发的开源数据库项目在国内外混的风生水起,不只在 GitHub 上被推到了 Go Trending 的头条,而且累积 Star 数已近 10000。而在国内,它在被技术爱好者模仿 DB-Engine 制做出的国产数据库排行榜中,位居第二,它就是开源分布式关系型数据库TiDB 。缓存

21FFFCD7-2BA0-49F6-AD0F-55BCDBF5EE72.png-39.7kB

▲ PingCAP 联合创始人兼 CTO 黄东旭微信

本期访谈嘉宾: PingCAP 联合创始人兼 CTO 黄东旭。热爱画画,美剧,摇滚乐,但更爱写代码的狂热开源爱好者,知名开源软件做者,表明做品分布式 Redis 缓存方案 Codis ,以及分布式关系型数据库 TiDB 。分布式

  与黄东旭的会面一波三折,由于各自时间缘由及突发事件,最终采访约定在了 PingCAP驻地,东升科技园晚上 19 点。其实,由于 DTCC 大会的关系,虽然很早,我就与做为大会嘉宾的他互添了微信,但与他真正见面,这倒是头一次。oop

  夜幕下的园区少了些许喧嚣,清静了许多。刚走进入 PingCAP 公司的大门,我一眼就看到了横躺在地下摆弄手中平板电脑的他,身为 CTO 的他,彷佛并不太在本身的形象,反而和员工打成一片。长发、T恤、牛仔裤,与微信中的照片如出一辙,彷佛任什么时候候,他都是这副打扮,识别率很是高。大数据

  PingCAP 公司并不大,工位也很少,虽然已是晚上 7 点早该下班了,但还有些工位上依然还有人在办公,脸上还洋溢着笑容,丝毫看不出加班的郁闷与不爽,有的小声交谈,有的敲击键盘,有的在拨打电话订餐,彷佛在家中办公那样轻松自在,一股很是纯粹浓郁的工程师文化向我扑面而来。spa

  黄东旭告诉我,公司目前大概有 50 多人,其中八成是工程师,并有三分之一的同事是分散在祖国各地,公司在北京、上海、广州均有办公室。做为崇尚开源精神的公司,上班不须要打卡,并容许员工在家办公,远程办公,氛围自由而开放。两个小时的采访过程当中,爱写程序技术出身的他,在谈到数据库技术时,眼中充满了狂热的光芒。中间件

TiDB 诞生源自 MySQL 扩展的切肤之痛

  事实上,不管是在前东家微软、网易,仍是豌豆荚,黄东旭一直都在从事与基础软件领域相关的工做,如分布式存储和分布式系统,在这个过程当中他敏锐的观察到,传统关系型数据库扩展性痛点,而这源自常常拆库拆表的他,有着切肤之痛。blog

  随着数据量的激增,单机数据库存不下了,怎么办?这几乎是全部互联网公司都会遇到的问题。但在过去,一直没有一个优雅的解决方案从根本上解决传统关系型数据库扩展性问题,一般的作法是业务层要把代码改个遍,若是业务上已经用了 MySQL ,没有办法,只能去拆库拆表,动中间件,而这个过程对 DBA 是痛苦的,就算不死也要脱层皮。既然没有优雅的解决方案,那为何咱们不作一个?黄东旭反问本身。创业的动机由此而生,接口

  并与另外两个创始人刘奇、崔秋一拍即合,

  PingCAP 的 TiDB 在此基础上诞生了。

  TiDB 最初的灵感来自于 Google Spanner/F1 论文, 有了理论基础,想法很快就落地成产品,并取名 TiDB ,Ti 是元素周期表中的一种元素,高端金属材料,既轻又结实。在黄东旭看来,Ti能充分体现数据库不少特色,并且还很轻,不像 Hadoop 那样重。

  TiDB 与 MySQL 彻底兼容,MySQL 应用无需修改即可直接运行。支持包括传统 RDBMS 和 NoSQL 的特性,能够随着数据增加而无缝水平扩展,只须要经过增长更多的机器来知足业务增加需求,应用层能够不用关心存储的容量和吞吐。用他的话说就是“会自生长”。

TiDB火爆开源社区,定位决定高度!

  技术出身的黄东旭,同时也具有产业判断的视野和格局。中国不缺好的工程师,中国人同样能够作出世界一流的产品。而其中的关键,在于切入方向的选择,而不是工程师的问题。他认为,眼光,必定要放眼全球。而最触动个人一句话:“定位,决定了你能达到的高度,当在这个领域已经有了不少很是强壮的竞争对手,并且成为了一个事实标准,你是很难搬搬倒对方的,先入为主,先得天下为王。”

  大数据时代到来,随着数据量爆发式的增加,数据库这层的基础设施却并无跟上,这给了 PingCAP 一个很好的机会。分布式数据库技术因为其优良的线性横向扩展能力和良好的故障隔离性,近几年也受到了广泛关注。市场上不只出现了不少新兴的分布式数据库引擎,老牌的数据库也在分布式技术上投入重兵,加紧部署。但这些分布式解决方案都是商业的,而且这一领域尚未造成一个事实的标准,除了积累外,这是 PingCAP 切入这一领域的主要理由,更为关键的是,优雅的开源分布式关系型数据库解决方案目前一个都没有,这在黄东旭看来就是填补空白的机会。

  而他与他的团队坚信,TiDB 具有成为一个事实标准的潜质,其次是这个方向的用户足够多。他直言不讳道, MySQL 的用户理论上都会是其客户,这个天花板足够高,市场足够大。

开源才是基础软件出路

  选择开源这条路,并非赶时髦也不是一时冲动,黄东旭有着本身的理解和洞察,在谈到为什么 TiDB 会选择开源这种方式时,他说。基础软件领域闭源并非最好的选择,若是是闭源的,须要铺很大的销售团队,去让客户了解你。开源能让客户更容易了解你,更多地 touch 到你的用户,并在生产环境中去磨练你的产品。他特别强调,开源并非等于免费,开源只是让用户能快速的了解咱们的产品。

  TiDB 能成为 GitHub 上的明星项目,彷佛在黄东旭意料之中,较为淡然,之因此能在国内国外取得好的反响,他认为,不只是 TiDB 自己理论比较新,解决了企业及广大传统关系型数据库扩展的痛点,更为关键的是, PingCAP 是在认真的作这件事情。

  在谈到应用案例时,黄东旭说,目前,已经有上市游戏公司在大规模的采用 TiDB 来做为其游戏端存储和大数据分析的平台,在金融行业,如征信方面,也有客户大数据平台跑在TiDB 上。但他并无透露具体客户名称。

独家揭秘,TiDB 今年 2 大重要更新!

  在谈到 TiDB 今年计划和重大更新时,黄东旭透露,大的功能特性主要有 2 个:

  1、 TiDB 将会深度对接 Spark SQL , Spark SQL 能够说是目前互联网数据实时分析标准方案,深度对接后,用户就能够用 Spark SQL 在 TiDB 上作数据的查询,这并非把数据简单的倒腾到 Spark 里面,而是在存储引擎上,让 Spark SQL 把它的执行计划推下来,而后作分布式计算,这的好处在于,一份存储,多个可插拔查询引擎( TiDB / Spark SQL ),既能够用 TiDB 这边 MySQL 协议查询,同时能够用Spark做分析,加强了 TiDB 在 OLAP 上分析场景上的能力。

  2、添加文档型数据的使用接口支持, MySQL 在 5.7.12的 xplugin 里面的 document store ,相似 MongoDB 访问 MySQL ,不须要建表,相似 Schema 特性, TiDB 也将添加了相似的支持。

相关文章
相关标签/搜索