编者按:本文转载自网易副总裁,网易杭州研究院执行院长汪源的我的公众号“冷技术热思考”(欢迎搜索关注)。上一篇中台系列的文章重点阐述了中台的概念,本文是系列文章的第二篇,目的是说明什么状况下能够考虑建设中台,若是要建怎么建的问题,能够做为企业思考中台建设的大框架。如下为原文(有少许改动):本文将例举典型的须要建设中台的场景,供参考判断要不要建中台。建设中台须要考虑组织、技术支撑和方法论,每每还须要咨询服务的帮助,本文也能够做为思考中台建设的大框架。前端
并非数据量大就须要建中台,主要仍是看用数据的姿式是否是比较复杂,当前问题是否是比较多。对于这类符合的业务,数据中台能把层层数据直到最上层的指标梳理清楚,提高数据质量,从而提高运营效率。把数据理清楚了,每每还能下降数据存储和数据开发人员的成本。数据库
除了上述判断,还有一条是同行对比。若是一个行业你们都有点跃跃欲试想弄中台,那领先者必定要想办法抢先(既然是领先者了,每每也符合上述标准),否则就可能被颠覆。跟随者要不要想办法抢先从而超越领先者呢?可能很差说吧,但若是领先者已经建了,跟随者通常得紧跟,不然真可能被甩开了。编程
若是根据上述逻辑以为大体要考虑去搞一把中台的话,那请继续读本文如下内容,读完本文后续内容而后更具体的看看问题存不存在,条件是否具有。要建设中台,须要考虑组织、支撑技术、方法论这三个方面,每每还须要咨询服务。后端
中台组织关键要懂业务和承担业务职责。举个例子,一个大数据平台的建设运维团队不是一个中台组织。一个团队若是作了很是完善的中台产品(如开发了数据中台所须要的指标管理系统、数据仓库开发系统、数据质量管理系统等等),但只是把产品提供给业务方使用,这个团队仍然不能说是中台组织。只有当这个团队承担起指标体系的建设和管理、数据仓库的设计和实施、数据质量的保障等工做时,才能够说是中台组织。而要作到这一点,这个组织确定是比较了解业务的,它的目标和考核也必定与业务有相关性(确定不仅是平台稳定性这样的非业务指标)。安全
中台组织的层次与中台的层次最好是对应的,BU级的中台组织最好直接向BU老大或分管的CXO汇报,企业的中台组织最好直接向CEO或分管的CXO汇报。架构
这里特别说明一点的是若是不建设在线业务中台,而只是采用微服务、云原生等技术的话,能够不涉及组织方面的大规模变更,就在原来的研发部实现转型。一般来讲也能够实现必定的系统可用率、弹性和研发效率方面的提高。并发
同时,数据中台还须要强大的大数据计算引擎、数据集成 / 同步 / 交换引擎,还每每须要一套敏捷BI系统:· 大数据计算引擎:数据中台要管理的数据规模和复杂度每每都很高(不然搞中台属于为赋新词强说愁),因此传统的数据库和数据仓库基本上支撑不了。当前的技术环境下,基于Hadoop MapReduce或Spark几乎是惟二的选择,固然这也包括了这二者之上的Hive和Spark SQL。能用SQL就用SQL,易于维护,也易于数据血缘的收集。除此以外,流处理可能还须要Flink,交互式查询可能要引入Impala或GreenPlum。· 数据集成 / 同步 / 交换引擎:一方面数据中台须要强大的数据集成和同步能力才能吸纳各方数据。集成和同步的概念相近,同步更强调实时性。另外一方面,数据中台每每由多种数据计算引擎构成,就须要同步或交换引擎实现不一样引擎见的数据交换。· 敏捷BI系统:建设数据中台一般最重要的目的是为了支持业务运营和决策,为此须要基于数据中台进一步开发数据产品。敏捷BI系统是开发数据产品快速、轻型的手段,可以尽快尽早的发挥数据中台的价值。框架
此外,对于互联网业务,统一的埋点引擎每每也是数据中台所须要的。若是埋点的逻辑都不统一的话,建数据中台的时候会发现数据的源头就是乱的,后续也都无法作。其余行业业务,数据采集也属于基础工做,也是要先作好的。less
因而可知,建设数据中台须要的技术支撑体系也是至关的庞大,复杂。所幸的是这十年来Google等领先的企业、Hadoop / Spark等开源社区以及大量的厂商大体联合探索出了一条可行的路径,方法论和技术路线都比较统一了。以此为基础,就能够提供较成熟的数据中台技术支撑产品,如网易杭研研发的“网易猛犸V6.0 + 网易有数”就是一套较完整的数据中台产品。运维
点击连接更多关于网易数据中台