中国企业的大数据发展大概经历了三个阶段。算法
第一阶段,是 2000 年以后的企业内部信息化 , 中国许多大型企业开启了一波以数据库、ERP 为主的底层 IT 建设,进行了初步的“业务数据化”建设 。 第二阶段,是 2004 年到 2012 年 , 随着 BAT 纷纷上市,互联网经济的崛起,让数据思惟深刻各行各业,数据量慢慢壮大。第三阶段是 2013 年以后,移动互联网的发展,一些金融、零售等大型企业响应“互联网+”概念,走向线上线下深度融合,这时数据服务的形式开始增多,业务维度更加复杂。数据库
将数据用起来,随时随地分析企业状况进行精细化运营,企业须要打通老一代 ERP、数据库等 IT 系统,同时还须要应对业务增多且快速变更的状况。并且大企业之间各部门之间的数据每每都没有“共享”,运用不一样的开发队伍开发平台和工具的不统一,这时,数据服务每每就是一个个从各平台伸出的 数据“烟囱”。架构
之前数据量少的时候,建数据烟囱是没有问题的。但随着数据愈来愈多,假如一个企业有数十个甚至上百个应用的时候,就会有有明显的重复建设、资源浪费,甚至更严重的是因建设者不一样而形成口径标准都不一致。另外一方面,数据量庞大的时候,增删改查也会变得很是缓慢。“数据中台”就是这样随需求而来的概念,但愿存在一个提供公共的数据服务能力的地方,你们能够从这里快速获取这些能力,来支撑新的数据应用,且各部门都能保持一致。机器学习
袋鼠云 CEO 拖雷 说:“数据中台能够理解为企业的最核心的数据大脑,企业全域的数据处理中心,是一种企业信息化的升级过程,从 过去的烟囱式(企业信息化 1.0)升级到如今的中台式(企业信息化 2.0),1.0 时代,系统与数据都是割裂的,无法发挥最大价值,在 2.0 时代,底层系统是共享的,微服务化的,中心化的,全部的应用,数据都采用服务化的方式来共享资源,最大化的提高灵活度与便捷性,随着敏捷开发的普及,中台思想也带来快速的创新。”分布式
百分点程佳 回复咱们:“数据中台是一个集数据采集、融合、治理、组织管理、智能分析为一体,将数据以服务方式提供给前台应用,以提高业务运行效率、持续促进业务创新为目标的总体平台。帮企业把数据用起来,提高决策水平是对数据中台的一个最基础的要求。”微服务
网易严选魏文庆 则用了一个很形象的比喻:“打个比方,当我一家人要吃饭,我本身买菜,在本身的厨房用普通的厨具本身作就行了,若是是富士康,几万几十万人吃饭,就须要建食材的加工配送中心 (类比数据中台)。本质上是需求规模量级的变化,致使解决方案的质变”。工具
提及“中台”咱们必会提起马云的 Supercell 之旅,不少人将一系列的“中台”理念解读为因地制宜的“中国产物”,并且在国外没有“中台”这种叫法,依然叫作“平台化”能力。学习
阿里的“中台”火了以后,咱们忽然发现已有无数家“数据中台”落地成果的企业,有些转换完成彷佛一瞬间。因此针对咱们采访的企业,每一家咱们都追问了一个问题:“从以前的大数据平台,转变为建设数据中台,这之间企业在研发或人员上作了哪些改变?”也有企业直接告诉咱们,在数据中台概念出现以前,就一直在按这种理念推动,甚至有的已经在此以前完成了相关平台的设计与实践工做,阿里带火中台理念后,因而就用上了这个词。这些企业中,哪些能够被直接划分到“数据中台”行业中?大数据
是否有“公共模块”是衡量企业是否有创建数据中台的其中一个标准。spa
带火“中台”概念的阿里,在实施数据中台的时候,采用的是“数据中台 + 业务中台“的双中台形式来提供公共服务。在数据中台里将数据业务化,来供业务中台调用,以快速反馈结果。阿里谢纯良 在接受 InfoQ 采访时曾表示:“以阿里电商业务为例,用户若是想买一个手机,在下单页面会推荐手机壳、充电宝等其余相关并估计你感兴趣的产品。但值得注意的是,业务中台不知道你喜欢什么,须要根据用户历史记录去分析。若是这个数据量很是庞大,现查是很是慢的,不可能瞬间就查到结果。因而阿里把数据业务化,将用户在历史库里面的一堆数据作成一序列业务模型。这时在业务中台里要查某一用户喜欢什么时,它立马能调出结果并反馈,这个反馈多是毫秒级。这是数据中台最大的魅力。”
数澜科技创始合伙人 &CDO 付登坡(天湛) 表示数据中台是让数据用起来的持续的一套机制,经过创建一套能共享服务的体系,基于数据运营机制造成的闭环路径,通过业务数据化、数据资产化、资产服务化、服务业务化,在有权限管理的状况下开放出去,把能够复用的能力放在一块儿,用统一标准和口径,向前台业务部门和决策部门以 API 的方式提供数据和计算服务。好比说数澜为这套机制创建的数栖平台就是一套提供公共服务的“模块”,数栖平台的目标定位就是为了让数据可以更方便的使用,再加上一套方法论和运营机制,就是在创建数据中台。“数澜推进实施项目,有不少是尽可能去复用已有的这个平台,可是会增长一些东西,好比说数据的管理,标签的管理,服务......”。
数据中台强调的是一种复用能力。不少企业的愿景都是“将数据用起来”,这也是数据平台这些企业基础设施的定位目标,若是再加上一些复用方法论和完善的运营机制,那么可咱们就能够认为企业是在建设“数据中台”。使用数据中台的最明显的效果就是提高开发效率,使用封装好的工具平台,下降开发难度,数据分析的速度会大大提升。
魏文庆 给咱们的解释说,网易严选的定义是“数据中台是高质量、高效赋能数据前台的一系列数据系统和数据服务的组合”,不管是数据中台、业务总台、技术中台,核心都是“标准化”,实现流程都是先“规范化”,而后把规范“产品化工具化”。数据中台要经过“数据中台系统 ”( 包含 数仓体系、数据服务集和 BI 平台 ) 进行表达 ,打破数据管理经验化的思惟,用标准化、工具化来作数据。但中台自己是业务相关的,价值是要数据产品对外输出,须要经过数据产品(前台)和数据中台相辅相成进行发展。而数据平台是业务无关的,为数据中台提供存储、计算能力。
之前咱们有各类数据治理的概念,达到制定数据政策、促进数据在组织内无障碍共享的目标,还有各类精准营销、风控等企业业务,数据中台与它们在技术上是否有本质上的区别?数澜天湛 回答说:“技术上差异不大,主要是业务上前者多数更为垂直,用一部分的数据解决一个部门的业务的某一个痛点。好比说业务中台的目标是理论上是对业务的一些资源共享,那么数据中台就是为了数据资源共享,若是应用过于垂直,可能就达不到中台的一个定义。因此它们最大的差异在于数据打通层面的范围大小,和存在这种数据资源共享的理念。”
袋鼠云拖雷 在回复咱们的构建方法问题时说道:“数据中台的构建并不复杂,你能够先构建业务中台,再构建数据中台,也能够直接构建数据中台(相似构建数据仓库)。主要的目的是把企业全域的数据放在一块儿,统一的加工处理,是一个面向将来的分布式,服务化的架构。”
阿里谢纯良在咱们以前的采访中 曾说,若是企业没有业务中台、只有数据中台,那它加工的结果大部分是服务于大屏,就搞一个大屏就结束了,那么这个数据中台就跟阿里理解的数据中台差的还远。
咱们看一下阿里的中台,包括业务中台,数据中台。最底层是 IaaS+Data,中间是咱们说的双中台,PaaS 层。上层是应用,SaaS,号称小前台。
一个完整的数据平台至少应该包含三层,即大数据计算平台、数据中台、数据应用前台。
中台的定位是用技术连接计算平台的数据处理能力,用数据连接应用前台的数据应用能力。所以,中台不但要将很复杂的大数据处理技术(流计算、批量计算、实时采集、离线采集、机器学习)封装起来,造成计算平台;同时,进入中台的数据都需按照规范的建模方法论将数据造成主题域模型、造成标签模型或者算法模型。这些数据模型是数据中台的核心资产。接入数据中台的各业务系统经过大数据计算平台这座数据加工厂统一加工后产生数据模型,再将这些数据资产经过可视化的界面管理起来,并使用标准化的数据服务接口对数据应用端提供数据应用服务。
下图为一个比较典型的企业数据平台全景图:
云徙科技在构建数据中台的时候一样创建了双中台架构,云徙科技联合创始人兼首席架构师陈新宇 解释了双中台之间如何互相做用的:
数据中台与业务中台并称数字中台。其中,业务中台是负责支撑业务在线,将企业业务系统中通用的业务能力抽象成领域中心,使得这部分能力获得最大化的复用,支撑多端访问、多种相似的场景。数据中台是采用大数据存储和处理技术,对海量数据根据统一标准进行采集、计算、存储、加工处理,造成数据模型和数据资产,并经过数据服务提供给业务方使用。数据中台与业务中台最大的区别是业务中台围绕业务流程,而数据中台一切以数据为主题进行运转,包含数据采集、数据融合、数据建模、数据聚合分析、数据服务、数据资产治理;总之,前者旨在让业务数据化,后者旨在让数据业务化。
一个比较完善的业务中台几乎囊括了企业的核心业务,所以,业务中台是数据中台的数据原材料提供者之一;业务中台的领域中心是自然的主数据中心。所以,业务中台输出的数据更加标准、更加规范,大大下降数据中台的数据清洗工做;同时,数据中台通过数据建模造成的数据能力,必须与业务结合才能发挥其价值,那么业务中台就是让数据能力发挥价值的最合适的载体。通俗的说,若是将企业的信息化系统比喻成一辆自行车,那么业务中台和数据中台就是自行车的两个轮子,两个轮子经过数据这根“链条”紧密联系,发挥价值,离开哪个轮子,信息化系统这辆自行车都没法正常行驶。再举一个例子,业务中台是炮火,数据中台是雷达。雷达分析的数据来源是业务中台,分析结果经过业务中台对业务产生反馈,从而采起业务活动,才是一切业务数据化,一切数据业务化。业务中台和数据中台是因为采用的技术手段不一样而产生了相对隔离,但从业务的角度,他们是一体的,一块儿为企业业务服务的。
数澜天湛 给咱们解释,目前业界现状是双中台,数据在数据中台中变成一种数据服务,在业务中台里去使用,将来可能会模糊化业务中台跟数据中台。由于数据服务的使用会变成一个常态,你们以为很天然的可使用数据能力。那时业务中台跟数据中台,可能边界就会模糊,就变成一个中台和一个前台,前台是各类业务的触点,中台是公共能力。
一位前阿里技术专家曾跟咱们聊到说,一个淘宝网,能够有一千万家店,企业里有不少的公共的资源能够经过中台共享,但阿里内部之前它叫“企业互联网架构”,但由于中台这个词火了,不得已就用“中台”来代替了。那么数据中台的出现,是否是仍是在考验“架构”的设计和系统工程能力?若是一开始,架构作的好,是否是这些问题会随着架构设计而被解决呢?
袋鼠云拖雷 回答说:“数据中台是一种理念,一种思惟,是架构的升级,是一种面向将来的架构。”
数澜天湛 表示:“确定是一种架构能力。数据中台自己是一套很是复杂的体系,平台工具自己架构设计能力要求也很是高。但也不只仅是架构,也不只仅是产品,架构师和产品经理都推进不了,数据中台是一个顶层战略,数据中台涉及业务运转方式的改变,必须有足够的推力才能启动。是企业的一把手工程,是一个企业级战略,须要管理层、业务团队、技术团队、数据团队所有参与进来,目标是实现经营的数据化、精细化,实现企业的数字化转型。数据科学团队是数据中台的深刻参与者,但也仅仅是多个角色的其中一个。中台数据是战略层面的事情而不是战术层面,自下向上推进几乎没有可能,好比涉及标准统一,从下而上只能看到一个点,不免会以偏概全。”
中台承载的是企业最核心的业务能力,最核心的差别化竞争力,是战略层面的事情,没有战略层面的决心和耐心坚持下来就很难看到成果,有的时候,中台建设确实也须要“由于相信,因此看见”。中台建设须要有全员共识,由管理层从上往下推动,由技术和业务人员去执行和落地,是个漫长的过程,因此实施数据中台时,最困难的地方就是须要推进力。好比在中国有各类“数据墙”,你们都以为数据有价值,也没有发挥这个价值,可是对数据又保护的很紧。为了解决某一块的业务,须要去拿多个部门的数据,有时甚至涉及到几十个部门,最初可能立刻获得口头上的应允,但最后真正拿到数据却很困难,这时候推进力决定了整个项目的进展。天湛表示这一般就是数据中台项目实施中涉及到的最大的坑。
实施数据中台,在团队人员建设上,对数据科学平台团队的要求和原来并无什么不一样,袋鼠云拖雷回复咱们,“只是体系架构的变化,思惟的变化,随着服务化与敏捷模式的普及,创新会变得愈来愈快“。
就像咱们前面所说的,数据中台最重要的是要“帮企业把数据用起来,提高决策水平”,是一种数据思惟。那么每个企业都应该有这种思惟,重视信息化技术,让数据发挥价值。不仅仅是由于业务复杂、数据量大、须要数字化转型的缘由,是从业务开始就应该具有的一种理念。袋鼠云拖雷也说:“将来任何企业都是必须的,将来任何一家企业都是数据化的企业,都须要一个数据中台”。
[1] 中台禁区:为何最关键的组织架构却鲜少人谈?
https://mp.weixin.qq.com/s/FqpckEAOscFlNRYkH3GPcA
[2] 昨天讲平台、今天变中台,数据中台都干了啥?
https://mp.weixin.qq.com/s/y8o86UVuQM5cfjGXcPKSkg
[3] 数据中台案例讲多了,哪些真正适用于银行?