「数据治理那点事」系列之四 | 书同文车同轨:数据治理之数据标准管理

这篇文章主要从数据治理中的重要基础内容:数据标准入手,从如下几个角度展开具体讲解:数组

  • 对数据标准的认识误区
  • 数据标准的定义
  • 企业如何制定数据标准
  • 数据标准化过程当中出现难题的缘由以及解决方案

1、大数据治理标准体系

根据全国信息技术标准化技术委员会大数据标准工做组制定的大数据标准体系,大数据的标准体系框架共由七个类别的标准组成,分别为:基础标准、数据标准、技术标准、平台和工具标准、管理标准、安全和隐私标准、行业应用标准。本文主要阐述其中的第二个类别:数据标准安全

2、关于数据标准认识的几个误区

数据标准这个词,最先是在金融行业,特别是银行业的数据治理中开始使用的。数据标准工做一直是数据治理中的重要基础性内容。可是对于数据标准,不一样的人却有不一样的见解:架构

有人认为数据标准极其重要,只要制定好了数据标准,全部数据相关的工做依标进行,数据治理大部分目标就水到渠成了。框架

也有人认为数据标准几乎没什么用,作了大量的梳理,建设了一整套全面的标准,最后还不是被束之高阁,被人遗忘,几乎没有发挥任何做用。工具

首先亮明做者的观点:这两种见解都是不对的,至少是片面的。实际上,数据标准工做是一项复杂的,涉及面广的,系统性的,长期性的工做。它既不能快速地发挥做用,解决掉数据治理中的大部分问题,但确定不是彻底没有做用,若是数据标准工做的结局只是最后剩下一堆文档,那只能说明这项工做没有作好,没有落到实处。本文主要的目的,就是分析为何会出现这种状况,以及如何应对。而首先须要作的是厘清数据标准的定义。大数据

3、数据标准的定义

何为数据标准,各相关组织并无统一的,各方都承认的定义。结合各家对数据标准的阐述,从数据治理的角度出发,我尝试着给数据标准作一个定义:数据标准是对数据的表达、格式及定义的一致约定,包含数据业务属性、技术属性和管理属性的统必定义;数据标准的目的,是为了使组织内外部使用和交换的数据是一致的,准确的。spa

4、如何制定数据标准

通常来讲,对于政府,会有国家或地方政府发文的数据标准管理办法,其中会详细规定相关的数据标准。因此在此主要讲企业如何制定数据标准。3d

企业的数据标准来源很是丰富,有外部的监管要求,行业的通用标准,同时也必须考虑到企业内部数据的实际状况,梳理其中的业务指标、数据项、代码等,将以上全部的来源都归入数据标准是没有必要的,数据标准的范围应该主要集中在企业业务最核心的数据部分,有的企业也称做关键业务数据或核心数据,只要制定出这些核心数据的标准,就可以支撑企业数据质量、主数据管理、数据分析等须要。blog

5、数据标准化的难题

数据标准好制定,可是数据标准落地相对就困难多了。国内的数据标准化工做发展了那么多年,各个行业,各个组织都在建设本身的数据标准,可是你不多听到哪一个组织大张旗鼓地宣传本身的数据标准工做多么出色,换句话说,作数据标准取得显著效果的案例并很少。为何会出现这种状况,主要有两个缘由:接口

一是制定的数据标准自己有问题。有些标准一味地追求先进,向行业领先看齐,标准大而全,脱离实际的数据状况,致使很难落地。

第二个缘由,是标准化推动过程当中出了问题。这是咱们重点阐述的缘由,主要有如下几种状况:

一、对建设数据标准的目的不明确。某些组织建设数据标准,其目的不是为了指导信息系统建设,提升数据质量,更容易地处理和交换数据,而是应付监管机构检查,所以须要的就是一堆标准文件和制度文件,根本就没有执行的计划。

二、过度依赖咨询公司。一些组织没有建设数据标准的能力,所以请咨询公司来帮忙规划和执行。一旦咨询公司撤离,组织依然缺少将这些标准落地的能力和条件。

三、对数据标准化的难度估计不足。不少公司上来就说要作数据标准,殊不知道数据标准的范围很大,很难以一个项目的方式都作完,而是一个持续化推动的长期过程,结果是客户越作遇到的阻力越大,困难越多,最后本身都没有信心了,转而把前期梳理的一堆成果束之高阁,这是最广泛的问题。

四、缺少落地的制度和流程规划。数据标准的落地,须要多个系统、部门的配合才能完成。若是只梳理出数据标准,可是没有规划如何落地的具体方案,缺少技术、业务部门、系统开发商的支持,尤为是缺少领导层的支持,是不管如何也不可能落地的。

五、组织管理水平的不足:数据标准落地的长期性、复杂性、系统性的特色,决定了推进落地的组织机构的管理能力必须保持在很高的水平线上,且架构必须持续稳定,才能有序地不断推动。

以上这些缘由,致使数据标准化工做很难开展,更难取得较好的成效。数据标准化难落地,是数据治理行业的现状,不容回避。

6、如何应对这些难题

应对以上这些难题,最经济、最理想的模式固然是:作大数据建设,首先作标准,再作大数据平台,数据仓库等但通常的不大可能有这样的认识,不少时候你们都是先建设再治理。先把信息系统、数据中心建好,而后标准有问题,质量不高,再建数据标准,但实际上这时候已是回过头来作一些亡羊补牢的事情,客户的投资确定有一部分是浪费。

正由于其太过理想化,因此这种模式几乎是见不到的。在实践中,咱们每每仍是须要更多地考虑如何把数据标准落地到已有的系统和大数据平台中。

数据标准落地有三种形式:

一、源系统改造:对源系统的改造是数据标准落地最直接的方式,有助于控制将来数据的质量,但工做量与难度都较高,现实中每每不会选择这种方式,例若有客户编号这个字段,涉及多个系统,范围广、重要程度高、影响大,一旦修改该字段,会涉及到相关的系统都须要修改。可是也不是彻底不可行,能够借系统改造,从新上线的机会,对相关源系统的数据进行部分的对标落地。

二、数据中心落地:根据数据标准要求建设数据中心(或数据仓库),源系统数据与数据中心作好映射,保证传输到数据中心的数据为标准化后的数据。这种方式的可行性较高,是绝大多数组织的选择。

三、数据接口标准化:对已有的系统间的数据传输接口进行改造,让数据在系统间进行传输的时候,所有遵循数据标准。这也是一种可行的方法。

在数据标准落地的过程当中,须要作好这几件事:

  • 事先肯定好落地的范围:哪些数据标准须要落地,涉及到哪些IT系统,都是须要事先考虑好的。
  • 事先作好差别分析:现有的数据和数据标准之间,究竟存在哪些差别,这些差别有多大,作好差别性分析。
  • 事先作好影响性分析:若是这些数据标准落地了,会对哪些相关的游戏厅产生什么样的影响,这些影响是否可控。元数据管理中的影响性分析能够帮助用户肯定影响的范围。
  • 制定落地的执行方案:执行方案要侧重于可落地性。不能落地的方案,最终只能被废弃。一个可落地的方案,要有组织架构和人员分工,每一个人负责什么,如何考核,怎么监管,都是必须归入执行方案中的内容。
  • 具体的执行落地方案:根据执行方案,进行数据标准落地执行。
  • 过后评估:过后须要跟踪、评估数据落地的效果如何,作对了哪些事,哪些作得不足,如何改进。

总结

数据标准的建设大体能够分红两个阶段

第一个阶段是梳理和制定数据标准

第二个阶段是数据标准的落地和实施

然后者是公认的难题

做者:蒋珍波(乐天),6 年+ 大数据咨询经验,擅长为客户提供科学合理的大数据解决方案。目前担任数澜科技咨询专家。

相关文章:

「数据治理那点事」系列之一:那些年咱们一块儿踩过的坑

「数据治理那点事」系列之二:手握数据「户口本」,数据治理确定稳!

「数据治理那点事」系列之三:不忘初心方得始终,数据质量治理?

【更多数据治理方面的文章在数澜社区——国内首个面向数据人的数据中台交流社区。专一于数据中台研究、数栖平台使用指导、数据可视化探讨。】

相关文章
相关标签/搜索