吐槽ing丨Boss的话你应该嚼三遍再下咽

遇到一个有情怀,有想法的Boss,你只能不断的提高本身,你须要不断的在原有的技能基础上不断的扩充本身。前端

最近团队在作教育领域的项目,须要与众多三方进行对接(刚开始本来团队进行开发,因为客户时间限制,须要引入),而数据之间的交换变成了重点,以谁为中心已然被提上了日程。其中对接的三方成熟产品因为双方的编码规则以及实现的单点登陆机制不一样,两个系统之间的数据共享存在必定的差别性。以三方成熟产品为主,那么现有系统的众多模块须要更改,成本有点高。而以公司目前的产品为主,三方成熟产品并不会赞成,所以之间的阻碍已经成为首要解决的问题。数据库

对于企业来讲,数据的重要性必须牢牢握在本身手中,为后续系统升级、扩充、数据分析等作战前准备。Boss不知道在哪儿听到,能够搭建企业数据中心,便开启临时会议模式,将鄙人从本来项目组抽离,成立所谓的“数据中心”小组进行数据的整合,达到最终以数据中心为主,不管谁要进都须要符合数据中心的规则。后端

对于一个纯粹的Java后端开发人来讲(偶尔也会搞搞前端),这个转型跨度有点大,瞬间感受本身的逼格提高了不少(后来才知道,这是一种奢望)。网络

接下来开始整理各种资料,什么是数据中心,这即是首要了解的问题。百度百科:数据中心是全球协做的特定的设备网络,用来在Internet网络基础设施上传递、加速、展现、计算、存储数据信息。 什么鬼?与我想象中的数据中心有点差异啊,难道我本身没有理解Boss所说的“数据中心”?工具

回想Boss所说,将数据紧紧抓在本身手中,后续三方产品入驻教育机构须要知足数据中心的规范。这是什么呢?与数据中心的概念有点差距啊,怎么感受就是一个数据中转站呢?你须要什么你告诉我,我给你你须要的特定数据,其余的你别想沾手。有点像数据集成呢?百度百科:数据集成是把不一样来源、格式、特色性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。学习

终于明白Boss要搞什么了,并非数据中心,而是一个将众多数据库放在一个仓库中统一管理,三方需求须要一组特定的数据时,来数据仓库中拿,但在拿以前还须要对原有分散的数据进行抽取、清理、加工,而后整理成统一的、一致的数据,供三方调用。 将不一样数据库、同数据库存在数据差别的数据整理成一套一致的数据,怎么将这些数据库统一来管理,统一来抽取数据,怎么验证数据的正确性,怎么剔除不须要的数据,怎么对数据进行合并、分离,怎么将不一样属性的数据转换成统一的?这都是很繁杂的问题,而在开源社区提供的一款名为KettleETL工具,将帮助咱们解决这众多的问题。编码

最后,在翻看了众多的资料后,我终于完全明白,Boss让我作什么,其实就是像刚开始学习Word使用同样学会使用Kettle工具。而后就如同洗车行同样,将一辆辆车洗的干干净净。code

结语

若存在理解差别或者理解偏差,望掘友给出合理的建议,这里拜谢!对于一个还在门口徘徊的学徒,您的建议或者意见将会给我很大的帮助!接下来将在学习之余整理Kettle的使用,不对如今已经叫Pentaho Data Integration后端开发

相关文章
相关标签/搜索