在当今大数据的应用愈来愈普遍的状况下,数据治理一直是企业面临的巨大问题。apache
大部分公司只是单纯的对数据进行了处理,而数据的血缘,分类等等却很难实现,市场上也急须要一个专一于数据治理的技术框架,这时Atlas应运而生。架构
Atlas官网地址:https://atlas.apache.org/框架
Atlas是Hadoop的数据治理和元数据框架。oop
Atlas是一组可扩展和可扩展的核心基础治理服务,使企业可以有效,高效地知足Hadoop中的合规性要求,并容许与整个企业数据生态系统集成。大数据
Apache Atlas为组织提供了开放的元数据管理和治理功能,以创建其数据资产的目录,对这些资产进行分类和治理,并为数据科学家,分析师和数据治理团队提供围绕这些数据资产的协做功能。3d
Atlas支持各类Hadoop和非Hadoop元数据类型orm
提供了丰富的REST API进行集成blog
对数据血缘的追溯达到了字段级别,这种技术尚未其实相似框架能够实现索引
对权限也有很好的控制get
Atlas包括如下组件:
更多大数据,Atlas,ES,Kafka等技术博文,欢迎关注实时流式计算:
本文由博客一文多发平台 OpenWrite 发布!