Apache Falcon简介-Hadoop数据生命周期管理框架

Apache Falcon是一个开源的hadoop数据生命周期管理框架, 它提供了数据源 (Feed) 的管理服务,如生命周期管理,备份,存档到云等,通过Web UI可以很容易地配置这些预定义的策略, 能够大大简化hadoop集群的数据流管理. 本文主要介绍了Falcon的基本特性, 核心概念以及架构, 最后讨论了它的优点和局限. Hortonworks的hadoop发行版HDP中,数据治理包括F
相关文章
相关标签/搜索