一篇文章掌握 delta、iceberg 和 hudi 三大开源数据湖方案

目前市面上流行的三大开源数据湖方案分别为:delta、Apache Iceberg和Apache Hudi。其中,因为Apache Spark在商业化上取得巨大成功,因此由其背后商业公司Databricks推出的delta也显得格外亮眼。Apache Hudi是由Uber的工程师为知足其内部数据分析的需求而设计的数据湖项目,它提供的fast upsert/delete以及compaction等功能
相关文章
相关标签/搜索