Delta Lake (一) 简介

Delta Lake  一、简介 Delta Lake是一个开源存储层,为数据湖带来了可靠性。Delta Lake提供了ACID事务、可伸缩的元数据处理以及统一的流和批数据处理。Delta Lake运行在现有数据湖之上,与Apache Spark api完全兼容。 二、特性 Spark上的ACID事务:可序列化的隔离级别确保读者永远不会看到不一致的数据。 可伸缩的元数据处理:利用Spark的分布式
相关文章
相关标签/搜索