Azure Data Lake Storage Gen2 旨在处理 EB 规模的数据的这种多样性和数量,同时按照设计,可处理数百 GB 的安全吞吐量。 所以,使你能够灵活地将 Data Lake Storage Gen2 用做实时和批处理解决方案的基础。 下面是 Azure Data Lake Storage Gen 2 带了的附加优点的列表:安全
Data Lake Storage Gen2 的一个主要优点是能够如同数据存储在 Hadoop 分布式文件系统中同样来处理数据。 此功能使你能够将数据存储在一个位置,并经过各类计算技术(包括 Azure Databricks、HDInsight 和 SQL 数据仓库)进行访问而无需在各个环境之间移动数据,从而可实现高效使用,同时尽量下降成本。分布式
Data Lake Storage Gen2 支持访问控制列表 (ACL) 和 POSIX 权限。 能够为存储在 Data Lake 中的数据,在目录或文件级别上设置权限粒度级别。 这种安全性可经过各类技术(包括 Hive 和 Spark)或使用实用工具(如 Azure 存储资源管理器)进行配置。 此外,全部存储的数据均可使用 Microsoft 或客户托管的密钥进行静态加密。工具
Azure Data Lake Storage 将存储的数据组织为十分相似于文件系统的目录和子目录层次结构,从而能够更易于导航。 所以,数据处理须要的计算资源较少,这进而可减小时间和成本。oop
Azure Data Lake Storage Gen2 利用 Azure Blob 复制模型,这类模型使用本地冗余存储 (LRS) 在单个数据中心内提供数据冗余,或使用异地冗余存储选项向次要区域提供数据冗余。 此功能可确保数据在遭遇灾难时始终可用而且受保护。性能