Dremio数据湖引擎(一):简介

在进入主题前,先聊下数据湖这个概念。百度百科中对该名词有如下解释: 数据湖或hub的概念最初是由大数据厂商提出的,表面上看,数据都是承载在基于可向外扩展的HDFS廉价存储硬件之上的。但数据量越大,越需要各种不同种类的存储。最终,所有的企业数据都可以被认为是大数据,但并不是所有的企业数据都是适合存放在廉价的HDFS集群之上的。   说白了,数据湖的意思就是将不同存储类型、不同种类的数据汇聚在一起,例
相关文章
相关标签/搜索