Hadoop复习知识

大数据:概念 不能使用一台机器进行处理的数据 大数据的核心是样本=总体 特性 大量性(volume): 一般在大数据里,单个文件的级别至少为几十,几百GB以上 快速性(velocity): 反映在数据的快速产生及数据变更的频率上 多样性(variety): 泛指数据类型及其来源的多样化,进一步可以把数据结构归纳为结构化(structured),半结构化(semi-structured),和非结构化
相关文章
相关标签/搜索