(一)HDFS总体架构

1、背景 海量的非结构化数据,几乎没法梳理成一个个的字段,来存储在关系型数据库中。所以实际应用中,对于这类数据需要考虑数据如何存储。数据如何计算的问题。 2、hadoop两个核心 HDFS(以分布式方式来存储海量数据) MapReduce(以HDFS上的数据为基础进行计算) 3、大数据特点 Volume(大量) Velocity(持续高速增长) Variety(多样性) value(价值密度低,数
相关文章
相关标签/搜索