（一）HDFS总体架构

时间 2020-12-31

原文原文链接

1、背景海量的非结构化数据，几乎没法梳理成一个个的字段，来存储在关系型数据库中。所以实际应用中，对于这类数据需要考虑数据如何存储。数据如何计算的问题。 2、hadoop两个核心 HDFS（以分布式方式来存储海量数据） MapReduce（以HDFS上的数据为基础进行计算） 3、大数据特点 Volume（大量） Velocity（持续高速增长） Variety（多样性） value（价值密度低，数