hadoop1架构基本理解

  0 出现原因:   业务场景:在1T数据中,找最小值 a) 集中式处理方式: 不断从硬盘加载部分数据放在机器内存中处理,然后丢弃内存数据,继续加载处理, 这样CPU真正计算时间是很少的,大部分时间都用在了磁盘IO上, 硬盘转速是固定的7200转,相对于内存速度和CPU速度,这种物理瓶颈无法处理,影响了整个作业速率。 特点: 将数据加载到计算区   b) 分布式处理方式: 1T的数据分散到多台机
相关文章
相关标签/搜索