hadoop基础01

1、大数据概述 大数据是指无法在一定时间内使用传统的数据库软件工具对其内容进行抓取、管理和处理的数据集合。 有5V+1C的特性 2、hadoop背景 google提出的两个处理抓取网页数据的解决方案: 1】分布式文件系统(GFS):处理海量网页的存储-----引申出HDFS 2】分布式技算框架MAPREDUCE:处理海量网页的索引----引申出MAPREDUCE 最终独立出HADOOP 3、had
相关文章
相关标签/搜索