Hadoop基础理论及win7安装Hadoop

1、数据类型 结构化数据:关系数据。 半结构化数据:XML数据。 非结构化数据:Word, PDF, 文本,媒体日志 2、 大数据的挑战 采集数据 策展 存储 搜索 分享 传输 分析 展示 3、Hadoop 架构 加工/计算层(MapReduce):一种并行编程模型,用于编写普通硬件的设计,谷歌对大量数据的高效处理(多TB数据集)的分布式应用在大型集群(数千个节点)以及可靠的容错方式。 MapRe
相关文章
相关标签/搜索