大数据分析Hadoop及Python实现

大数据 1.分布式: 主节点(Master)、从节点(Slaves)python 2.集群(多台机器) 同时存储数据,并行处理数据linux 3.分布式计算 核心思想:分而治之思想web 一.Hadoop 1.Apache Hadoop 介绍: 对多个服务器中分布式并行处理数据的一种工具,能够无限的扩大数据规模,以此来解决大数据规模。 特色; 规模扩展性,灵活性,容错性和低成本。 功能: Apac
相关文章
相关标签/搜索