大数据基础入门总结

一、 大数据的本质:     (1):数据的存储:分布式文件系统(多台机器进行分布式存储)     (2):数据的计算:分布式计算 也指的就是hadoop中的hdfs来解决大数据的存储问题,hdfs的结构是由一个管理员NameNode名称节点和多个DataNode组成的一个hdfs,搭建这个集群最少需要三台机器,我是搭建了3台linux机器 解决的问题: 使用分布式文件系统能够解决的问题,能够可以
相关文章
相关标签/搜索