大数据重点知识总结

主要总结一下Hadoop、Hive、HBASE、Spark的要点。node 首先Hadoop,说道hadoop他的核心就是MapReduce,就MapReduce的执行步骤来讲主要以下:缓存 ☆☆☆MapReduce的执行步骤: 一、Map任务处理网络   1.1 读取HDFS中的文件。每一行解析成一个<k,v>。每个键值对调用一次map函数。<0,hello you> <10,hello me>
相关文章
相关标签/搜索