一、生生态系统

 一、生态系统   这一切,都起源自Web数据爆炸时代的来临 数据抓取系统 - Nutch 海量数据怎么存,当然是用分布式文件系统 - HDFS 数据怎么用呢,分析,处理 MapReduce框架,让你编写代码来实现对大数据的分析工作 非结构化数据(日志)收集处理 - fuse,webdav, chukwa, flume, Scribe 数据导入到HDFS中,至此RDBSM也可以加入HDFS的狂欢了
相关文章
相关标签/搜索