大数据离线处理和经常使用工具

1. 大数据离线处理特色    1) 数据量巨大且保存时间长;    2) 在大量数据上进行复杂的批量运算;    3) 数据在计算以前已经彻底到位,不会发生变化;    4) 可以方便的查询批量计算的结果;    不像在线计算当前呈现的各类框架和架构,离线处理目前技术上已经成熟,你们使用的均是:  使用 Hdfs  存储数据,使用 MapReduce  作批量计算,计算完成的数据如需数据仓库的存
相关文章
相关标签/搜索