Hadoop总结

0. Hadoop 开源的分布式系统基础架构 优势 对大量数据进行分布式处理 可靠, 假设硬件失效为常态, 针对失败节点进行从新分布处理 高效, 并行处理提升处理速度 可伸缩, 在横向扩展至上千个节点, 可处理PB级数据 低成本, 项目开源,与同类产品比较成本低廉 相关组件包括 HDFS MapReduce Yarn Hive HBase ZooKeeper Sqoop Flume 1. Hado
相关文章
相关标签/搜索