Spark在携程的实践(一)

一、Spark在携程应用的现状 集群规模: 平均每天MR任务数:30W+ 开发平台: 调度系统运行的任务数:10W+ 每天运行任务实例数:23W+ ETL/计算任务:~58% 查询平台 adhoc查询:2W+ 支持Spark/Hive/Presto   二、Hive与Spark的区别 Hive: 优点:运行稳定,客户端内存消耗小。 存在问题:生成多个MapReduce作业;中间结果落地,IO开销大
相关文章
相关标签/搜索