MapReduce: 提升MapReduce性能的七点建议[译]

[size=medium] Cloudera提供给客户的服务内容之一就是调整和优化MapReduce job执行性能。MapReduce和HDFS组成一个复杂的分布式系统,而且它们运行着各式各样用户的代码,这样致使没有一个快速有效的规则来实现优化代码性能的目的。在我看来,调整cluster或job的运行更像一个医生对待病人同样,找出关键的“症状”,对于不一样的症状有不一样的诊断和处理方式。 在医学
相关文章
相关标签/搜索