MRJob 极速入门教程,使用Python玩转Hadoop

想要Hadoop乖巧地运行Python程序,学习mrjob可能是最直接、最简单的方法了,你甚至都不要按安装部署Hadoop集群。mrjob拥有很多优秀的特性比如: 支持多步骤的MapReduce任务工作流 支持内嵌、本地、远程亚马逊以及Hadoop 调试方便不需要任务环境支持 本教程通过 python 中 mrjob 模块来调用 hadoop 处理数据。通过本次实验,你可以初步入门mrjob,轻松
相关文章
相关标签/搜索