Oozie — What Why and How

  • Oozie是什么?

Oozie最初是Yahoo!为Hadoop开发的一个工做流调度器,一个工做流有多个Job组成。它容许用户提交由多个Job组成的工做流配置文件,这些Job既能够顺序执行,也能够并行执行,还能够配置其中的Job定时执行、出错从新执行等。html

Oozie提供了Java Client API和Web Service API以及命令行接口,使用简单。linux

如今是Apache的一个开源项目。git

  • 为何使用Oozie?

主要是为了更方便、自由的使用Hadoop,提交做业。github

对一个集群中天天有大量左右须要提交执行的状况来讲,使用Oozie管理这些Job很方便。apache

另一点就是,若是有Job执行出错,能够配置Oozie从新执行这些Job。app

  • 如何使用Oozie?
    1. 首先须要执行的Job的配置写入workflow.xml,配置中须要指明每一个Job的输入文件、输出文件、输出Reader、输出Writer、Mapper、Reducer、Job的执行参数
    2. 而后提交这个xml文件
    3. 配置workflow的property (指明Name Node、JobTraker、job执行过程当中所使用的jar包的location)

关于oozie的更多信息,请参考:
http://yahoo.github.com/oozie/
http://yahoo.github.com/oozie/releases/3.1.0/
http://incubator.apache.org/oozieoop

--------------
本文地址:http://nourlcn.ownlinux.net/2011/11/oozie-what-why-and-how.htmlurl

https://twitter.com/nourlcn.net

2011-11-20 命令行

相关文章
相关标签/搜索