一、设置job的基础属性apache
Job job = new Job();
job.setJarByClass(***.class); //要执行的类
job.setJobName(“job name”); //做业的名字
job.setNumReduce(2); //reduce的数目app
二、设置Map与Reudce的类oop
job.setMappgerClass(*.class); //map类
job.setReduceClass(*.class); //reduce类orm
三、设置Job的输入输出格式hadoop
void setInputFormatClass(Class<? extends InputFormat> cls)
void setOutputFormatClass(Class<? extends OutputFormat> cls)input
前者默认是TextInputFormat,后者是FileOutputFormat。it
四、设置Job的输入输出路径io
当输入输出是文件时,须要指定路径。table
InputFormat:
static void addInputPath(JobConf conf, Path path)
FileOutputFormat:
static void setOutputPath(Job job, Path outputDir)class
当输入格式是其它类型时,则须要指定相应的属性,如Gora的DataSource。
五、设置map与reduce的输出键值类型
主要有如下4个类
void setOutputKeyClass(Class<?> theClass)
void setOutputValueClass(Class<?> theClass)
void setMapOutputKeyClass(Class<?> theClass)
void setMapOutputValueClass(Class<?> theClass)
(1)前面2个方法设置整个job的输出,即reduce的输出。默认状况下,map的输出类型与reduce一致,若两者不一致,则须要经过后面2个方法来指定map的输出类型。
(2)关于输入类型的说明:reduce的输入类型由output的输出类型决定。map的输入类型由输入格式决定,如输入格式是FileInputFormat,则输入KV类型为LongWriterable与Text。
六、运行程序
job.waitForCompletion()
咱们还能够设置combine类和partition类
job.setCombinerClass(Combine.class);
job.setPartitionerClass(MyPartition.class);
附带一张图:
完整例子
package org.jediael.hadoopdemo.maxtemperature;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
public class MaxTemperature {
public static void main(String[] args) throws Exception {
if (args.length != 2) {
System.err
.println("Usage: MaxTemperature <input path> <output path>");
System.exit(-1);
}
//一、设置job的基础属性
Job job = new Job();
job.setJarByClass(MaxTemperature.class);
job.setJobName("Max temperature");
//二、设置Map与Reudce的类
job.setMapperClass(MaxTemperatureMapper.class);
job.setReducerClass(MaxTemperatureReducer.class);
//四、设置map与reduce的输出键值类型
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(IntWritable.class);
//五、设置输入输出路径
FileInputFormat.addInputPath(job, new Path(args[0]));
FileOutputFormat.setOutputPath(job, new Path(args[1]));
//六、运行程序
System.exit(job.waitForCompletion(true) ? 0 : 1);
}
}
这个是驱动程序,接着咱们要分别实现相关的类