【转】JDK 7 中的 Fork/Join 模式

时间 2019-11-19

标签 jdk fork join 模式栏目 Java 繁體版

原文原文链接

随着多核芯片逐渐成为主流，大多数软件开发人员不可避免地须要了解并行编程的知识。而同时，主流程序语言正在将愈来愈多的并行特性合并到标准库或者语言自己之中。咱们能够看到，JDK 在这方面一样走在潮流的前方。在 JDK 标准版 5 中，由 Doug Lea 提供的并行框架成为了标准库的一部分（JSR-166）。随后，在 JDK 6 中，一些新的并行特性，例如并行 collection 框架，合并到了标准库中（JSR-166x）。直到今天，尽管 Java SE 7 尚未正式发布，一些并行相关的新特性已经出如今 JSR-166y 中：java

Fork/Join 模式；
TransferQueue，它继承自 BlockingQueue 并能在队列满时阻塞“生产者”；
ArrayTasks/ListTasks，用于并行执行某些数组/列表相关任务的类；
IntTasks/LongTasks/DoubleTasks，用于并行处理数字类型数组的工具类，提供了排序、查找、求和、求最小值、求最大值等功能；

其中，对 Fork/Join 模式的支持多是对开发并行软件来讲最通用的新特性。在 JSR-166y 中，Doug Lea 实现 ArrayTasks/ListTasks/IntTasks/LongTasks/DoubleTasks 时就大量的用到了 Fork/Join 模式。读者还须要注意一点，由于 JDK 7 尚未正式发布，所以本文涉及到的功能和发布版本有可能不同。算法

Fork/Join 模式有本身的适用范围。若是一个应用能被分解成多个子任务，而且组合多个子任务的结果就可以得到最终的答案，那么这个应用就适合用 Fork/Join 模式来解决。图 1 给出了一个 Fork/Join 模式的示意图，位于图上部的 Task 依赖于位于其下的 Task 的执行，只有当全部的子任务都完成以后，调用者才能得到 Task 0 的返回结果。编程

图 1. Fork/Join 模式示意图

能够说，Fork/Join 模式可以解决不少种类的并行问题。经过使用 Doug Lea 提供的 Fork/Join 框架，软件开发人员只须要关注任务的划分和中间结果的组合就能充分利用并行平台的优良性能。其余和并行相关的诸多难于处理的问题，例如负载平衡、同步等，均可以由框架采用统一的方式解决。这样，咱们就可以轻松地得到并行的好处而避免了并行编程的困难且容易出错的缺点。数组

回页首多线程

使用 Fork/Join 模式并发

在开始尝试 Fork/Join 模式以前，咱们须要从 Doug Lea 主持的 Concurrency JSR-166 Interest Site 上下载 JSR-166y 的源代码，而且咱们还须要安装最新版本的 JDK 6（下载网址请参阅参考资源）。Fork/Join 模式的使用方式很是直观。首先，咱们须要编写一个 ForkJoinTask 来完成子任务的分割、中间结果的合并等工做。随后，咱们将这个 ForkJoinTask 交给 ForkJoinPool 来完成应用的执行。框架

一般咱们并不直接继承 ForkJoinTask，它包含了太多的抽象方法。针对特定的问题，咱们能够选择 ForkJoinTask 的不一样子类来完成任务。RecursiveAction 是 ForkJoinTask 的一个子类，它表明了一类最简单的 ForkJoinTask：不须要返回值，当子任务都执行完毕以后，不须要进行中间结果的组合。若是咱们从 RecursiveAction 开始继承，那么咱们只须要重载 protected void compute() 方法。下面，咱们来看看怎么为快速排序算法创建一个 ForkJoinTask 的子类：dom

清单 1. ForkJoinTask 的子类

class SortTask extends RecursiveAction {
    final long[] array;
    final int lo;
    final int hi;
    private int THRESHOLD = 30;

    public SortTask(long[] array) {
        this.array = array;
        this.lo = 0;
        this.hi = array.length - 1;
    }

    public SortTask(long[] array, int lo, int hi) {
        this.array = array;
        this.lo = lo;
        this.hi = hi;
    }

    protected void compute() {
        if (hi - lo < THRESHOLD)
            sequentiallySort(array, lo, hi);
        else {
            int pivot = partition(array, lo, hi);
            coInvoke(new SortTask(array, lo, pivot - 1), new SortTask(array,
                pivot + 1, hi));
        }
    }

    private int partition(long[] array, int lo, int hi) {
        long x = array[hi];
        int i = lo - 1;
        for (int j = lo; j < hi; j++) {
            if (array[j] <= x) {
                i++;
                swap(array, i, j);
            }
        }
        swap(array, i + 1, hi);
        return i + 1;
    }

    private void swap(long[] array, int i, int j) {
        if (i != j) {
            long temp = array[i];
            array[i] = array[j];
            array[j] = temp;
        }
    }

    private void sequentiallySort(long[] array, int lo, int hi) {
        Arrays.sort(array, lo, hi + 1);
    }
}

在清单 1 中，SortTask 首先经过 partition() 方法将数组分红两个部分。随后，两个子任务将被生成并分别排序数组的两个部分。当子任务足够小时，再将其分割为更小的任务反而引发性能的下降。所以，这里咱们使用一个 THRESHOLD，限定在子任务规模较小时，使用直接排序，而不是再将其分割成为更小的任务。其中，咱们用到了 RecursiveAction 提供的方法 coInvoke()。它表示：启动全部的任务，并在全部任务都正常结束后返回。若是其中一个任务出现异常，则其它全部的任务都取消。coInvoke() 的参数还能够是任务的数组。异步

如今剩下的工做就是将 SortTask 提交到 ForkJoinPool 了。ForkJoinPool() 默认创建具备与 CPU 可以使用线程数相等线程个数的线程池。咱们在一个 JUnit 的 test 方法中将 SortTask 提交给一个新建的 ForkJoinPool：

清单 2. 新建的 ForkJoinPool

@Test
public void testSort() throws Exception {
    ForkJoinTask sort = new SortTask(array);
    ForkJoinPool fjpool = new ForkJoinPool();
    fjpool.submit(sort);
    fjpool.shutdown();

    fjpool.awaitTermination(30, TimeUnit.SECONDS);

    assertTrue(checkSorted(array));
}

在上面的代码中，咱们用到了 ForkJoinPool 提供的以下函数：

submit()：将 ForkJoinTask 类的对象提交给 ForkJoinPool，ForkJoinPool 将马上开始执行 ForkJoinTask。
shutdown()：执行此方法以后，ForkJoinPool 再也不接受新的任务，可是已经提交的任务能够继续执行。若是但愿马上中止全部的任务，能够尝试 shutdownNow() 方法。
awaitTermination()：阻塞当前线程直到 ForkJoinPool 中全部的任务都执行结束。

并行快速排序的完整代码以下所示：

清单 3. 并行快速排序的完整代码

package tests;

import static org.junit.Assert.*;

import java.util.Arrays;
import java.util.Random;
import java.util.concurrent.TimeUnit;

import jsr166y.forkjoin.ForkJoinPool;
import jsr166y.forkjoin.ForkJoinTask;
import jsr166y.forkjoin.RecursiveAction;

import org.junit.Before;
import org.junit.Test;

class SortTask extends RecursiveAction {
    final long[] array;
    final int lo;
    final int hi;
    private int THRESHOLD = 0; //For demo only

    public SortTask(long[] array) {
        this.array = array;
        this.lo = 0;
        this.hi = array.length - 1;
    }

    public SortTask(long[] array, int lo, int hi) {
        this.array = array;
        this.lo = lo;
        this.hi = hi;
    }

    protected void compute() {
        if (hi - lo < THRESHOLD)
            sequentiallySort(array, lo, hi);
        else {
            int pivot = partition(array, lo, hi);
            System.out.println("\npivot = " + pivot + ", low = " + lo + ", high = " + hi);
			System.out.println("array" + Arrays.toString(array));
            coInvoke(new SortTask(array, lo, pivot - 1), new SortTask(array,
                    pivot + 1, hi));
        }
    }

    private int partition(long[] array, int lo, int hi) {
        long x = array[hi];
        int i = lo - 1;
        for (int j = lo; j < hi; j++) {
            if (array[j] <= x) {
                i++;
                swap(array, i, j);
            }
        }
        swap(array, i + 1, hi);
        return i + 1;
    }

    private void swap(long[] array, int i, int j) {
        if (i != j) {
            long temp = array[i];
            array[i] = array[j];
            array[j] = temp;
        }
    }

    private void sequentiallySort(long[] array, int lo, int hi) {
        Arrays.sort(array, lo, hi + 1);
    }
}

public class TestForkJoinSimple {
    private static final int NARRAY = 16; //For demo only
    long[] array = new long[NARRAY];
    Random rand = new Random();

    @Before
    public void setUp() {
        for (int i = 0; i < array.length; i++) {
            array[i] = rand.nextLong()%100; //For demo only
        }
        System.out.println("Initial Array: " + Arrays.toString(array));
    }

    @Test
    public void testSort() throws Exception {
        ForkJoinTask sort = new SortTask(array);
        ForkJoinPool fjpool = new ForkJoinPool();
        fjpool.submit(sort);
        fjpool.shutdown();

        fjpool.awaitTermination(30, TimeUnit.SECONDS);

        assertTrue(checkSorted(array));
    }

    boolean checkSorted(long[] a) {
        for (int i = 0; i < a.length - 1; i++) {
            if (a[i] > (a[i + 1])) {
                return false;
            }
        }
        return true;
    }
}

运行以上代码，咱们能够获得如下结果：

Initial Array: [46, -12, 74, -67, 76, -13, -91, -96]

pivot = 0, low = 0, high = 7
array[-96, -12, 74, -67, 76, -13, -91, 46]

pivot = 5, low = 1, high = 7
array[-96, -12, -67, -13, -91, 46, 76, 74]

pivot = 1, low = 1, high = 4
array[-96, -91, -67, -13, -12, 46, 74, 76]

pivot = 4, low = 2, high = 4
array[-96, -91, -67, -13, -12, 46, 74, 76]

pivot = 3, low = 2, high = 3
array[-96, -91, -67, -13, -12, 46, 74, 76]

pivot = 2, low = 2, high = 2
array[-96, -91, -67, -13, -12, 46, 74, 76]

pivot = 6, low = 6, high = 7
array[-96, -91, -67, -13, -12, 46, 74, 76]

pivot = 7, low = 7, high = 7
array[-96, -91, -67, -13, -12, 46, 74, 76]

回页首

Fork/Join 模式高级特性

使用 RecursiveTask

除了 RecursiveAction，Fork/Join 框架还提供了其余 ForkJoinTask 子类：带有返回值的 RecursiveTask，使用 finish() 方法显式停止的 AsyncAction 和 LinkedAsyncAction，以及可以使用 TaskBarrier 为每一个任务设置不一样停止条件的 CyclicAction。

从 RecursiveTask 继承的子类一样须要重载 protected void compute() 方法。与 RecursiveAction 稍有不一样的是，它可以使用泛型指定一个返回值的类型。下面，咱们来看看如何使用 RecursiveTask 的子类。

清单 4. RecursiveTask 的子类

class Fibonacci extends RecursiveTask<Integer> {
    final int n;

    Fibonacci(int n) {
        this.n = n;
    }

    private int compute(int small) {
        final int[] results = { 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89 };
        return results[small];
    }

    public Integer compute() {
        if (n <= 10) {
            return compute(n);
        }
        Fibonacci f1 = new Fibonacci(n - 1);
        Fibonacci f2 = new Fibonacci(n - 2);
        f1.fork();
        f2.fork();
        return f1.join() + f2.join();
    }
}

在清单 4 中， Fibonacci 的返回值为 Integer 类型。其 compute() 函数首先创建两个子任务，启动子任务执行，阻塞以等待子任务的结果返回，相加后获得最终结果。一样，当子任务足够小时，经过查表获得其结果，以减少因过多地分割任务引发的性能下降。其中，咱们用到了 RecursiveTask 提供的方法 fork() 和 join()。它们分别表示：子任务的异步执行和阻塞等待结果完成。

如今剩下的工做就是将 Fibonacci 提交到 ForkJoinPool 了，咱们在一个 JUnit 的 test 方法中做了以下处理：

清单 5. 将 Fibonacci 提交到 ForkJoinPool

@Test
public void testFibonacci() throws InterruptedException, ExecutionException {
    ForkJoinTask<Integer> fjt = new Fibonacci(45);
    ForkJoinPool fjpool = new ForkJoinPool();
    Future<Integer> result = fjpool.submit(fjt);

    // do something
    System.out.println(result.get());
}

使用 CyclicAction 来处理循环任务

CyclicAction 的用法稍微复杂一些。若是一个复杂任务须要几个线程协做完成，而且线程之间须要在某个点等待全部其余线程到达，那么咱们就能方便的用 CyclicAction 和 TaskBarrier 来完成。图 2 描述了使用 CyclicAction 和 TaskBarrier 的一个典型场景。

图 2. 使用 CyclicAction 和 TaskBarrier 执行多线程任务

继承自 CyclicAction 的子类须要 TaskBarrier 为每一个任务设置不一样的停止条件。从 CyclicAction 继承的子类须要重载 protected void compute() 方法，定义在 barrier 的每一个步骤须要执行的动做。compute() 方法将被反复执行直到 barrier 的 isTerminated() 方法返回 True。TaskBarrier 的行为相似于 CyclicBarrier。下面，咱们来看看如何使用 CyclicAction 的子类。

清单 6. 使用 CyclicAction 的子类

class ConcurrentPrint extends RecursiveAction {
    protected void compute() {
        TaskBarrier b = new TaskBarrier() {
            protected boolean terminate(int cycle, int registeredParties) {
                System.out.println("Cycle is " + cycle + ";"
                        + registeredParties + " parties");
                return cycle >= 10;
            }
        };
        int n = 3;
        CyclicAction[] actions = new CyclicAction[n];
        for (int i = 0; i < n; ++i) {
            final int index = i;
            actions[i] = new CyclicAction(b) {
                protected void compute() {
                    System.out.println("I'm working " + getCycle() + " "
                            + index);
                    try {
                        Thread.sleep(500);
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    }
                }
            };
        }
        for (int i = 0; i < n; ++i)
            actions[i].fork();
        for (int i = 0; i < n; ++i)
            actions[i].join();
    }
}

在清单 6 中，CyclicAction[] 数组创建了三个任务，打印各自的工做次数和序号。而在 b.terminate() 方法中，咱们设置的停止条件表示重复 10 次计算后停止。如今剩下的工做就是将 ConcurrentPrint 提交到 ForkJoinPool 了。咱们能够在 ForkJoinPool 的构造函数中指定须要的线程数目，例如 ForkJoinPool(4) 就代表线程池包含 4 个线程。咱们在一个 JUnit 的 test 方法中运行 ConcurrentPrint 的这个循环任务：

清单 7. 运行 ConcurrentPrint 循环任务

@Test
public void testBarrier () throws InterruptedException, ExecutionException {
    ForkJoinTask fjt = new ConcurrentPrint();
    ForkJoinPool fjpool = new ForkJoinPool(4);
    fjpool.submit(fjt);
    fjpool.shutdown();
}

RecursiveTask 和 CyclicAction 两个例子的完整代码以下所示：

清单 8. RecursiveTask 和 CyclicAction 两个例子的完整代码

package tests;

import java.util.concurrent.ExecutionException;
import java.util.concurrent.Future;

import jsr166y.forkjoin.CyclicAction;
import jsr166y.forkjoin.ForkJoinPool;
import jsr166y.forkjoin.ForkJoinTask;
import jsr166y.forkjoin.RecursiveAction;
import jsr166y.forkjoin.RecursiveTask;
import jsr166y.forkjoin.TaskBarrier;

import org.junit.Test;

class Fibonacci extends RecursiveTask<Integer> {
    final int n;

    Fibonacci(int n) {
        this.n = n;
    }

    private int compute(int small) {
        final int[] results = { 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89 };
        return results[small];
    }

    public Integer compute() {
        if (n <= 10) {
            return compute(n);
        }
        Fibonacci f1 = new Fibonacci(n - 1);
        Fibonacci f2 = new Fibonacci(n - 2);
        System.out.println("fork new thread for " + (n - 1));
        f1.fork();
        System.out.println("fork new thread for " + (n - 2));
        f2.fork();
        return f1.join() + f2.join();
    }
}

class ConcurrentPrint extends RecursiveAction {
    protected void compute() {
        TaskBarrier b = new TaskBarrier() {
            protected boolean terminate(int cycle, int registeredParties) {
                System.out.println("Cycle is " + cycle + ";"
                        + registeredParties + " parties");
                return cycle >= 10;
            }
        };
        int n = 3;
        CyclicAction[] actions = new CyclicAction[n];
        for (int i = 0; i < n; ++i) {
            final int index = i;
            actions[i] = new CyclicAction(b) {
                protected void compute() {
                    System.out.println("I'm working " + getCycle() + " "
                            + index);
                    try {
                        Thread.sleep(500);
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    }
                }
            };
        }
        for (int i = 0; i < n; ++i)
            actions[i].fork();
        for (int i = 0; i < n; ++i)
            actions[i].join();
    }
}

public class TestForkJoin {
    @Test
    public void testBarrier () throws InterruptedException, ExecutionException {
		System.out.println("\ntesting Task Barrier ...");
        ForkJoinTask fjt = new ConcurrentPrint();
        ForkJoinPool fjpool = new ForkJoinPool(4);
        fjpool.submit(fjt);
        fjpool.shutdown();
    }

    @Test
    public void testFibonacci () throws InterruptedException, ExecutionException {
    	System.out.println("\ntesting Fibonacci ...");
		final int num = 14; //For demo only
        ForkJoinTask<Integer> fjt = new Fibonacci(num);
        ForkJoinPool fjpool = new ForkJoinPool();
        Future<Integer> result = fjpool.submit(fjt);

        // do something
        System.out.println("Fibonacci(" + num + ") = " + result.get());
    }
}

运行以上代码，咱们能够获得如下结果：

testing Task Barrier ...
I'm working 0 2
I'm working 0 0
I'm working 0 1
Cycle is 0; 3 parties
I'm working 1 2
I'm working 1 0
I'm working 1 1
Cycle is 1; 3 parties
I'm working 2 0
I'm working 2 1
I'm working 2 2
Cycle is 2; 3 parties
I'm working 3 0
I'm working 3 2
I'm working 3 1
Cycle is 3; 3 parties
I'm working 4 2
I'm working 4 0
I'm working 4 1
Cycle is 4; 3 parties
I'm working 5 1
I'm working 5 0
I'm working 5 2
Cycle is 5; 3 parties
I'm working 6 0
I'm working 6 2
I'm working 6 1
Cycle is 6; 3 parties
I'm working 7 2
I'm working 7 0
I'm working 7 1
Cycle is 7; 3 parties
I'm working 8 1
I'm working 8 0
I'm working 8 2
Cycle is 8; 3 parties
I'm working 9 0
I'm working 9 2

testing Fibonacci ...
fork new thread for 13
fork new thread for 12
fork new thread for 11
fork new thread for 10
fork new thread for 12
fork new thread for 11
fork new thread for 10
fork new thread for 9
fork new thread for 10
fork new thread for 9
fork new thread for 11
fork new thread for 10
fork new thread for 10
fork new thread for 9
Fibonacci(14) = 610

回页首

结论

从以上的例子中能够看到，经过使用 Fork/Join 模式，软件开发人员可以方便地利用多核平台的计算能力。尽管尚未作到对软件开发人员彻底透明，Fork/Join 模式已经极大地简化了编写并发程序的琐碎工做。对于符合 Fork/Join 模式的应用，软件开发人员再也不须要处理各类并行相关事务，例如同步、通讯等，以难以调试而闻名的死锁和 data race 等错误也就不会出现，提高了思考问题的层次。你能够把 Fork/Join 模式看做并行版本的 Divide and Conquer 策略，仅仅关注如何划分任务和组合中间结果，将剩下的事情丢给 Fork/Join 框架。

在实际工做中利用 Fork/Join 模式，能够充分享受多核平台为应用带来的免费午饭。

访问 Doug Lea 的 JSR 166 站点得到最新的源代码。