Java 理论与实践: 变仍是不变？

时间 2019-12-15

标签 java 理论实践仍是不变栏目 Java 繁體版

原文原文链接

http://www.ibm.com/developerworks/cn/java/j-jtp02183/java

不变对象是指在实例化后其外部可见状态没法更改的对象。Java 类库中的 String 、 Integer 和BigDecimal 类就是不变对象的示例 ― 它们表示在对象的生命期内没法更改的单个值。编程

不变性的长处

若是正确使用不变类，它们会极大地简化编程。由于它们只能处于一种状态，因此只要正确构造了它们，就决不会陷入不一致的状态。您没必要复制或克隆不变对象，就能自由地共享和高速缓存对它们的引用；您能够高速缓存它们的字段或其方法的结果，而不用担忧值会不会变成失效的或与对象的其它状态不一致。不变类一般产生最好的映射键。并且，它们原本就是线程安全的，因此没必要在线程间同步对它们的访问。数组

自由高速缓存

由于不变对象的值没有更改的危险，因此能够自由地高速缓存对它们的引用，并且能够确定之后的引用仍将引用同一个值。一样地，由于它们的特性没法更改，因此您能够高速缓存它们的字段和其方法的结果。缓存

若是对象是可变的，就必须在存储对其的引用时引发注意。请考虑清单 1 中的代码，其中排列了两个由调度程序执行的任务。目的是：如今启动第一个任务，而在某一天启动第二个任务。安全

清单 1. 可变的 Date 对象的潜在问题

 Date d = new Date();
  Scheduler.scheduleTask(task1, d);
  d.setTime(d.getTime() + ONE_DAY);
  scheduler.scheduleTask(task2, d);

由于 Date 是可变的，因此 scheduleTask 方法必须当心地用防范措施将日期参数复制（可能经过 clone() ）到它的内部数据结构中。否则， task1 和 task2 可能都在明天执行，这可不是所指望的。更糟的是，任务调度程序所用的内部数据结构会变成讹误。在编写象scheduleTask() 这样的方法时，极其容易忘记用防范措施复制日期参数。若是忘记这样作，您就制造了一个难以捕捉的错误，这个错误不会立刻显现出来，并且当它暴露时人们要花较长的时间才会捕捉到。不变的 Date 类不可能发生这类错误。数据结构

固有的线程安全

大多数的线程安全问题发生在当多个线程正在试图并发地修改一个对象的状态（写-写冲突）时，或当一个线程正试图访问一个对象的状态，而另外一个线程正在修改它（读-写冲突）时。要防止这样的冲突，必须同步对共享对象的访问，以便在对象处于不一致状态时其它线程不能访问它们。正确地作到这一点会很难，须要大量文档来确保正确地扩展程序，还可能对性能产生不利后果。只要正确构造了不变对象（这意味着不让对象引用从构造函数中转义），就使它们免除了同步访问的要求，由于没法更改它们的状态，从而就不可能存在写-写冲突或读-写冲突。并发

不用同步就能自由地在线程间共享对不变对象的引用，能够极大地简化编写并发程序的过程，并减小程序可能存在的潜在并发错误的数量。ide

在恶意运行的代码面前是安全的

把对象看成参数的方法不该变动那些对象的状态，除非文档明确说明能够这样作，或者实际上这些方法具备该对象的全部权。当咱们将一个对象传递给普通方法时，一般不但愿对象返回时已被更改。可是，使用可变对象时，彻底会是这样的。若是将 java.awt.Point 传递给诸如Component.setLocation() 的方法，根本不会阻止 setLocation 修改咱们传入的 Point 的位置，也不会阻止 setLocation 存储对该点的引用并稍后在另外一个方法中更改它。（固然， Component 不这样作，由于它不鲁莽，可是并非全部类都那么客气。）如今， Point 的状态已在咱们不知道的状况下更改了，其结果具备潜在危险 ― 当点实际上在另外一个位置时，咱们仍认为它在原来的位置。然而，若是 Point 是不变的，那么这种恶意的代码就不能以如此使人混乱而危险的方法修改咱们的程序状态了。函数

良好的键

不变对象产生最好的 HashMap 或 HashSet 键。有些可变对象根据其状态会更改它们的 hashCode() 值（如清单 2 中的 StringHolder 示例类）。若是使用这种可变对象做为 HashSet 键，而后对象更改了其状态，那么就会对 HashSet 实现引发混乱 ― 若是枚举集合，该对象仍将出现，但若是用 contains() 查询集合，它就可能不出现。无需多说，这会引发某些混乱的行为。说明这一状况的清单 2 中的代码将打印“false”、“1”和“moo”。性能

清单 2. 可变 StringHolder 类，不适合用做键

   public class StringHolder {
        private String string;
        public StringHolder(String s) {
            this.string = s;
        }
        public String getString() {
            return string;
        }
        public void setString(String string) {
            this.string = string;
        }
        public boolean equals(Object o) {
            if (this == o)
                return true;
            else if (o == null || !(o instanceof StringHolder))
                return false;
            else {
                final StringHolder other = (StringHolder) o;
                if (string == null)
                    return (other.string == null);
                else
                    return string.equals(other.string);
            }
        }
        public int hashCode() {
            return (string != null ? string.hashCode() : 0);
        }
        public String toString() {
            return string;
        }
        ...
        StringHolder sh = new StringHolder("blert");
        HashSet h = new HashSet();
        h.add(sh);
        sh.setString("moo");
        System.out.println(h.contains(sh));
        System.out.println(h.size());
        System.out.println(h.iterator().next());
    }

回页首

什么时候使用不变类

不变类最适合表示抽象数据类型（如数字、枚举类型或颜色）的值。Java 类库中的基本数字类（如 Integer 、 Long 和 Float ）都是不变的，其它标准数字类型（如 BigInteger 和 BigDecimal ）也是不变的。表示复数或精度任意的有理数的类将比较适合于不变性。甚至包含许多离散值的抽象类型（如向量或矩阵）也很适合实现为不变类，这取决于您的应用程序。

Flyweight 模式

不变性启用了 Flyweight 模式，该模式利用共享使得用对象有效地表示大量细颗粒度的对象变得容易。例如，您可能但愿用一个对象来表示字处理文档中的每一个字符或图像中的每一个像素，但这一策略的幼稚实现将会对内存使用和内存管理开销产生高得惊人的花费。Flyweight 模式采用工厂方法来分配对不变的细颗粒度对象的引用，并经过仅使一个对象实例与字母“a”对应来利用共享缩减对象数。有关 Flyweight 模式的更多信息，请参阅经典书籍Design Patterns（Gamma 等著；请参阅参考资料）。

Java 类库中不变性的另外一个不错的示例是 java.awt.Color 。在某些颜色表示法（如 RGB、HSB 或 CMYK）中，颜色一般表示为一组有序的数字值，但把一种颜色看成颜色空间中的一个特异值，而不是一组有序的独立可寻址的值更有意义，所以将 Color 做为不变类实现是有道理的。

若是要表示的对象是多个基本值的容器（如：点、向量、矩阵或 RGB 颜色），是用可变对象仍是用不变对象表示？答案是……要看状况而定。要如何使用它们？它们主要用来表示多维值（如像素的颜色），仍是仅仅用做其它对象的一组相关特性集合（如窗口的高度和宽度）的容器？这些特性多久更改一次？若是更改它们，那么各个组件值在应用程序中是否有其本身的含义呢？

事件是另外一个适合用不变类实现的好示例。事件的生命期较短，并且经常会在建立它们的线程之外的线程中消耗，因此使它们成为不变的是利大于弊。大多数 AWT 事件类都没有做为严格的不变类来实现，而是能够有小小的修改。一样地，在使用必定形式的消息传递以在组件间通讯的系统中，使消息对象成为不变的或许是明智的。

回页首

编写不变类的准则

编写不变类很容易。若是如下几点都为真，那么类就是不变的：

它的全部字段都是 final
该类声明为 final
不容许 this 引用在构造期间转义
任何包含对可变对象（如数组、集合或相似 Date 的可变类）引用的字段：
- 是私有的
- 从不被返回，也不以其它方式公开给调用程序
- 是对它们所引用对象的惟一引用
- 构造后不会更改被引用对象的状态

最后一组要求彷佛挺复杂的，但其基本上意味着若是要存储对数组或其它可变对象的引用，就必须确保您的类对该可变对象拥有独占访问权（由于否则的话，其它类可以更改其状态），并且在构造后您不修改其状态。为容许不变对象存储对数组的引用，这种复杂性是必要的，由于 Java 语言没有办法强制不对 final 数组的元素进行修改。注：若是从传递给构造函数的参数中初始化数组引用或其它可变字段，您必须用防范措施将调用程序提供的参数或您没法确保具备独占访问权的其它信息复制到数组。不然，调用程序会在调用构造函数以后，修改数组的状态。清单 3 显示了编写一个存储调用程序提供的数组的不变对象的构造函数的正确方法（和错误方法）。

清单 3. 对不变对象编码的正确和错误方法

class ImmutableArrayHolder {
  private final int[] theArray;
  // Right way to write a constructor -- copy the array
  public ImmutableArrayHolder(int[] anArray) {
    this.theArray = (int[]) anArray.clone();
  }
  // Wrong way to write a constructor -- copy the reference
  // The caller could change the array after the call to the constructor
  public ImmutableArrayHolder(int[] anArray) {
    this.theArray = anArray;
  }
  // Right way to write an accessor -- don't expose the array reference
  public int getArrayLength() { return theArray.length }
  public int getArray(int n)  { return theArray[n]; }
  // Right way to write an accessor -- use clone()
  public int[] getArray()       { return (int[]) theArray.clone(); }
  // Wrong way to write an accessor -- expose the array reference
  // A caller could get the array reference and then change the contents
  public int[] getArray()       { return theArray }
}

经过一些其它工做，能够编写使用一些非 final 字段的不变类（例如， String 的标准实现使用 hashCode 值的惰性计算），这样可能比严格的 final 类执行得更好。若是类表示抽象类型（如数字类型或颜色）的值，那么您还会想实现 hashCode() 和 equals() 方法，这样对象将做为HashMap 或 HashSet 中的一个键工做良好。要保持线程安全，不容许 this 引用从构造函数中转义是很重要的。

回页首

偶尔更改的数据

有些数据项在程序生命期中一直保持常量，而有些会频繁更改。常量数据显然符合不变性，而状态复杂且频繁更改的对象一般不适合用不变类来实现。那么有时会更改，但更改又不太频繁的数据呢？有什么方法能让有时更改的数据得到不变性的便利和线程安全的长处呢？

util.concurrent 包中的 CopyOnWriteArrayList 类是如何既利用不变性的能力，又仍容许偶尔修改的一个良好示例。它最适合于支持事件监听程序的类（如用户界面组件）使用。虽然事件监听程序的列表能够更改，但一般它更改的频繁性要比事件的生成少得多。

除了在修改列表时， CopyOnWriteArrayList 并不变动基本数组，而是建立新数组且废弃旧数组以外，它的行为与 ArrayList 类很是类似。这意味着当调用程序得到迭代器（迭代器在内部保存对基本数组的引用）时，迭代器引用的数组其实是不变的，从而能够无需同步或冒并发修改的风险进行遍历。这消除了在遍历前克隆列表或在遍历期间对列表进行同步的须要，这两个操做都很麻烦、易于出错，并且彻底使性能恶化。若是遍历比插入或除去更加频繁（这在某些状况下是常有的事）， CopyOnWriteArrayList 会提供更佳的性能和更方便的访问。

回页首

结束语

使用不变对象比使用可变对象要容易得多。它们只能处于一种状态，因此始终是一致的，它们原本就是线程安全的，能够被自由地共享。使用不变对象能够完全消除许多容易发生但难以检测的编程错误，如没法在线程间同步访问或在存储对数组或对象的引用前没法克隆该数组或对象。在编写类时，问问本身这个类是否能够做为不变类有效地实现，老是值得的。您可能会对回答经常是确定的而感到吃惊。