Java编程的逻辑 (66) - 理解synchronized

时间 2019-11-24

原文原文链接

本系列文章经补充和完善，已修订整理成书《Java编程的逻辑》，由机械工业出版社华章分社出版，于2018年1月上市热销，读者好评如潮！各大网店和书店有售，欢迎购买，京东自营连接：http://item.jd.com/12299018.htmlhtml

上节咱们提到了多线程共享内存的两个问题，一个是竞态条件，另外一个是内存可见性，咱们提到，解决这两个问题的一个方案是使用synchronized关键字，本节就来讨论这个关键字。java

用法git

synchronized能够用于修饰类的实例方法、静态方法和代码块，咱们分别来看下。github

实例方法编程

上节咱们介绍了一个计数的例子，当多个线程并发执行counter++的时候，因为该语句不是原子操做，出现了意料以外的结果，这个问题能够用synchronized解决。swift

咱们来看代码：缓存

public class Counter {
    private int count;

    public synchronized void incr(){
        count ++;
    }
    
    public synchronized int getCount() {
        return count;
    }
}

Counter是一个简单的计数器类，incr方法和getCount方法都加了synchronized修饰。加了synchronized后，方法内的代码就变成了原子操做，当多个线程并发更新同一个Counter对象的时候，也不会出现问题，咱们看使用的代码：安全

public class CounterThread extends Thread {
    Counter counter;

    public CounterThread(Counter counter) {
        this.counter = counter;
    }

    @Override
    public void run() {
        try {
            Thread.sleep((int) (Math.random() * 10));
        } catch (InterruptedException e) {
        }
        counter.incr();
    }

    public static void main(String[] args) throws InterruptedException {
        int num = 100;
        Counter counter = new Counter();
        Thread[] threads = new Thread[num];
        for (int i = 0; i < num; i++) {
            threads[i] = new CounterThread(counter);
            threads[i].start();
        }
        for (int i = 0; i < num; i++) {
            threads[i].join();
        }
        System.out.println(counter.getCount());
    }
}

与上节相似，咱们建立了100个线程，传递了相同的counter对象，每一个线程主要就是调用Counter的incr方法，main线程等待子线程结束后输出counter的值，此次，不论运行多少次，结果都是正确的100。微信

这里，synchronized到底作了什么呢？看上去，synchronized使得同时只能有一个线程执行实例方法，但这个理解是不确切的。多个线程是能够同时执行同一个synchronized实例方法的，只要它们访问的对象是不一样的，好比说：多线程

Counter counter1 = new Counter();
Counter counter2 = new Counter();
Thread t1 = new CounterThread(counter1);
Thread t2 = new CounterThread(counter2);
t1.start();
t2.start();

这里，t1和t2两个线程是能够同时执行Counter的incr方法的，由于它们访问的是不一样的Counter对象，一个是counter1，另外一个是counter2。

因此，synchronized实例方法实际保护的是同一个对象的方法调用，确保同时只能有一个线程执行。再具体来讲，synchronized实例方法保护的是当前实例对象，即this，this对象有一个锁和一个等待队列，锁只能被一个线程持有，其余试图得到一样锁的线程须要等待，执行synchronized实例方法的过程大概以下：

尝试得到锁，若是可以得到锁，继续下一步，不然加入等待队列，阻塞并等待唤醒
执行实例方法体代码
释放锁，若是等待队列上有等待的线程，从中取一个并唤醒，若是有多个等待的线程，唤醒哪个是不必定的，不保证公平性

synchronized的实际执行过程比这要复杂的多，并且Java虚拟机采用了多种优化方式以提升性能，但从概念上，咱们能够这么简单理解。

当前线程不能得到锁的时候，它会加入等待队列等待，线程的状态会变为BLOCKED。

咱们再强调下，synchronized保护的是对象而非代码，只要访问的是同一个对象的synchronized方法，即便是不一样的代码，也会被同步顺序访问，好比，对于Counter中的两个实例方法getCount和incr，对同一个Counter对象，一个线程执行getCount，另外一个执行incr，它们是不能同时执行的，会被synchronized同步顺序执行。

此外，须要说明的，synchronized方法不能防止非synchronized方法被同时执行，好比，若是给Counter类增长一个非synchronized方法：

public void decr(){
    count --;
}

则该方法能够和synchronized的incr方法同时执行，这一般会出现非指望的结果，因此，通常在保护变量时，须要在全部访问该变量的方法上加上synchronized。

静态方法

synchronized一样能够用于静态方法，好比：

public class StaticCounter {
    private static int count = 0;

    public static synchronized void incr() {
        count++;
    }

    public static synchronized int getCount() {
        return count;
    }
}

前面咱们说，synchronized保护的是对象，对实例方法，保护的是当前实例对象this，对静态方法，保护的是哪一个对象呢？是类对象，这里是StaticCounter.class，实际上，每一个对象都有一个锁和一个等待队列，类对象也不例外。

synchronized静态方法和synchronized实例方法保护的是不一样的对象，不一样的两个线程，能够同时，一个执行synchronized静态方法，另外一个执行synchronized实例方法。

代码块

除了用于修饰方法外，synchronized还能够用于包装代码块，好比对于前面的Counter类，等价的代码能够为：

public class Counter {
    private int count;

    public void incr(){
        synchronized(this){
            count ++;    
        }
    }
    
    public int getCount() {
        synchronized(this){
            return count;
        }
    }
}

synchronized括号里面的就是保护的对象，对于实例方法，就是this，{}里面是同步执行的代码。

对于前面的StaticCounter类，等价的代码为：

public class StaticCounter {
    private static int count = 0;

    public static void incr() {
        synchronized(StaticCounter.class){
            count++;    
        }    
    }

    public static int getCount() {
        synchronized(StaticCounter.class){
            return count;    
        }
    }
}

synchronized同步的对象能够是任意对象，任意对象都有一个锁和等待队列，或者说，任何对象均可以做为锁对象。好比说，Counter的等价代码还能够为：

public class Counter {
    private int count;
    private Object lock = new Object();
    
    public void incr(){
        synchronized(lock){
            count ++;    
        }
    }
    
    public int getCount() {
        synchronized(lock){
            return count;
        }
    }
}

理解synchronized

介绍了synchronized的基本用法和原理，咱们再从下面几个角度来进一步理解一下synchronized：

可重入性
内存可见性
死锁

可重入性

synchronized有一个重要的特征，它是可重入的，也就是说，对同一个执行线程，它在得到了锁以后，在调用其余须要一样锁的代码时，能够直接调用，好比说，在一个synchronized实例方法内，能够直接调用其余synchronized实例方法。可重入是一个很是天然的属性，应该是很容易理解的，之因此强调，是由于并非全部锁都是可重入的(后续章节介绍)。

可重入是经过记录锁的持有线程和持有数量来实现的，当调用被synchronized保护的代码时，检查对象是否已被锁，若是是，再检查是否被当前线程锁定，若是是，增长持有数量，若是不是被当前线程锁定，才加入等待队列，当释放锁时，减小持有数量，当数量变为0时才释放整个锁。

内存可见性

对于复杂一些的操做，synchronized能够实现原子操做，避免出现竞态条件，但对于明显的原本就是原子的操做方法，也须要加synchronized吗？好比说，对于下面的开关类Switcher，它只有一个boolean变量on和对应的setter/getter方法：

public class Switcher {
    private boolean on;

    public boolean isOn() {
        return on;
    }

    public void setOn(boolean on) {
        this.on = on;
    }
}

当多线程同时访问同一个Switcher对象时，会有问题吗？没有竞态条件问题，但正如上节所说，有内存可见性问题，而加上synchronized能够解决这个问题。

synchronized除了保证原子操做外，它还有一个重要的做用，就是保证内存可见性，在释放锁时，全部写入都会写回内存，而得到锁后，都会从内存中读最新数据。

不过，若是只是为了保证内存可见性，使用synchronzied的成本有点高，有一个更轻量级的方式，那就是给变量加修饰符volatile，以下所示：

public class Switcher {
    private volatile boolean on;

    public boolean isOn() {
        return on;
    }

    public void setOn(boolean on) {
        this.on = on;
    }
}

加了volatile以后，Java会在操做对应变量时插入特殊的指令，保证读写到内存最新值，而非缓存的值。

死锁

使用synchronized或者其余锁，要注意死锁，所谓死锁就是相似这种现象，好比，有a, b两个线程，a持有锁A，在等待锁B，而b持有锁B，在等待锁A，a,b陷入了互相等待，最后谁都执行不下去。示例代码以下所示：

public class DeadLockDemo {
    private static Object lockA = new Object();
    private static Object lockB = new Object();

    private static void startThreadA() {
        Thread aThread = new Thread() {

            @Override
            public void run() {
                synchronized (lockA) {
                    try {
                        Thread.sleep(1000);
                    } catch (InterruptedException e) {
                    }
                    synchronized (lockB) {
                    }
                }
            }
        };
        aThread.start();
    }

    private static void startThreadB() {
        Thread bThread = new Thread() {
            @Override
            public void run() {
                synchronized (lockB) {
                    try {
                        Thread.sleep(1000);
                    } catch (InterruptedException e) {
                    }
                    synchronized (lockA) {
                    }
                }
            }
        };
        bThread.start();
    }

    public static void main(String[] args) {
        startThreadA();
        startThreadB();
    }
}

运行后aThread和bThread陷入了相互等待。怎么解决呢？首先，应该尽可能避免在持有一个锁的同时去申请另外一个锁，若是确实须要多个锁，全部代码都应该按照相同的顺序去申请锁，好比，对于上面的例子，能够约定都先申请lockA，再申请lockB。

不过，在复杂的项目代码中，这种约定可能难以作到。还有一种方法是使用后续章节介绍的显式锁接口Lock，它支持尝试获取锁(tryLock)和带时间限制的获取锁方法，使用这些方法能够在获取不到锁的时候释放已经持有的锁，而后再次尝试获取锁或干脆放弃，以免死锁。

若是仍是出现了死锁，怎么办呢？Java不会主动处理，不过，借助一些工具，咱们能够发现运行中的死锁，好比，Java自带的jstack命令会报告发现的死锁，对于上面的程序，在个人电脑上，jstack会有以下报告：

同步容器及其注意事项

同步容器

咱们在54节介绍过Collection的一些方法，它们能够返回线程安全的同步容器，好比：

public static <T> Collection<T> synchronizedCollection(Collection<T> c)
public static <T> List<T> synchronizedList(List<T> list)
public static <K,V> Map<K,V> synchronizedMap(Map<K,V> m)

它们是给全部容器方法都加上synchronized来实现安全的，好比SynchronizedCollection，其部分代码以下所示：

static class SynchronizedCollection<E> implements Collection<E> {
    final Collection<E> c;  // Backing Collection
    final Object mutex;     // Object on which to synchronize

    SynchronizedCollection(Collection<E> c) {
        if (c==null)
            throw new NullPointerException();
        this.c = c;
        mutex = this;
    }
    public int size() {
        synchronized (mutex) {return c.size();}
    }
    public boolean add(E e) {
        synchronized (mutex) {return c.add(e);}
    }
    public boolean remove(Object o) {
        synchronized (mutex) {return c.remove(o);}
    }
    //....
}

这里线程安全针对的是容器对象，指的是当多个线程并发访问同一个容器对象时，不须要额外的同步操做，也不会出现错误的结果。

加了synchronized，全部方法调用变成了原子操做，客户端在调用时，是否是就绝对安全了呢？不是的，至少有如下状况须要注意：

复合操做，好比先检查再更新
伪同步
迭代

复合操做

先来看复合操做，咱们看段代码：

public class EnhancedMap <K, V> {
    Map<K, V> map;
    
    public EnhancedMap(Map<K,V> map){
        this.map = Collections.synchronizedMap(map);
    }
    
    public V putIfAbsent(K key, V value){
         V old = map.get(key);
         if(old!=null){
             return old;
         }
         map.put(key, value);
         return null;
     }
    
    public void put(K key, V value){
        map.put(key, value);
    }
    
    //... 其余代码
}

EnhancedMap是一个装饰类，接受一个Map对象，调用synchronizedMap转换为了同步容器对象map，增长了一个方法putIfAbsent，该方法只有在原Map中没有对应键的时候才添加。

map的每一个方法都是安全的，但这个复合方法putIfAbsent是安全的吗？显然是否认的，这是一个检查而后再更新的复合操做，在多线程的状况下，可能有多个线程都执行完了检查这一步，都发现Map中没有对应的键，而后就会都调用put，而这就破坏了putIfAbsent方法指望保持的语义。

伪同步

那给该方法加上synchronized就能实现安全吗？以下所示：

public synchronized V putIfAbsent(K key, V value){
    V old = map.get(key);
    if(old!=null){
        return old;
    }
    map.put(key, value);
    return null;
}

答案是否认的！为何呢？同步错对象了。putIfAbsent同步使用的是EnhancedMap对象，而其余方法(如代码中的put方法)使用的是Collections.synchronizedMap返回的对象map，二者是不一样的对象。要解决这个问题，全部方法必须使用相同的锁，可使用EnhancedMap的对象锁，也可使用map。使用EnhancedMap对象做为锁，则EnhancedMap中的全部方法都须要加上synchronized。使用map做为锁，putIfAbsent方法能够改成：

public V putIfAbsent(K key, V value){
    synchronized(map){
        V old = map.get(key);
         if(old!=null){
             return old;
         }
         map.put(key, value);
         return null;    
    }
}

迭代

对于同步容器对象，虽然单个操做是安全的，但迭代并非。咱们看个例子，建立一个同步List对象，一个线程修改List，另外一个遍历，看看会发生什么，代码为：

private static void startModifyThread(final List<String> list) {
    Thread modifyThread = new Thread(new Runnable() {
        @Override
        public void run() {
            for (int i = 0; i < 100; i++) {
                list.add("item " + i);
                try {
                    Thread.sleep((int) (Math.random() * 10));
                } catch (InterruptedException e) {
                }
            }
        }
    });
    modifyThread.start();
}

private static void startIteratorThread(final List<String> list) {
    Thread iteratorThread = new Thread(new Runnable() {
        @Override
        public void run() {
            while (true) {
                for (String str : list) {
                }
            }
        }
    });
    iteratorThread.start();
}

public static void main(String[] args) {
    final List<String> list = Collections
            .synchronizedList(new ArrayList<String>());
    startIteratorThread(list);
    startModifyThread(list);
}

运行该程序，程序抛出并发修改异常：

Exception in thread "Thread-0" java.util.ConcurrentModificationException
    at java.util.ArrayList$Itr.checkForComodification(ArrayList.java:859)
    at java.util.ArrayList$Itr.next(ArrayList.java:831)

咱们以前介绍过这个异常，若是在遍历的同时容器发生告终构性变化，就会抛出该异常，同步容器并无解决这个问题，若是要避免这个异常，须要在遍历的时候给整个容器对象加锁，好比，上面的代码，startIteratorThread能够改成：

private static void startIteratorThread(final List<String> list) {
    Thread iteratorThread = new Thread(new Runnable() {
        @Override
        public void run() {
            while (true) {
                synchronized(list){
                    for (String str : list) {
                    }    
                }
            }
        }
    });
    iteratorThread.start();
}

并发容器

除了以上这些注意事项，同步容器的性能也是比较低的，当并发访问量比较大的时候性能不好。所幸的是，Java中还有不少专为并发设计的容器类，好比：

CopyOnWriteArrayList
ConcurrentHashMap
ConcurrentLinkedQueue
ConcurrentSkipListSet

这些容器类都是线程安全的，但都没有使用synchronized、没有迭代问题、直接支持一些复合操做、性能也高得多，它们能解决什么问题？怎么使用？实现原理是什么？咱们留待后续章节介绍。

小结
本节详细介绍了synchronized的用法和实现原理，为进一步理解synchronized，介绍了可重入性、内存可见性、死锁等，最后，介绍了同步容器及其注意事项如复合操做、伪同步、迭代异常、并发容器等。

多线程之间除了竞争访问同一个资源外，也常常须要相互协做，怎么协做呢？下节介绍协做的基本机制wait/notify。

(与其余章节同样，本节全部代码位于 https://github.com/swiftma/program-logic)

----------------

未完待续，查看最新文章，敬请关注微信公众号“老马说编程”(扫描下方二维码)，从入门到高级，深刻浅出，老马和你一块儿探索Java编程及计算机技术的本质。用心原创，保留全部版权。