集合是用来存储多个数据的,除了基本类型以外,集合应该是java中最最经常使用的类型了。java中的集合类型通常都集中在java.util包和java.util.concurrent包中。java
其中util包中的集合类是基础的集合类,而concurrent包中的集合类是为并发特别准备的集合类。node
集合类的父类有两个,一个是java.util.Collection, 一个是java.util.Map。git
先看下Collection的定义:程序员
public interface Collection<E> extends Iterable<E> { }
Collection继承自Iterable接口,表示全部的Collection都是可遍历的。而且Collection中能够保存一种数据类型。github
再看下Map的定义:数组
public interface Map<K, V> { }
能够看到Map是一个顶级的接口,里面能够保持两种数据类型,分别是key和value。缓存
其中Collection是List,Set和Queue的父类,这样就组成了集合的四大类型:List,Queue,Set和Map,接下来咱们将会一一的进行讲解。安全
先看下List的定义:数据结构
public interface List<E> extends Collection<E> { }
List是一个接口,继承自Collection,表示的是一个有序的链表,经常使用的list有ArrayList,LinkedList等等。多线程
咱们在使用集合类的时候,一般会须要去遍历集合中的元素,并在遍历中对其中的元素进行处理。这时候咱们就要用到Iterator,常常写程序的朋友应该都知道,在Iterator遍历的过程当中,是不可以修改集合数据的,不然就会抛出ConcurrentModificationException。
由于ConcurrentModificationException的存在,就把Iterator分红了两类,Fail-fast和Fail-safe。
Fail-fast看名字就知道它的意思是失败的很是快。就是说若是在遍历的过程当中修改了集合的结构,则就会马上报错。
Fail-fast一般在下面两种状况下抛出ConcurrentModificationException:
若是在单线程的环境中,iterator建立以后,若是不是经过iterator自身的remove方法,而是经过调用其余的方法修改了集合的结构,则会报错。
若是一个线程中建立了iterator,而在另一个线程中修改了集合的结构,则会报错。
咱们先看一个Fail-fast的例子:
Map<Integer,String> users = new HashMap<>(); users.put(1, "jack"); users.put(2, "alice"); users.put(3, "jone"); Iterator iterator1 = users.keySet().iterator(); //not modify key, so no exception while (iterator1.hasNext()) { log.info("{}",users.get(iterator1.next())); users.put(2, "mark"); }
上面的例子中,咱们构建了一个Map,而后遍历该map的key,在遍历过程当中,咱们修改了map的value。
运行发现,程序完美执行,并无报任何异常。
这是由于咱们遍历的是map的key,只要map的key没有被手动修改,就没有问题。
再看一个例子:
Map<Integer,String> users = new HashMap<>(); users.put(1, "jack"); users.put(2, "alice"); users.put(3, "jone"); Iterator iterator1 = users.keySet().iterator(); Iterator iterator2 = users.keySet().iterator(); //modify key,get exception while (iterator2.hasNext()) { log.info("{}",users.get(iterator2.next())); users.put(4, "mark"); }
上面的例子中,咱们在遍历map的key的同时,对key进行了修改。这种状况下就会报错。
为何修改了集合的结构就会报异常呢?
咱们以ArrayList为例,来说解下Fail-fast 的原理。
在AbstractList中,定义了一个modCount变量:
protected transient int modCount = 0;
在遍历的过程当中都会去调用checkForComodification()方法来对modCount进行检测:
public E next() { checkForComodification(); try { int i = cursor; E next = get(i); lastRet = i; cursor = i + 1; return next; } catch (IndexOutOfBoundsException e) { checkForComodification(); throw new NoSuchElementException(); } }
若是检测的结果不是所预期的,就会报错:
final void checkForComodification() { if (modCount != expectedModCount) throw new ConcurrentModificationException(); }
在建立Iterator的时候会复制当前的modCount进行比较,而这个modCount在每次集合修改的时候都会进行变更,最终致使Iterator中的modCount和现有的modCount是不一致的。
public void set(E e) { if (lastRet < 0) throw new IllegalStateException(); checkForComodification(); try { AbstractList.this.set(lastRet, e); expectedModCount = modCount; } catch (IndexOutOfBoundsException ex) { throw new ConcurrentModificationException(); } }
注意,Fail-fast并不保证全部的修改都会报错,咱们不可以依赖ConcurrentModificationException来判断遍历中集合是否被修改。
咱们再来说一下Fail-safe,Fail-safe的意思是在遍历的过程当中,若是对集合进行修改是不会报错的。
Concurrent包下面的类型都是Fail-safe的。看一个ConcurrentHashMap的例子:
Map<Integer,String> users = new ConcurrentHashMap<>(); users.put(1, "jack"); users.put(2, "alice"); users.put(3, "jone"); Iterator iterator1 = users.keySet().iterator(); //not modify key, so no exception while (iterator1.hasNext()) { log.info("{}",users.get(iterator1.next())); users.put(2, "mark"); } Iterator iterator2 = users.keySet().iterator(); //modify key,get exception while (iterator2.hasNext()) { log.info("{}",users.get(iterator2.next())); users.put(4, "mark"); }
上面的例子完美执行,不会报错。
集合的变量少不了使用Iterator,从集合Iterator很是简单,直接调用Iterator方法就能够了。
那么如何从Iterator反过来生成List呢?今天教你们三个方法。
最简单最基本的逻辑就是使用while来遍历这个Iterator,在遍历的过程当中将Iterator中的元素添加到新建的List中去。
以下面的代码所示:
@Test public void useWhile(){ List<String> stringList= new ArrayList<>(); Iterator<String> stringIterator= Arrays.asList("a","b","c").iterator(); while(stringIterator.hasNext()){ stringList.add(stringIterator.next()); } log.info("{}",stringList); }
Iterator接口有个default方法:
default void forEachRemaining(Consumer<? super E> action) { Objects.requireNonNull(action); while (hasNext()) action.accept(next()); }
实际上这方法的底层就是封装了while循环,那么咱们能够直接使用这个ForEachRemaining的方法:
@Test public void useForEachRemaining(){ List<String> stringList= new ArrayList<>(); Iterator<String> stringIterator= Arrays.asList("a","b","c").iterator(); stringIterator.forEachRemaining(stringList::add); log.info("{}",stringList); }
咱们知道构建Stream的时候,能够调用StreamSupport的stream方法:
public static <T> Stream<T> stream(Spliterator<T> spliterator, boolean parallel)
该方法传入一个spliterator参数。而Iterable接口正好有一个spliterator()的方法:
default Spliterator<T> spliterator() { return Spliterators.spliteratorUnknownSize(iterator(), 0); }
那么咱们能够将Iterator转换为Iterable,而后传入stream。
仔细研究Iterable接口能够发现,Iterable是一个FunctionalInterface,只须要实现下面的接口就好了:
Iterator<T> iterator();
利用lambda表达式,咱们能够方便的将Iterator转换为Iterable:
Iterator<String> stringIterator= Arrays.asList("a","b","c").iterator(); Iterable<String> stringIterable = () -> stringIterator;
最后将其换行成为List:
List<String> stringList= StreamSupport.stream(stringIterable.spliterator(),false).collect(Collectors.toList()); log.info("{}",stringList);
提到集合类,ArrayList应该是用到的很是多的类了。这里的ArrayList是java.util.ArrayList,一般咱们怎么建立ArrayList呢?
看下下面的例子:
List<String> names = new ArrayList<>();
上面的方法建立了一个ArrayList,若是咱们须要向其中添加元素的话,须要再调用add方法。
一般咱们会使用一种更加简洁的办法来建立List:
@Test public void testAsList(){ List<String> names = Arrays.asList("alice", "bob", "jack"); names.add("mark"); }
看下asList方法的定义:
public static <T> List<T> asList(T... a) { return new ArrayList<>(a); }
很好,使用Arrays.asList,咱们能够方便的建立ArrayList。
运行下上面的例子,奇怪的事情发生了,上面的例子竟然抛出了UnsupportedOperationException异常。
java.lang.UnsupportedOperationException at java.util.AbstractList.add(AbstractList.java:148) at java.util.AbstractList.add(AbstractList.java:108) at com.flydean.AsListUsage.testAsList(AsListUsage.java:18)
先讲一下这个异常,UnsupportedOperationException是一个运行时异常,一般用在某些类中并无实现接口的某些方法。
为何上面的ArrayList调用add方法会抛异常呢?
咱们再来详细的看一下Arrays.asList方法中返回的ArrayList:
private static class ArrayList<E> extends AbstractList<E> implements RandomAccess, java.io.Serializable
能够看到,Arrays.asList返回的ArrayList是Arrays类中的一个内部类,并非java.util.ArrayList。
这个类继承自AbstractList,在AbstractList中add方法是这样定义的:
public void add(int index, E element) { throw new UnsupportedOperationException(); }
好了,咱们的问题获得了解决。
咱们使用Arrays.asList获得ArrayList以后,能不能将其转换成为java.util.ArrayList呢?答案是确定的。
咱们看下下面的例子:
@Test public void testList(){ List<String> names = new ArrayList<>(Arrays.asList("alice", "bob", "jack")); names.add("mark"); }
上面的例子能够正常执行。
在java中有不少一样名字的类,咱们须要弄清楚他们究竟是什么,不要混淆了。
ArrayList是咱们常常会用到的集合类,有时候咱们须要拷贝一个ArrayList,今天向你们介绍拷贝ArrayList经常使用的四种方式。
ArrayList有个构造函数,能够传入一个集合:
public ArrayList(Collection<? extends E> c) { elementData = c.toArray(); if ((size = elementData.length) != 0) { // c.toArray might (incorrectly) not return Object[] (see 6260652) if (elementData.getClass() != Object[].class) elementData = Arrays.copyOf(elementData, size, Object[].class); } else { // replace with empty array. this.elementData = EMPTY_ELEMENTDATA; } }
上面的代码咱们能够看出,底层实际上调用了Arrays.copyOf方法来对数组进行拷贝。这个拷贝调用了系统的native arraycopy方法,注意这里的拷贝是引用拷贝,而不是值的拷贝。这就意味着这若是拷贝以后对象的值发送了变化,源对象也会发生改变。
举个例子:
@Test public void withConstructor(){ List<String> stringList=new ArrayList<>(Arrays.asList("a","b","c")); List<String> copyList = new ArrayList<>(stringList); copyList.set(0,"e"); log.info("{}",stringList); log.info("{}",copyList); List<CustBook> objectList=new ArrayList<>(Arrays.asList(new CustBook("a"),new CustBook("b"),new CustBook("c"))); List<CustBook> copyobjectList = new ArrayList<>(objectList); copyobjectList.get(0).setName("e"); log.info("{}",objectList); log.info("{}",copyobjectList); }
运行结果:
22:58:39.001 [main] INFO com.flydean.CopyList - [a, b, c] 22:58:39.008 [main] INFO com.flydean.CopyList - [e, b, c] 22:58:39.009 [main] INFO com.flydean.CopyList - [CustBook(name=e), CustBook(name=b), CustBook(name=c)] 22:58:39.009 [main] INFO com.flydean.CopyList - [CustBook(name=e), CustBook(name=b), CustBook(name=c)]
咱们看到对象的改变实际上改变了拷贝的源。而copyList.set(0,"e")实际上建立了一个新的String对象,并把它赋值到copyList的0位置。
List有一个addAll方法,咱们可使用这个方法来进行拷贝:
@Test public void withAddAll(){ List<CustBook> objectList=new ArrayList<>(Arrays.asList(new CustBook("a"),new CustBook("b"),new CustBook("c"))); List<CustBook> copyobjectList = new ArrayList<>(); copyobjectList.addAll(objectList); copyobjectList.get(0).setName("e"); log.info("{}",objectList); log.info("{}",copyobjectList); }
一样的拷贝的是对象的引用。
一样的,使用Collections.copy也能够获得相同的效果,看下代码:
@Test public void withCopy(){ List<CustBook> objectList=new ArrayList<>(Arrays.asList(new CustBook("a"),new CustBook("b"),new CustBook("c"))); List<CustBook> copyobjectList = new ArrayList<>(Arrays.asList(new CustBook("d"),new CustBook("e"),new CustBook("f"))); Collections.copy(copyobjectList, objectList); copyobjectList.get(0).setName("e"); log.info("{}",objectList); log.info("{}",copyobjectList); }
咱们也可使用java 8引入的stream来实现:
@Test public void withStream(){ List<CustBook> objectList=new ArrayList<>(Arrays.asList(new CustBook("a"),new CustBook("b"),new CustBook("c"))); List<CustBook> copyobjectList=objectList.stream().collect(Collectors.toList()); copyobjectList.get(0).setName("e"); log.info("{}",objectList); log.info("{}",copyobjectList); }
好了,四种方法讲完了,你们要注意四种方法都是引用拷贝,在使用的时候要当心。
先看下Map的定义:
public interface Map<K, V> { }
Map是一个key-value对的集合,其中key不可以重复,可是value能够重复。经常使用的Map有TreeMap和hashMap。
HashMap和TreeMap是Map家族中很是经常使用的两个类,两个类在使用上和本质上有什么区别呢?本文将从这两个方面进行深刻的探讨,但愿能揭露其本质。
先看HashMap的定义:
public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable
再看TreeMap的定义:
public class TreeMap<K,V> extends AbstractMap<K,V> implements NavigableMap<K,V>, Cloneable, java.io.Serializable
从类的定义来看,HashMap和TreeMap都继承自AbstractMap,不一样的是HashMap实现的是Map接口,而TreeMap实现的是NavigableMap接口。NavigableMap是SortedMap的一种,实现了对Map中key的排序。
这样二者的第一个区别就出来了,TreeMap是排序的而HashMap不是。
再看看HashMap和TreeMap的构造函数的区别。
public HashMap(int initialCapacity, float loadFactor)
HashMap除了默认的无参构造函数以外,还能够接受两个参数initialCapacity和loadFactor。
HashMap的底层结构是Node的数组:
transient Node<K,V>[] table
initialCapacity就是这个table的初始容量。若是你们不传initialCapacity,HashMap提供了一个默认的值:
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
当HashMap中存储的数据过多的时候,table数组就会被装满,这时候就须要扩容,HashMap的扩容是以2的倍数来进行的。而loadFactor就指定了何时须要进行扩容操做。默认的loadFactor是0.75。
static final float DEFAULT_LOAD_FACTOR = 0.75f;
再来看几个很是有趣的变量:
static final int TREEIFY_THRESHOLD = 8; static final int UNTREEIFY_THRESHOLD = 6; static final int MIN_TREEIFY_CAPACITY = 64;
上面的三个变量有什么用呢?在java 8以前,HashMap解决hashcode冲突的方法是采用链表的形式,为了提高效率,java 8将其转成了TreeNode。何时会发送这个转换呢?
这时候就要看这两个变量TREEIFY_THRESHOLD和UNTREEIFY_THRESHOLD。
有的同窗可能发现了,TREEIFY_THRESHOLD为何比UNTREEIFY_THRESHOLD大2呢?其实这个问题我也不知道,可是你看源代码的话,用到UNTREEIFY_THRESHOLD时候,都用的是<=,而用到TREEIFY_THRESHOLD的时候,都用的是>= TREEIFY_THRESHOLD - 1,因此这两个变量在本质上是同样的。
MIN_TREEIFY_CAPACITY表示的是若是table转换TreeNode的最小容量,只有capacity >= MIN_TREEIFY_CAPACITY的时候才容许TreeNode的转换。
TreeMap和HashMap不一样的是,TreeMap的底层是一个Entry:
private transient Entry<K,V> root
他的实现是一个红黑树,方便用来遍历和搜索。
TreeMap的构造函数能够传入一个Comparator,实现自定义的比较方法。
public TreeMap(Comparator<? super K> comparator) { this.comparator = comparator; }
若是不提供自定义的比较方法,则使用的是key的natural order。
咱们讲完二者的本质以后,如今举例说明,先看下二者对排序的区别:
@Test public void withOrder(){ Map<String, String> books = new HashMap<>(); books.put("bob", "books"); books.put("c", "concurrent"); books.put("a", "a lock"); log.info("{}",books); }
@Test public void withOrder(){ Map<String, String> books = new TreeMap<>(); books.put("bob", "books"); books.put("c", "concurrent"); books.put("a", "a lock"); log.info("{}",books); }
一样的代码,一个使用了HashMap,一个使用了TreeMap,咱们会发现TreeMap输出的结果是排好序的,而HashMap的输出结果是不定的。
HashMap能够容许一个null key和多个null value。而TreeMap不容许null key,可是能够容许多个null value。
@Test public void withNull() { Map<String, String> hashmap = new HashMap<>(); hashmap.put(null, null); log.info("{}",hashmap); }
@Test public void withNull() { Map<String, String> hashmap = new TreeMap<>(); hashmap.put(null, null); log.info("{}",hashmap); }
HashMap会报出: NullPointerException。
HashMap的底层是Array,因此HashMap在添加,查找,删除等方法上面速度会很是快。而TreeMap的底层是一个Tree结构,因此速度会比较慢。
另外HashMap由于要保存一个Array,因此会形成空间的浪费,而TreeMap只保存要保持的节点,因此占用的空间比较小。
HashMap若是出现hash冲突的话,效率会变差,不过在java 8进行TreeNode转换以后,效率有很大的提高。
TreeMap在添加和删除节点的时候会进行重排序,会对性能有所影响。
二者都不容许duplicate key,二者都不是线程安全的。
咱们知道HashMap的变量顺序是不可预测的,这意味着便利的输出顺序并不必定和HashMap的插入顺序是一致的。这个特性一般会对咱们的工做形成必定的困扰。为了实现这个功能,咱们可使用LinkedHashMap。
先看下LinkedHashMap的定义:
public class LinkedHashMap<K,V> extends HashMap<K,V> implements Map<K,V>
LinkedHashMap继承自HashMap,因此HashMap的全部功能在LinkedHashMap均可以用。
LinkedHashMap和HashMap的区别就是新建立了一个Entry:
static class Entry<K,V> extends HashMap.Node<K,V> { Entry<K,V> before, after; Entry(int hash, K key, V value, Node<K,V> next) { super(hash, key, value, next); } }
这个Entry继承自HashMap.Node,多了一个before,after来实现Node之间的链接。
经过这个新建立的Entry,就能够保证遍历的顺序和插入的顺序一致。
下面看一个LinkedHashMap插入的例子:
@Test public void insertOrder(){ LinkedHashMap<String, String> map = new LinkedHashMap<>(); map.put("ddd","desk"); map.put("aaa","ask"); map.put("ccc","check"); map.keySet().forEach(System.out::println); }
输出结果:
ddd aaa ccc
能够看到输出结果和插入结果是一致的。
除了遍历的顺序,LinkedHashMap还有一个很是有特点的访问顺序。
咱们再看一个LinkedHashMap的构造函数:
public LinkedHashMap(int initialCapacity, float loadFactor, boolean accessOrder) { super(initialCapacity, loadFactor); this.accessOrder = accessOrder; }
前面的两个参数initialCapacity,loadFactor咱们以前已经讲过了,如今看最后一个参数accessOrder。
当accessOrder设置成为true的时候,就开启了 access-order。
access order的意思是,将对象安装最老访问到最新访问的顺序排序。咱们看个例子:
@Test public void accessOrder(){ LinkedHashMap<String, String> map = new LinkedHashMap<>(16, .75f, true); map.put("ddd","desk"); map.put("aaa","ask"); map.put("ccc","check"); map.keySet().forEach(System.out::println); map.get("aaa"); map.keySet().forEach(System.out::println); }
输出结果:
ddd aaa ccc ddd ccc aaa
咱们看到,由于访问了一次“aaa“,从而致使遍历的时候排到了最后。
最后咱们看一下LinkedHashMap的一个特别的功能removeEldestEntry。这个方法是干什么的呢?
经过从新removeEldestEntry方法,可让LinkedHashMap保存特定数目的Entry,一般用在LinkedHashMap用做缓存的状况。
removeEldestEntry将会删除最老的Entry,保留最新的。
ublic class CustLinkedHashMap<K, V> extends LinkedHashMap<K, V> { private static final int MAX_ENTRIES = 10; public CustLinkedHashMap( int initialCapacity, float loadFactor, boolean accessOrder) { super(initialCapacity, loadFactor, accessOrder); } @Override protected boolean removeEldestEntry(Map.Entry eldest) { return size() > MAX_ENTRIES; } }
看上面的一个自定义的例子,上面的例子咱们建立了一个保留10个Entry节点的LinkedHashMap。
LinkedHashMap继承自HashMap,同时提供了两个很是有用的功能。
通常来讲咱们会选择使用HashMap来存储key-value格式的数据,考虑这样的特殊状况,一个HashMap的key都来自于一个Enum类,这样的状况则能够考虑使用本文要讲的EnumMap。
先看一下EnumMap的定义和HashMap定义的比较:
public class EnumMap<K extends Enum<K>, V> extends AbstractMap<K, V> implements java.io.Serializable, Cloneable
public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable
咱们能够看到EnumMap几乎和HashMap是同样的,区别在于EnumMap的key是一个Enum。
下面看一个简单的使用的例子:
先定义一个Enum:
public enum Types { RED, GREEN, BLACK, YELLO }
再看下怎么使用EnumMap:
@Test public void useEnumMap(){ EnumMap<Types, String> activityMap = new EnumMap<>(Types.class); activityMap.put(Types.BLACK,"black"); activityMap.put(Types.GREEN,"green"); activityMap.put(Types.RED,"red"); }
其余的操做其实和hashMap是相似的,咱们这里就很少讲了。
由于在EnumMap中,全部的key的可能值在建立的时候已经知道了,因此使用EnumMap和hashMap相比,能够提高效率。
同时,由于key比较简单,因此EnumMap在实现中,也不须要像HashMap那样考虑一些复杂的状况。
跟EnumMap很相似,EnumSet是一个set,而后set中的元素都是某个Enum类型。
EnumSet是一个抽象类,要建立EnumSet类可使用EnumSet提供的两个静态方法,noneOf和allOf。
先看一个noneOf:
public static <E extends Enum<E>> EnumSet<E> noneOf(Class<E> elementType) { Enum<?>[] universe = getUniverse(elementType); if (universe == null) throw new ClassCastException(elementType + " not an enum"); if (universe.length <= 64) return new RegularEnumSet<>(elementType, universe); else return new JumboEnumSet<>(elementType, universe); }
noneOf传入一个Enum类,返回一个空的Enum类型的EnumSet。
从上面的代码咱们能够看到EnumSet有两个实现,长度大于64的时候使用JumboEnumSet,小有64的时候使用RegularEnumSet。
注意,JumboEnumSet和RegularEnumSet不建议直接使用,他是内部使用的类。
再看一下allOf:
public static <E extends Enum<E>> EnumSet<E> allOf(Class<E> elementType) { EnumSet<E> result = noneOf(elementType); result.addAll(); return result; }
allOf很简单,先调用noneOf建立空的set,而后调用addAll方法将全部的元素添加进去。
EnumMap和EnumSet对特定的Enum对象作了优化,能够在合适的状况下使用。
一开始据说SkipList我是一脸懵逼的,啥?还有SkipList?这个是什么玩意。
后面通过个人不断搜索和学习,终于明白了SkipList原来是一种数据结构,而java中的ConcurrentSkipListMap和ConcurrentSkipListSet就是这种结构的实现。
接下来就让咱们一步一步的揭开SkipList和ConcurrentSkipListMap的面纱吧。
先看下维基百科中SkipList的定义:
SkipList是一种层级结构。最底层的是排序过的最原始的linked list。
往上是一层一层的层级结构,每一个底层节点按照必定的几率出如今上一层list中。这个几率叫作p,一般p取1/2或者1/4。
先设定一个函数f,能够随机产生0和1这两个数,而且这两个数出现的概率是同样的,那么这时候的p就是1/2。
对每一个节点,咱们这样操做:
咱们运行一次f,当f=1时,咱们将该节点插入到上层layer的list中去。当f=0时,不插入。
举个例子,上图中的list中有10个排序过的节点,第一个节点默认每层都有。对于第二个节点,运行f=0,不插入。对于第三个节点,运行f=1,将第三个节点插入layer 1,以此类推,最后获得的layer 1 list中的节点有:1,3,4,6,9。
而后咱们再继续往上构建layer。 最终获得上图的SkipList。
经过使用SkipList,咱们构建了多个List,包含不一样的排序过的节点,从而提高List的查找效率。
咱们经过下图能有一个更清晰的认识:
每次的查找都是从最顶层开始,由于最顶层的节点数最少,若是要查找的节点在list中的两个节点中间,则向下移一层继续查找,最终找到最底层要插入的位置,插入节点,而后再次调用几率函数f,决定是否向上复制节点。
其本质上至关于二分法查找,其查找的时间复杂度是O(logn)。
ConcurrentSkipListMap是一个并发的SkipList,那么它具备两个特色,SkipList和concurrent。咱们分别来说解。
上面讲解了SkipList的数据结构,接下来看下ConcurrentSkipListMap是怎么实现这个skipList的:
ConcurrentSkipListMap中有三种结构,base nodes,Head nodes和index nodes。
base nodes组成了有序的链表结构,是ConcurrentSkipListMap的最底层实现。
static final class Node<K,V> { final K key; volatile Object value; volatile Node<K,V> next; /** * Creates a new regular node. */ Node(K key, Object value, Node<K,V> next) { this.key = key; this.value = value; this.next = next; } }
上面能够看到每一个Node都是一个k,v的entry,而且其有一个next指向下一个节点。
index nodes是构建SkipList上层结构的基本节点:
static class Index<K,V> { final Node<K,V> node; final Index<K,V> down; volatile Index<K,V> right; /** * Creates index node with given values. */ Index(Node<K,V> node, Index<K,V> down, Index<K,V> right) { this.node = node; this.down = down; this.right = right; } }
从上面的构造咱们能够看到,Index节点包含了Node节点,除此以外,Index还有两个指针,一个指向同一个layer的下一个节点,一个指向下一层layer的节点。
这样的结构能够方便遍历的实现。
最后看一下HeadIndex,HeadIndex表明的是Head节点:
static final class HeadIndex<K,V> extends Index<K,V> { final int level; HeadIndex(Node<K,V> node, Index<K,V> down, Index<K,V> right, int level) { super(node, down, right); this.level = level; } }
HeadIndex和Index很相似,只不过多了一个level字段,表示所在的层级。
在ConcurrentSkipListMap初始化的时候,会初始化HeadIndex:
head = new HeadIndex<K,V>(new Node<K,V>(null, BASE_HEADER, null),null, null, 1);
咱们能够看到HeadIndex中的Node是key=null,value=BASE_HEADER的虚拟节点。初始的level=1。
接下来,咱们再看一下并发是怎么实现的:
基本上并发类都是经过UNSAFE.compareAndSwapObject来实现的,ConcurrentSkipListMap也不例外。
假如咱们有三个节点,b-n-f。如今须要删除节点n。
第一步,使用CAS将n的valu的值从non-null设置为null。这个时候,任何外部的操做都会认为这个节点是不存在的。可是那些内部的插入或者删除操做仍是会继续修改n的next指针。
第二步,使用CAS将n的next指针指向一个新的marker节点,从这个时候开始,n的next指针将不会指向任何其余的节点。
咱们看下marker节点的定义:
Node(Node<K,V> next) { this.key = null; this.value = this; this.next = next; }
咱们能够看到marker节点其实是一个key为null,value是本身的节点。
第三步,使用CAS将b的next指针指向f。从这一步起,n节点不会再被其余的程序访问,这意味着n能够被垃圾回收了。
咱们思考一下为何要插入一个marker节点,这是由于咱们在删除的时候,须要告诉全部的线程,节点n准备被删除了,由于n原本就指向f节点,这个时候须要一个中间节点来表示这个准备删除的状态。
先看下Queue的定义:
public interface Queue<E> extends Collection<E> { }
Queue表示的是队列,其特色就是先进先出。经常使用的Queue有DelayQueue,BlockingQueue等等。
java中Collection集合有三你们族List,Set和Queue。固然Map也算是一种集合类,但Map并不继承Collection接口。
List,Set在咱们的工做中会常用,一般用来存储结果数据,而Queue因为它的特殊性,一般用在生产者消费者模式中。
如今很火的消息中间件好比:Rabbit MQ等都是Queue这种数据结构的展开。
今天这篇文章将带你们进入Queue家族。
先看下Queue的继承关系和其中定义的方法:
Queue继承自Collection,Collection继承自Iterable。
Queue有三类主要的方法,咱们用个表格来看一下他们的区别:
方法类型 | 方法名称 | 方法名称 | 区别 |
---|---|---|---|
Insert | add | offer | 两个方法都表示向Queue中添加某个元素,不一样之处在于添加失败的状况,add只会返回true,若是添加失败,会抛出异常。offer在添加失败的时候会返回false。因此对那些有固定长度的Queue,优先使用offer方法。 |
Remove | remove | poll | 若是Queue是空的状况下,remove会抛出异常,而poll会返回null。 |
Examine | element | peek | 获取Queue头部的元素,但不从Queue中删除。二者的区别仍是在于Queue为空的状况下,element会抛出异常,而peek返回null。 |
注意,由于对poll和peek来讲null是有特殊含义的,因此通常来讲Queue中禁止插入null,可是在实现中仍是有一些类容许插入null好比LinkedList。尽管如此,咱们在使用中仍是要避免插入null元素。
通常来讲Queue能够分为BlockingQueue,Deque和TransferQueue三种。
BlockingQueue是Queue的一种实现,它提供了两种额外的功能:
BlockingQueue的操做能够分为下面四类:
操做类型 | Throws exception | Special value | Blocks | Times out |
---|---|---|---|---|
Insert | add(e) | offer(e) | put(e) | offer(e, time, unit) |
Remove | remove() | poll() | take() | poll(time, unit) |
Examine | element() | peek() | not applicable | not applicable |
第一类是会抛出异常的操做,当遇到插入失败,队列为空的时候抛出异常。
第二类是不会抛出异常的操做。
第三类是会Block的操做。当Queue为空或者达到最大容量的时候。
第四类是time out的操做,在给定的时间里会Block,超时会直接返回。
BlockingQueue是线程安全的Queue,能够在生产者消费者模式的多线程中使用,以下所示:
class Producer implements Runnable { private final BlockingQueue queue; Producer(BlockingQueue q) { queue = q; } public void run() { try { while (true) { queue.put(produce()); } } catch (InterruptedException ex) { ... handle ...} } Object produce() { ... } } class Consumer implements Runnable { private final BlockingQueue queue; Consumer(BlockingQueue q) { queue = q; } public void run() { try { while (true) { consume(queue.take()); } } catch (InterruptedException ex) { ... handle ...} } void consume(Object x) { ... } } class Setup { void main() { BlockingQueue q = new SomeQueueImplementation(); Producer p = new Producer(q); Consumer c1 = new Consumer(q); Consumer c2 = new Consumer(q); new Thread(p).start(); new Thread(c1).start(); new Thread(c2).start(); } }
最后,在一个线程中向BlockQueue中插入元素以前的操做happens-before另一个线程中从BlockQueue中删除或者获取的操做。
Deque是Queue的子类,它表明double ended queue,也就是说能够从Queue的头部或者尾部插入和删除元素。
一样的,咱们也能够将Deque的方法用下面的表格来表示,Deque的方法能够分为对头部的操做和对尾部的操做:
方法类型 | Throws exception | Special value | Throws exception | Special value |
---|---|---|---|---|
Insert | addFirst(e) | offerFirst(e) | addLast(e) | offerLast(e) |
Remove | removeFirst() | pollFirst() | removeLast() | pollLast() |
Examine | getFirst() | peekFirst() | getLast() | peekLast() |
和Queue的方法描述基本一致,这里就很少讲了。
当Deque以 FIFO (First-In-First-Out)的方法处理元素的时候,Deque就至关于一个Queue。
当Deque以LIFO (Last-In-First-Out)的方式处理元素的时候,Deque就至关于一个Stack。
TransferQueue继承自BlockingQueue,为何叫Transfer呢?由于TransferQueue提供了一个transfer的方法,生产者能够调用这个transfer方法,从而等待消费者调用take或者poll方法从Queue中拿取数据。
还提供了非阻塞和timeout版本的tryTransfer方法以供使用。
咱们举个TransferQueue实现的生产者消费者的问题。
先定义一个生产者:
@Slf4j @Data @AllArgsConstructor class Producer implements Runnable { private TransferQueue<String> transferQueue; private String name; private Integer messageCount; public static final AtomicInteger messageProduced = new AtomicInteger(); @Override public void run() { for (int i = 0; i < messageCount; i++) { try { boolean added = transferQueue.tryTransfer( "第"+i+"个", 2000, TimeUnit.MILLISECONDS); log.info("transfered {} 是否成功: {}","第"+i+"个",added); if(added){ messageProduced.incrementAndGet(); } } catch (InterruptedException e) { log.error(e.getMessage(),e); } } log.info("total transfered {}",messageProduced.get()); } }
在生产者的run方法中,咱们调用了tryTransfer方法,等待2秒钟,若是没成功则直接返回。
再定义一个消费者:
@Slf4j @Data @AllArgsConstructor public class Consumer implements Runnable { private TransferQueue<String> transferQueue; private String name; private int messageCount; public static final AtomicInteger messageConsumed = new AtomicInteger(); @Override public void run() { for (int i = 0; i < messageCount; i++) { try { String element = transferQueue.take(); log.info("take {}",element ); messageConsumed.incrementAndGet(); Thread.sleep(500); } catch (InterruptedException e) { log.error(e.getMessage(),e); } } log.info("total consumed {}",messageConsumed.get()); } }
在run方法中,调用了transferQueue.take方法来取消息。
下面先看一下一个生产者,零个消费者的状况:
@Test public void testOneProduceZeroConsumer() throws InterruptedException { TransferQueue<String> transferQueue = new LinkedTransferQueue<>(); ExecutorService exService = Executors.newFixedThreadPool(10); Producer producer = new Producer(transferQueue, "ProducerOne", 5); exService.execute(producer); exService.awaitTermination(50000, TimeUnit.MILLISECONDS); exService.shutdown(); }
输出结果:
[pool-1-thread-1] INFO com.flydean.Producer - transfered 第0个 是否成功: false [pool-1-thread-1] INFO com.flydean.Producer - transfered 第1个 是否成功: false [pool-1-thread-1] INFO com.flydean.Producer - transfered 第2个 是否成功: false [pool-1-thread-1] INFO com.flydean.Producer - transfered 第3个 是否成功: false [pool-1-thread-1] INFO com.flydean.Producer - transfered 第4个 是否成功: false [pool-1-thread-1] INFO com.flydean.Producer - total transfered 0
能够看到,由于没有消费者,因此消息并无发送成功。
再看下一个有消费者的状况:
@Test public void testOneProduceOneConsumer() throws InterruptedException { TransferQueue<String> transferQueue = new LinkedTransferQueue<>(); ExecutorService exService = Executors.newFixedThreadPool(10); Producer producer = new Producer(transferQueue, "ProducerOne", 2); Consumer consumer = new Consumer(transferQueue, "ConsumerOne", 2); exService.execute(producer); exService.execute(consumer); exService.awaitTermination(50000, TimeUnit.MILLISECONDS); exService.shutdown(); }
输出结果:
[pool-1-thread-2] INFO com.flydean.Consumer - take 第0个 [pool-1-thread-1] INFO com.flydean.Producer - transfered 第0个 是否成功: true [pool-1-thread-2] INFO com.flydean.Consumer - take 第1个 [pool-1-thread-1] INFO com.flydean.Producer - transfered 第1个 是否成功: true [pool-1-thread-1] INFO com.flydean.Producer - total transfered 2 [pool-1-thread-2] INFO com.flydean.Consumer - total consumed 2
能够看到Producer和Consumer是一个一个来生产和消费的。
Queue通常来讲都是FIFO的,固然以前咱们也介绍过Deque能够作为栈来使用。今天咱们介绍一种PriorityQueue,能够安装对象的天然顺序或者自定义顺序在Queue中进行排序。
先看PriorityQueue,这个Queue继承自AbstractQueue,是非线程安全的。
PriorityQueue的容量是unbounded的,也就是说它没有容量大小的限制,因此你能够无限添加元素,若是添加的太多,最后会报OutOfMemoryError异常。
这里教你们一个识别的技能,只要集合类中带有CAPACITY的,其底层实现大部分都是数组,由于只有数组才有capacity,固然也有例外,好比LinkedBlockingDeque。
只要集合类中带有comparator的,那么这个集合必定是个有序集合。
咱们看下PriorityQueue:
private static final int DEFAULT_INITIAL_CAPACITY = 11; private final Comparator<? super E> comparator;
定义了初始Capacity和comparator,那么PriorityQueue的底层实现就是Array,而且它是一个有序集合。
有序集合默认状况下是按照natural ordering来排序的,若是你传入了 Comparator,则会按照你指定的方式进行排序,咱们看两个排序的例子:
@Slf4j public class PriorityQueueUsage { @Test public void usePriorityQueue(){ PriorityQueue<Integer> integerQueue = new PriorityQueue<>(); integerQueue.add(1); integerQueue.add(3); integerQueue.add(2); int first = integerQueue.poll(); int second = integerQueue.poll(); int third = integerQueue.poll(); log.info("{},{},{}",first,second,third); } @Test public void usePriorityQueueWithComparator(){ PriorityQueue<Integer> integerQueue = new PriorityQueue<>((a,b)-> b-a); integerQueue.add(1); integerQueue.add(3); integerQueue.add(2); int first = integerQueue.poll(); int second = integerQueue.poll(); int third = integerQueue.poll(); log.info("{},{},{}",first,second,third); } }
默认状况下会按照升序排列,第二个例子中咱们传入了一个逆序的Comparator,则会按照逆序排列。
PriorityBlockingQueue是一个BlockingQueue,因此它是线程安全的。
咱们考虑这样一个问题,若是两个对象的natural ordering或者Comparator的顺序是同样的话,两个对象的顺序仍是固定的吗?
出现这种状况,默认顺序是不能肯定的,可是咱们能够这样封装对象,让对象能够在排序顺序一致的状况下,再按照建立顺序先进先出FIFO的二次排序:
public class FIFOEntry<E extends Comparable<? super E>> implements Comparable<FIFOEntry<E>> { static final AtomicLong seq = new AtomicLong(0); final long seqNum; final E entry; public FIFOEntry(E entry) { seqNum = seq.getAndIncrement(); this.entry = entry; } public E getEntry() { return entry; } public int compareTo(FIFOEntry<E> other) { int res = entry.compareTo(other.entry); if (res == 0 && other.entry != this.entry) res = (seqNum < other.seqNum ? -1 : 1); return res; } }
上面的例子中,先比较两个Entry的natural ordering,若是一致的话,再按照seqNum进行排序。
SynchronousQueue是BlockingQueue的一种,因此SynchronousQueue是线程安全的。SynchronousQueue和其余的BlockingQueue不一样的是SynchronousQueue的capacity是0。即SynchronousQueue不存储任何元素。
也就是说SynchronousQueue的每一次insert操做,必须等待其余线性的remove操做。而每个remove操做也必须等待其余线程的insert操做。
这种特性可让咱们想起了Exchanger。和Exchanger不一样的是,使用SynchronousQueue能够在两个线程中传递同一个对象。一个线程放对象,另一个线程取对象。
咱们举一个多线程中传递对象的例子。仍是举生产者消费者的例子,在生产者中咱们建立一个对象,在消费者中咱们取出这个对象。先看一下用CountDownLatch该怎么作:
@Test public void useCountdownLatch() throws InterruptedException { ExecutorService executor = Executors.newFixedThreadPool(2); AtomicReference<Object> atomicReference= new AtomicReference<>(); CountDownLatch countDownLatch = new CountDownLatch(1); Runnable producer = () -> { Object object=new Object(); atomicReference.set(object); log.info("produced {}",object); countDownLatch.countDown(); }; Runnable consumer = () -> { try { countDownLatch.await(); Object object = atomicReference.get(); log.info("consumed {}",object); } catch (InterruptedException ex) { log.error(ex.getMessage(),ex); } }; executor.submit(producer); executor.submit(consumer); executor.awaitTermination(50000, TimeUnit.MILLISECONDS); executor.shutdown(); }
上例中,咱们使用AtomicReference来存储要传递的对象,而且定义了一个型号量为1的CountDownLatch。
在producer中,咱们存储对象,而且countDown。
在consumer中,咱们await,而后取出对象。
输出结果:
[pool-1-thread-1] INFO com.flydean.SynchronousQueueUsage - produced java.lang.Object@683d1b4b [pool-1-thread-2] INFO com.flydean.SynchronousQueueUsage - consumed java.lang.Object@683d1b4b
能够看到传入和输出了同一个对象。
上面的例子咱们也能够用SynchronousQueue来改写:
@Test public void useSynchronousQueue() throws InterruptedException { ExecutorService executor = Executors.newFixedThreadPool(2); SynchronousQueue<Object> synchronousQueue=new SynchronousQueue<>(); Runnable producer = () -> { Object object=new Object(); try { synchronousQueue.put(object); } catch (InterruptedException ex) { log.error(ex.getMessage(),ex); } log.info("produced {}",object); }; Runnable consumer = () -> { try { Object object = synchronousQueue.take(); log.info("consumed {}",object); } catch (InterruptedException ex) { log.error(ex.getMessage(),ex); } }; executor.submit(producer); executor.submit(consumer); executor.awaitTermination(50000, TimeUnit.MILLISECONDS); executor.shutdown(); }
上面的例子中,若是咱们使用synchronousQueue,则能够不用手动同步,也不须要额外的存储。
若是咱们须要在代码中用到这种线程中传递对象的状况,那么使用synchronousQueue吧。
今天给你们介绍一下DelayQueue,DelayQueue是BlockingQueue的一种,因此它是线程安全的,DelayQueue的特色就是插入Queue中的数据能够按照自定义的delay时间进行排序。只有delay时间小于0的元素才可以被取出。
先看一下DelayQueue的定义:
public class DelayQueue<E extends Delayed> extends AbstractQueue<E> implements BlockingQueue<E>
从定义能够看到,DelayQueue中存入的对象都必须是Delayed的子类。
Delayed继承自Comparable,而且须要实现一个getDelay的方法。
为何这样设计呢?
由于DelayQueue的底层存储是一个PriorityQueue,在以前的文章中咱们讲过了,PriorityQueue是一个可排序的Queue,其中的元素必须实现Comparable方法。而getDelay方法则用来判断排序后的元素是否能够从Queue中取出。
DelayQueue通常用于生产者消费者模式,咱们下面举一个具体的例子。
首先要使用DelayQueue,必须自定义一个Delayed对象:
@Data public class DelayedUser implements Delayed { private String name; private long avaibleTime; public DelayedUser(String name, long delayTime){ this.name=name; //avaibleTime = 当前时间+ delayTime this.avaibleTime=delayTime + System.currentTimeMillis(); } @Override public long getDelay(TimeUnit unit) { //判断avaibleTime是否大于当前系统时间,并将结果转换成MILLISECONDS long diffTime= avaibleTime- System.currentTimeMillis(); return unit.convert(diffTime,TimeUnit.MILLISECONDS); } @Override public int compareTo(Delayed o) { //compareTo用在DelayedUser的排序 return (int)(this.avaibleTime - ((DelayedUser) o).getAvaibleTime()); } }
上面的对象中,咱们须要实现getDelay和compareTo方法。
接下来咱们建立一个生产者:
@Slf4j @Data @AllArgsConstructor class DelayedQueueProducer implements Runnable { private DelayQueue<DelayedUser> delayQueue; private Integer messageCount; private long delayedTime; @Override public void run() { for (int i = 0; i < messageCount; i++) { try { DelayedUser delayedUser = new DelayedUser( new Random().nextInt(1000)+"", delayedTime); log.info("put delayedUser {}",delayedUser); delayQueue.put(delayedUser); Thread.sleep(500); } catch (InterruptedException e) { log.error(e.getMessage(),e); } } } }
在生产者中,咱们每隔0.5秒建立一个新的DelayedUser对象,并入Queue。
再建立一个消费者:
@Slf4j @Data @AllArgsConstructor public class DelayedQueueConsumer implements Runnable { private DelayQueue<DelayedUser> delayQueue; private int messageCount; @Override public void run() { for (int i = 0; i < messageCount; i++) { try { DelayedUser element = delayQueue.take(); log.info("take {}",element ); } catch (InterruptedException e) { log.error(e.getMessage(),e); } } } }
在消费者中,咱们循环从queue中获取对象。
最后看一个调用的例子:
@Test public void useDelayedQueue() throws InterruptedException { ExecutorService executor = Executors.newFixedThreadPool(2); DelayQueue<DelayedUser> queue = new DelayQueue<>(); int messageCount = 2; long delayTime = 500; DelayedQueueConsumer consumer = new DelayedQueueConsumer( queue, messageCount); DelayedQueueProducer producer = new DelayedQueueProducer( queue, messageCount, delayTime); // when executor.submit(producer); executor.submit(consumer); // then executor.awaitTermination(5, TimeUnit.SECONDS); executor.shutdown(); }
上面的测试例子中,咱们定义了两个线程的线程池,生产者产生两条消息,delayTime设置为0.5秒,也就是说0.5秒以后,插入的对象可以被获取到。
线程池在5秒以后会被关闭。
运行看下结果:
[pool-1-thread-1] INFO com.flydean.DelayedQueueProducer - put delayedUser DelayedUser(name=917, avaibleTime=1587623188389) [pool-1-thread-2] INFO com.flydean.DelayedQueueConsumer - take DelayedUser(name=917, avaibleTime=1587623188389) [pool-1-thread-1] INFO com.flydean.DelayedQueueProducer - put delayedUser DelayedUser(name=487, avaibleTime=1587623188899) [pool-1-thread-2] INFO com.flydean.DelayedQueueConsumer - take DelayedUser(name=487, avaibleTime=1587623188899)
咱们看到消息的put和take是交替进行的,符合咱们的预期。
若是咱们作下修改,将delayTime修改成50000,那么在线程池关闭以前插入的元素是不会过时的,也就是说消费者是没法获取到结果的。
DelayQueue是一种有奇怪特性的BlockingQueue,能够在须要的时候使用。
java.lang.Comparable和java.util.Comparator是两个容易混淆的接口,二者都带有比较的意思,那么两个接口到底有什么区别,分别在什么状况下使用呢?
Comparable是java.lang包下面的接口,lang包下面能够看作是java的基础语言接口。
实际上Comparable接口只定义了一个方法:
public int compareTo(T o);
实现这个接口的类都须要实现compareTo方法,表示两个类之间的比较。
这个比较排序以后的order,按照java的说法叫作natural ordering。这个order用在一些可排序的集合好比:SortedSet,SortedMap等等。
当使用这些可排序的集合添加相应的对象时,就会调用compareTo方法来进行natural ordering的排序。
几乎全部的数字类型对象:Integer, Long,Double等都实现了这个Comparable接口。
Comparator是一个FunctionalInterface,须要实现compare方法:
int compare(T o1, T o2);
Comparator在java.util包中,表明其是一个工具类,用来辅助排序的。
在讲Comparable的时候,咱们提到Comparable指定了对象的natural ordering,若是咱们在添加到可排序集合类的时候想按照咱们自定义的方式进行排序,这个时候就须要使用到Comparator了。
Collections.sort(List,Comparator),Arrays.sort(Object[],Comparator) 等这些辅助的方法类均可以经过传入一个Comparator来自定义排序规则。
在排序过程当中,首先会去检查Comparator是否存在,若是不存在则会使用默认的natural ordering。
还有一个区别就是Comparator容许对null参数的比较,而Comparable是不容许的,不然会爬出NullPointerException。
最后,咱们举一个natural ordering和Comparator的例子:
@Test public void useCompare(){ List<Integer> list1 = Arrays.asList(5, 3, 2, 4, 1); Collections.sort(list1); log.info("{}",list1); List<Integer> list2 = Arrays.asList(5, 3, 2, 4, 1); Collections.sort(list2, (a, b) -> b - a); log.info("{}",list2); }
输出结果:
[main] INFO com.flydean.CompareUsage - [1, 2, 3, 4, 5] [main] INFO com.flydean.CompareUsage - [5, 4, 3, 2, 1]
默认状况下Integer是按照升序来排的,可是咱们能够经过传入一个Comparator来改变这个过程。
java中有值类型也有引用类型,引用类型通常是针对于java中对象来讲的,今天介绍一下java中的引用类型。java为引用类型专门定义了一个类叫作Reference。Reference是跟java垃圾回收机制息息相关的类,经过探讨Reference的实现能够更加深刻的理解java的垃圾回收是怎么工做的。
本文先从java中的四种引用类型开始,一步一步揭开Reference的面纱。
java中的四种引用类型分别是:强引用,软引用,弱引用和虚引用。
java中的引用默认就是强引用,任何一个对象的赋值操做就产生了对这个对象的强引用。
咱们看一个例子:
public class StrongReferenceUsage { @Test public void stringReference(){ Object obj = new Object(); } }
上面咱们new了一个Object对象,并将其赋值给obj,这个obj就是new Object()的强引用。
强引用的特性是只要有强引用存在,被引用的对象就不会被垃圾回收。
软引用在java中有个专门的SoftReference类型,软引用的意思是只有在内存不足的状况下,被引用的对象才会被回收。
先看下SoftReference的定义:
public class SoftReference<T> extends Reference<T>
SoftReference继承自Reference。它有两种构造函数:
public SoftReference(T referent)
和:
public SoftReference(T referent, ReferenceQueue<? super T> q)
第一个参数很好理解,就是软引用的对象,第二个参数叫作ReferenceQueue,是用来存储封装的待回收Reference对象的,ReferenceQueue中的对象是由Reference类中的ReferenceHandler内部类进行处理的。
咱们举个SoftReference的例子:
@Test public void softReference(){ Object obj = new Object(); SoftReference<Object> soft = new SoftReference<>(obj); obj = null; log.info("{}",soft.get()); System.gc(); log.info("{}",soft.get()); }
输出结果:
22:50:43.733 [main] INFO com.flydean.SoftReferenceUsage - java.lang.Object@71bc1ae4 22:50:43.749 [main] INFO com.flydean.SoftReferenceUsage - java.lang.Object@71bc1ae4
能够看到在内存充足的状况下,SoftReference引用的对象是不会被回收的。
weakReference和softReference很相似,不一样的是weekReference引用的对象只要垃圾回收执行,就会被回收,而无论是否内存不足。
一样的WeakReference也有两个构造函数:
public WeakReference(T referent); public WeakReference(T referent, ReferenceQueue<? super T> q);
含义和SoftReference一致,这里就再也不重复表述了。
咱们看下弱引用的例子:
@Test public void weakReference() throws InterruptedException { Object obj = new Object(); WeakReference<Object> weak = new WeakReference<>(obj); obj = null; log.info("{}",weak.get()); System.gc(); log.info("{}",weak.get()); }
输出结果:
22:58:02.019 [main] INFO com.flydean.WeakReferenceUsage - java.lang.Object@71bc1ae4 22:58:02.047 [main] INFO com.flydean.WeakReferenceUsage - null
咱们看到gc事后,弱引用的对象被回收掉了。
PhantomReference的做用是跟踪垃圾回收器收集对象的活动,在GC的过程当中,若是发现有PhantomReference,GC则会将引用放到ReferenceQueue中,由程序员本身处理,当程序员调用ReferenceQueue.pull()方法,将引用出ReferenceQueue移除以后,Reference对象会变成Inactive状态,意味着被引用的对象能够被回收了。
和SoftReference和WeakReference不一样的是,PhantomReference只有一个构造函数,必须传入ReferenceQueue:
public PhantomReference(T referent, ReferenceQueue<? super T> q)
看一个PhantomReference的例子:
@Slf4j public class PhantomReferenceUsage { @Test public void usePhantomReference(){ ReferenceQueue<Object> rq = new ReferenceQueue<>(); Object obj = new Object(); PhantomReference<Object> phantomReference = new PhantomReference<>(obj,rq); obj = null; log.info("{}",phantomReference.get()); System.gc(); Reference<Object> r = (Reference<Object>)rq.poll(); log.info("{}",r); } }
运行结果:
07:06:46.336 [main] INFO com.flydean.PhantomReferenceUsage - null 07:06:46.353 [main] INFO com.flydean.PhantomReferenceUsage - java.lang.ref.PhantomReference@136432db
咱们看到get的值是null,而GC事后,poll是有值的。
由于PhantomReference引用的是须要被垃圾回收的对象,因此在类的定义中,get一直都是返回null:
public T get() { return null; }
讲完上面的四种引用,接下来咱们谈一下他们的父类Reference和ReferenceQueue的做用。
Reference是一个抽象类,每一个Reference都有一个指向的对象,在Reference中有5个很是重要的属性:referent,next,discovered,pending,queue。
private T referent; /* Treated specially by GC */ volatile ReferenceQueue<? super T> queue; Reference next; transient private Reference<T> discovered; /* used by VM */ private static Reference<Object> pending = null;
每一个Reference均可以当作是一个节点,多个Reference经过next,discovered和pending这三个属性进行关联。
先用一张图来对Reference有个总体的概念:
referent就是Reference实际引用的对象。
经过next属性,能够构建ReferenceQueue。
经过discovered属性,能够构建Discovered List。
经过pending属性,能够构建Pending List。
在讲这三个Queue/List以前,咱们先讲一下Reference的四个状态:
从上面的图中,咱们能够看到一个Reference能够有四个状态。
由于Reference有两个构造函数,一个带ReferenceQueue,一个不带。
Reference(T referent) { this(referent, null); } Reference(T referent, ReferenceQueue<? super T> queue) { this.referent = referent; this.queue = (queue == null) ? ReferenceQueue.NULL : queue; }
对于带ReferenceQueue的Reference,GC会把要回收对象的Reference放到ReferenceQueue中,后续该Reference须要程序员本身处理(调用poll方法)。
不带ReferenceQueue的Reference,由GC本身处理,待回收的对象其Reference状态会变成Inactive。
建立好了Reference,就进入active状态。
active状态下,若是引用对象的可到达状态发送变化就会转变成Inactive或Pending状态。
Inactive状态很好理解,到达Inactive状态的Reference状态不能被改变,会等待GC回收。
Pending状态表明等待入Queue,Reference内部有个ReferenceHandler,会调用enqueue方法,将Pending对象入到Queue中。
入Queue的对象,其状态就变成了Enqueued。
Enqueued状态的对象,若是调用poll方法从ReferenceQueue拿出,则该Reference的状态就变成了Inactive,等待GC的回收。
这就是Reference的一个完整的生命周期。
有了上面四个状态的概念,咱们接下来说三个Queue/List:ReferenceQueue,discovered List和pending List。
ReferenceQueue在讲状态的时候已经讲过了,它本质是由Reference中的next链接而成的。用来存储GC待回收的对象。
pending List就是待入ReferenceQueue的list。
discovered List这个有点特别,在Pending状态时候,discovered List就等于pending List。
在Active状态的时候,discovered List实际上维持的是一个引用链。经过这个引用链,咱们能够得到引用的链式结构,当某个Reference状态再也不是Active状态时,须要将这个Reference从discovered List中删除。
最后讲一下WeakHashMap,WeakHashMap跟WeakReference有点相似,在WeakHashMap若是key再也不被使用,被赋值为null的时候,该key对应的Entry会自动从WeakHashMap中删除。
咱们举个例子:
@Test public void useWeakHashMap(){ WeakHashMap<Object, Object> map = new WeakHashMap<>(); Object key1= new Object(); Object value1= new Object(); Object key2= new Object(); Object value2= new Object(); map.put(key1, value1); map.put(key2, value2); log.info("{}",map); key1 = null; System.gc(); log.info("{}",map); }
输出结果:
[main] INFO com.flydean.WeakHashMapUsage - {java.lang.Object@14899482=java.lang.Object@2437c6dc, java.lang.Object@11028347=java.lang.Object@1f89ab83} [main] INFO com.flydean.WeakHashMapUsage - {java.lang.Object@14899482=java.lang.Object@2437c6dc}
能够看到gc事后,WeakHashMap只有一个Entry了。
泛型是java从JDK 5开始引入的新特性,泛型的引入可让咱们在代码编译的时候就强制检查传入的类型,从而提高了程序的健壮度。
泛型能够用在类和接口上,在集合类中很是常见。本文将会讲解泛型致使的类型擦除。
咱们先举一个最简单的例子:
@Slf4j public class TypeErase { public static void main(String[] args) { ArrayList<String> stringArrayList = new ArrayList<String>(); stringArrayList.add("a"); stringArrayList.add("b"); action(stringArrayList); } public static void action(ArrayList<Object> al){ for(Object o: al) log.info("{}",o); } }
上面的例子中,咱们定义了一个ArrayList,其中指定的类型是String。
而后调用了action方法,action方法须要传入一个ArrayList,可是这个list的类型是Object。
乍看之下好像没有问题,由于String是Object的子类,是能够进行转换的。
可是实际上代码编译出错:
Error:(18, 16) java: 不兼容的类型: java.util.ArrayList<java.lang.String>没法转换为java.util.ArrayList<java.lang.Object>
上面例子的缘由就是类型擦除(type erasure)。java中的泛型是在编译时作检测的。而编译后生成的二进制文件中并不保存类型相关的信息。
上面的例子中,编译以后无论是ArrayList<String> 仍是ArrayList<Object> 都会变成ArrayList。其中的类型Object/String对JVM是不可见的。
可是在编译的过程当中,编译器发现了二者的类型不一样,而后抛出了错误。
要解决上面的问题,咱们可使用下面的办法:
public static void actionTwo(ArrayList<?> al){ for(Object o: al) log.info("{}",o); }
经过使用通配符?,能够匹配任何类型,从而经过编译。
可是要注意这里actionTwo方法中,由于咱们不知道传入的类型究竟是什么,因此咱们不能在actionTwo中添加任何元素。
从上面的例子咱们能够看出,ArrayList<String>并非ArrayList<Object>的子类。若是必定要找出父子关系,那么ArrayList<String>是Collection<String>的子类。
可是Object[] objArray是String[] strArr的父类。由于对Array来讲,其具体的类型是已知的。
泛型是JDK 5引入的概念,泛型的引入主要是为了保证java中类型的安全性,有点像C++中的模板。
可是Java为了保证向下兼容性,它的泛型所有都是在编译期间实现的。编译器执行类型检查和类型推断,而后生成普通的非泛型的字节码。这种就叫作类型擦除。编译器在编译的过程当中执行类型检查来保证类型安全,可是在随后的字节码生成以前将其擦除。
这样就会带来让人困惑的结果。本文将会详细讲解泛型在java中的使用,以免进入误区。
有关协变和逆变的详细说明能够参考:
这里我再总结一下,协变和逆变只有在类型声明中的类型参数里才有意义,对参数化的方法没有意义,由于该标记影响的是子类继承行为,而方法没有子类。
固然java中没有显示的表示参数类型是协变仍是逆变。
协变意思是若是有两个类 A<T> 和 A<C>, 其中C是T的子类,那么咱们能够用A<C>来替代A<T>。
逆变就是相反的关系。
Java中数组就是协变的,好比Integer是Number的子类,那么Integer[]也是 Number[]的子类,咱们能够在须要 Number[] 的时候传入 Integer[]。
接下来咱们考虑泛型的状况,List<Number> 是否是 List<Integer>的父类呢?很遗憾,并非。
咱们得出这样一个结论:泛型不是协变的。
为何呢?咱们举个例子:
List<Integer> integerList = new ArrayList<>(); List<Number> numberList = integerList; // compile error numberList.add(new Float(1.111));
假如integerList能够赋值给numberList,那么numberList能够添加任意Number类型,好比Float,这样就违背了泛型的初衷,向Integer list中添加了Float。因此上面的操做是不被容许的。
刚刚咱们讲到Array是协变的,若是在Array中带入泛型,则会发生编译错误。好比new List<String>[10]是不合法的,可是 new List<?>[10]是能够的。由于在泛型中?表示的是未知类型。
List<?>[] list1 = new List<?>[10]; List<String>[] list2 = new List<String>[10]; //compile error
由于类型擦除的缘由,List<String>和List<Integer>在运行是都会被当作成为List。因此咱们在使用泛型时候的一些操做会遇到问题。
假如咱们有一个泛型的类,类中有一个方法,方法的参数是泛型,咱们想在这个方法中对泛型参数进行一个拷贝操做。
public class CustUser<T> { public void useT(T param){ T copy = new T(param); // compile error } }
上面操做会编译失败,由于咱们并不知道T是什么,也不知道T到底有没有相应的构造函数。
直接clone T是没有办法了,若是咱们想copy一个Set,set中的类型是未定义的该怎么作呢?
public void useTSet(Set<?> set){ Set<?> copy1 = new HashSet<?>(set); // compile error Set<?> copy2 = new HashSet<>(set); Set<?> copy3 = new HashSet<Object>(set); }
能够看到?是不能直接用于实例化的。可是咱们能够用下面的两种方式代替。
再看看Array的使用:
public void useArray(){ T[] typeArray1= new T[20]; //compile error T[] typeArray2=(T[]) new Object[20]; T[] typeArray3 = (T[]) Array.newInstance(String.class, 20); }
一样的,T是不能直接用于实例化的,可是咱们能够用下面两种方式代替。
由于类型擦除的缘由,咱们在接口实现中,实现同一个接口的两个不一样类型是无心义的:
public class someClass implements Comparable<Number>, Comparable<String> { ... } // no
由于在编译事后的字节码看来,两个Comparable是同样的。
一样的,咱们使用T来作类型强制转换也是没有意义的:
public <T> T cast(T t, Object o) { return (T) o; }
由于编译器并不知道这个强制转换是对仍是错。
集合是java中一个很是重要的工具类型,但愿你们可以熟练掌握。
本文的代码例子https://github.com/ddean2009/learn-java-collections
本文的PDFjava-collection-all-in-one.pdf
本文已收录于 http://www.flydean.com/java-collection-all-in-one/最通俗的解读,最深入的干货,最简洁的教程,众多你不知道的小技巧等你来发现!
欢迎关注个人公众号:「程序那些事」,懂技术,更懂你!