LinkedList源码理解

LinkedList是也是很是常见的集合类，LinkedList是基于链表实现的集合。它拥有List集合的特色：java

存取有序
带索引
容许重复元素

还拥有Deque集合的特色：node

先入先出
双端操做

它自己的特色是：数组

对元素进行插入或者删除，只须要更改一些数据，不须要元素进行移动。

依然是经过源码来看看LinkedList如何实现本身的特性的。数据结构

Doubly-linked list implementation of the {@code List} and {@code Deque} interfaces. Implements all optional list operations,and permits all elements (including {@code null}).性能

对于List接口和Deque接口的双链表实现。实现了全部List接口的操做而且能存储全部的元素。测试

public class LinkedList<E> extends AbstractSequentialList<E> 
                       implements List<E>, Deque<E>, Cloneable, java.io.Serializable

能够看到LinkedList实现了一个Deque接口，实际上是说，LinkedList除了有List的特性，还有Deque的特性，那么Deque是什么呢？优化

public interface Deque<E> extends Queue<E>

        public interface Queue<E> extends Collection<E>

原来是继承了Collection集合的另外一个接口。this

Queue就是咱们常说的队列，它的特性是FIFO( First In First Out )先进先出，它的操做只有两个：spa

把元素存进队列尾部
从头部取出元素

就像排队办事同样的。3d

而它的子接口Deque除了这两操做之外，还能比Queue队列有更多的功能

既能够添加元素到队尾，也能够添加元素到队头
既能够从队尾取元素，也能够从队头取元素

如此看来就像两边均可以当队头和队尾同样，因此Deque又叫双端队列。

理所应当的，LinkedLisk也实现了这些特性，而且有Doubly-linked(双链表的特性)。

那么什么又是链表呢？

其实链表是一种线性的存储结构，意思是将要存储的数据存在一个存储单元里面，这个存储单元里面除了存放有待存储的数据之外，还存储有其下一个存储单元的地址。

双链表顾名思义，存储单元除了存储其下一个存储单元的地址，还存储了上一个存储单元的地址。每次查找数据的时候，就经过存储单元里存储的地址信息进行查找。

成员变量：

transient int size = 0;

transient Node<E> first;

transient Node<E> last;

只有三个，size表明LinkedList存储的元素个数。那这个Node是什么？

private static class Node<E> {
        E item;
        Node<E> next;
        Node<E> prev;

        Node(Node<E> prev, E element, Node<E> next) {
            this.item = element;
            this.next = next;
            this.prev = prev;
        }
    }

它是LinkedList内部的数据结构Node，做为LinkedList的基本存储单元，也最能体现LinkedList双链表的特性。

像这样的。

其中prev存储上一个节点的引用(地址)，next存储下一个单元的引用，item就是具体要存的数据。

First和Last用来标明队头跟队尾。

添加数据：

public boolean add(E e) {
        linkLast(e);
        return true;
    }

    
void linkLast(E e) {
        final Node<E> l = last;
        final Node<E> newNode = new Node<>(l, e, null);
        last = newNode;
        if (l == null)
            first = newNode;
        else
            l.next = newNode;
        size++;
        modCount++;
    }

默认是调用添加到尾部的方法。前面说过，LinkedList的基本存储单元是Node，因此添加进来的数据会被封装进Node的item属性里，并且这个新Node的prev会指向前一个Node，前一个Node的next会指向这个新Node。

相似这样，可是注意画线只是一种形象的表达方法，就如上面所说，在Node里的prev属性和next属性是用来存储引用的，经过这个引用就能找到前一个Node或者后一个Node。

public void addFirst(E e) {
        linkFirst(e);
    }

private void linkFirst(E e) {
        final Node<E> f = first;
        final Node<E> newNode = new Node<>(null, e, f);
        first = newNode;
        if (f == null)
            last = newNode;
        else
            f.prev = newNode;
        size++;
        modCount++;
    }

public void addLast(E e) {
        linkLast(e);
    }

public boolean offerLast(E e) {
        addLast(e);
        return true;
    }

其实LinkedList不少不一样名的方法，可是实现方式都是相似的，这是由于咱们有可能用LinkedList表达不一样的数据结构，虽然都是添加元素到队首/队尾，可是清晰的描述对代码的可读性是有好处的。像若是要用LinkedList表示Stack(栈)数据结构时候用push()/pop()/peek()等方法来描述，用LinkedList表示Queue(队列)数据结构时候用add()/offer()等方法来描述。(固然，更好的实现方式是多态。)

删除数据：

//删除头Node
public E removeFirst() {
        final Node<E> f = first;
        if (f == null)
            throw new NoSuchElementException();
        return unlinkFirst(f);
    }

//删除操做
private E unlinkFirst(Node<E> f) {
        // assert f == first && f != null;
        final E element = f.item;
        final Node<E> next = f.next;
        f.item = null;
        f.next = null; // help GC
        first = next;
        if (next == null)
            last = null;
        else
            next.prev = null;
        size--;
        modCount++;
        return element;
    }
//删除尾Node
public E removeLast() {
        final Node<E> l = last;
        if (l == null)
            throw new NoSuchElementException();
        return unlinkLast(l);
    }

//删除操做
    private E unlinkLast(Node<E> l) {
        // assert l == last && l != null;
        //拿到最后一个元素存放的数据
        final E element = l.item;
        //拿到最后一个元素的prev前元素的引用
        final Node<E> prev = l.prev;
        //将它们赋值为null
        l.item = null;
        l.prev = null; // help GC
        //如今前元素是list(最后一个Node)
        last = prev;
        //若是前元素已是null说明没有Node了
        if (prev == null)
            first = null;
        else
            //说明前面还有元素，那么前元素的next就存放null
            prev.next = null;
        size--;
        modCount++;
        return element;
    }

先看看简单的删除，这里是指定删除最前跟最后的元素，因此只要判断删除后Node的prev或者next是否还有值，有就说明还有Node，没有就说明LinkedList已经为空了。

怎样才算删除了头/尾Node，只要它的next/prev为空，说明没有引用指向它了，那么咱们就认为它从LinkedList里删除了，由于咱们没法经过存储单元的引用找到这个Node，因此GC很快也会来回收掉这个Node。

这只是删除头尾Node，那要是删除中间的Node呢？这要跟下面的查找和插入一块儿看。

查找元素：

public E get(int index) {
        checkElementIndex(index);
        return node(index).item;
    }


Node<E> node(int index) {
        // assert isElementIndex(index);
        
        //若是索引小于元素个数的一半，就从前遍历
        if (index < (size >> 1)) {
            Node<E> x = first;
            for (int i = 0; i < index; i++)
                x = x.next;
            return x;
        } else {//不然从后遍历
            Node<E> x = last;
            for (int i = size - 1; i > index; i--)
                x = x.prev;
            return x;
        }
    }

数组默认是有下标的，能够一次就取出所在位置的元素，可是LinkedList底层可没有维护这么一个数组，那怎么知道第几个元素是什么呢？

笨方法，我有size个元素，我不知道你指定的index在哪，那我一个一个找过去不就完事了？毕竟个人存储单元Node记得它旁边的单元的引用(地址)。

若是你的index比我size的一半还大，那我就从后面找，由于我是双端队列，有Last的引用(地址)，因此能够调换两头。

因此，在LinkedList里面找元素可不容易，最多可能要找size/2次才能找到。

只要找到了想要的位置，那么插入和删除指定的这个Node就很简单了。

public E remove(int index) {
        checkElementIndex(index);
        return unlink(node(index));
    }

E unlink(Node<E> x) {
        // assert x != null;
    //拿到所要删除的Node的item
        final E element = x.item;
    //后一个Node
        final Node<E> next = x.next;
    //前一个Node
        final Node<E> prev = x.prev;

    //若是前一个Node为null(说明是第一个Node)
        if (prev == null) {
            //那么后一个Node做为first
            first = next;
        } else {//不然说明前面有Node
            //那前一个Node的下一个Node引用变为后一个Node
            prev.next = next;
            //当前的前引用变成null
            x.prev = null;
        }

    //若是后一个Node为null(说明是最后一个Node)
        if (next == null) {
            //那么前一个Node做为last
            last = prev;
        } else {//不然说明后面还有Node
            //那后一个Node的下一个Node引用变为前一个Node
            next.prev = prev;
            //当前的后引用变为null
            x.next = null;
        }

    //保存的元素也设为null
        x.item = null;
    //元素-1
        size--;
    //修改次数+1
        modCount++;
        return element;
    }

    public void add(int index, E element) {
        checkPositionIndex(index);

        if (index == size)
            linkLast(element);
        else
            linkBefore(element, node(index));
    }

    void linkBefore(E e, Node<E> succ) {
        // assert succ != null;
        //要插入位置的前一个Node
        final Node<E> pred = succ.prev;
        //新Node，前引用是前一个Node，后引用是当前位置的Node
        final Node<E> newNode = new Node<>(pred, e, succ);
        //后一个Node的前引用变为这个新Node
        succ.prev = newNode;
        //若是没有前一个Node
        if (pred == null)
            //说明添加的就是第一个Node了
            first = newNode;
        else//说明前面还有Node
            //将前一个Node的后引用变为这个新的Node
            pred.next = newNode;
        //元素+1
        size++;
        modCount++;
    }

只是改变了存储单元Node里的prev和next，咱们就能够认为这个Node被插入/删除了。

代码的注释配合着下图看，就会方便理解不少，其中注意区分源代码中的命名，最好拿笔记一下容易区分一些。

若是是插入元素，倒着看就能够了。

关于遍历：

咱们能够了解到，LinkedList最大的性能消耗就在node(index)这步，这会须要去查找大量的元素。可是只要找到了这个元素所在的Node，插入跟删除就很是的方便了。

因此对于get(index)这个方法，咱们须要很是当心的去使用，若是只想看一看这个位置的元素，能够用这个方法，可是若是是遍历LinkedList，千万不能够这样写：

for (int i = 0; i < linkedList.size(); i++) {
    linkedList.get(i).equals(Obj);
}

这样对于每次循环,get总会从前或者从后走i次，不考虑get方法中>>1的优化的话，这是一种O(n^2)时间复杂度的作法，效率十分低下。

因此LinkedList提供了内部的Iterator迭代器供咱们使用：

private class ListItr implements ListIterator<E> {
        private Node<E> lastReturned;
        private Node<E> next;
        private int nextIndex;
        private int expectedModCount = modCount;

        ListItr(int index) {
            // assert isPositionIndex(index);
            next = (index == size) ? null : node(index);
            nextIndex = index;
        }

        public boolean hasNext() {
            return nextIndex < size;
        }

        public E next() {
            checkForComodification();
            if (!hasNext())
                throw new NoSuchElementException();

            lastReturned = next;
            next = next.next;
            nextIndex++;
            return lastReturned.item;
        }

其实就是经过不断调用next()方法取得Node，而后再对Node作操做，这样时间复杂度就是O(n)了，不会有大量重复无用的遍历。

总结：其实LinkedList的特色插入、删除快，只是针对此次的操做而言的。

LinkedList作插入、删除的时候，慢在要找到具体的位置，快在只须要改变先后Node的引用地址

ArrayList作插入、删除的时候，慢在数组元素的批量赋值(前文里的System.arraycopy)，快在搜索

因此，若是待插入、删除的元素是在数据结构的前半段尤为是很是靠前的位置的时候，LinkedList的效率将大大快过ArrayList，由于ArrayList将批量copy大量的元素；越日后，对于LinkedList来讲，由于它是双向链表，因此在第2个元素后面插入一个数据和在倒数第2个元素后面插入一个元素在效率上基本没有差异，可是ArrayList因为要批量copy的元素愈来愈少，操做速度必然追上乃至超过LinkedList。

不论怎么说，须要根据具体状况来选择对应的集合，最好作一下性能测试，这样才能有更高的效率。