LinkedList与Queue源码分析

java中的数据结构源码解析的系列文章:
ArrayList源码分析
LinkedList与Queue源码分析java

1、简述

上篇已经分析了基于数组实现数据存储的ArrayList(线性表),而本篇的主角是LinkedList,这个使用了链表实现数据存储的集合,它的增、删、查、改方式又会是怎样的呢?下面就开始对LinkedList的源码进行分析吧。node

2、分析

List

在分析LinkedList以前,仍是先瞄一眼List接口,虽然前篇已经看过一遍了,但为了明确下文的分析方向,仍是先把List接口中的几个增删改查方法再列一次。数组

public interface List<E> extends Collection<E> {
    boolean add(E e);
    void add(int index, E element);
    boolean remove(Object o);
    E remove(int index);
    E set(int index, E element);
    E get(int index);
    ...
}复制代码

LinkedList

一、成员变量

public class LinkedList<E> extends AbstractSequentialList<E> implements List<E>, Deque<E>, Cloneable, java.io.Serializable{
    transient int size = 0;
    transient Node<E> first;
    transient Node<E> last;
    ...
}复制代码
  • size:数组元素个数
  • first:头节点
  • last:尾节点

LinkedList的成员变量不多,就上面那3个,其中first和last都是Node类型(即节点类型),用来表示链表的头和尾,这跟ArrayList就存在着本质的区别了。bash

要注意:

first和last仅仅只是节点而已,跟数据元素没有关系,能够认为就是2个额外的"指针",分别指着链表的头和尾。
数据结构

二、构造函数

1)LinkedList

public LinkedList() {
}复制代码

LinkedList的构造函数有2个,以平时最经常使用的构造函数为例,发现该构造函数什么事都没作。函数

2)Node

private static class Node<E> {
    E item;
    Node<E> next;
    Node<E> prev;

    Node(Node<E> prev, E element, Node<E> next) {
        this.item = element;
        this.next = next;
        this.prev = prev;
    }
}复制代码

再来看看这个节点类型的类结构,它描述了一个带有两个箭头的数据节点,也就是说LinkedList是双向链表。
源码分析

为何Node这个类是静态的?答案是:这跟内存泄露有关,Node类是在LinkedList类中的,也就是一个内部类,若不使用static修饰,那么Node就是一个普通的内部类,在java中,一个普通内部类在实例化以后,默认会持有外部类的引用,这就有可能形成内存泄露。但使用static修饰过的内部类(称为静态内部类),就不会有这种问题,在Android中,有不少这样的状况,如Handler的使用。好像扯远了~post

好了,那下面就看看LinkedList是怎么进行增、删、改、查的。优化

三、增

1)add(E e)

public boolean add(E e) {
    linkLast(e);
    return true;
}
void linkLast(E e) {
    final Node<E> l = last;
    final Node<E> newNode = new Node<>(l, e, null);
    last = newNode;
    if (l == null)
        first = newNode;
    else
        l.next = newNode;
    size++;
    modCount++;
}复制代码

由于LinkedList是链表结构,因此每添加一个元素就是让这个元素连接到链表的尾部。

add(E e)的核心是linkLast()方法,它对元素进行了真正添加操做,分为如下几个步骤:ui

  1. 先让此时集合中的尾节点(即last"指针"指向的节点)赋给变量 l 。
  2. 而后,建立一个新节点,结合Node的构造函数,咱们能够知道,在建立新节点(newNode)的同时,newNode的prev指向了l(即以前集合中的尾节点),变量 l 就是newNode的前驱节点了,newNode的后继节点为null。
  3. 再将last指向newNode,也就是说newNode成为该链表新的末尾节点。
  4. 接着,判断变量 l 是否为null,如果null,说明以前集合中没有元素(此时newNode是集合中惟一一个元素),则将first指向newNode,也就是说此时的newNode既是头节点又是尾节点(要知道,这时newNode中的prev和next均是null,但被first和last同时指向);

    若变量 l 不是null,说明以前集合中已经存在了至少一个元素,则让以前集合中的尾节点(即变量 l )的next指向newNode。(结合步骤2,此时的newNode与newNode的前驱节点 l 已是相互指向了)
  5. 最后,跟ArrayList同样,让记录集合长度的size加1。

经过对add(E e)方法的分析,咱们也知道了,原来LinkedList中的元素就是一个个的节点(Node),而真正的数据则存放在Node之中(数据被Node的item所引用)。

2)add(int index, E element)

public void add(int index, E element) {
    checkPositionIndex(index);

    if (index == size)
        linkLast(element);
    else
        linkBefore(element, node(index));
}复制代码

该add方法将添加集合元素分为2种状况,一种是在集合尾部添加,另外一种是在集合中间或头部添加,由于第一种状况也是调用linkLast()方法,这里再也不啰嗦,咱们看看第二种状况,分析linkBefore(E e, Node succ)这个方法是怎么对元素进行添加操做的。

void linkBefore(E e, Node<E> succ) {
    // assert succ != null;
    final Node<E> pred = succ.prev;
    final Node<E> newNode = new Node<>(pred, e, succ);
    succ.prev = newNode;
    if (pred == null)
        first = newNode;
    else
        pred.next = newNode;
    size++;
    modCount++;
}复制代码

往LinkedList集合中间或头部添加元素分为如下几个步骤:

  1. 先调用node(int index)方法获得指定位置的元素节点,也就是linkBefore()方法中的形参 succ。
  2. 而后,经过succ.prevt获得succ的前一个元素pred。(此时拿到了第index个元素succ,和第index-1个元素pred)
  3. 再建立一个新节点newNode,newNode的prev指向了pred,newNode的next指向了succ。(即newNode往succ和pred的中间插入,并单向与它们分别创建联系,eg:pred ← newNode → succ
  4. 再让succ的prev指向newNode。(succ与跟newNode创建联系了,此时succ与newNode是双向关联,eg:pred ← newNode ⇋ succ)。
  5. 接着,判断pred是否为null,如果null,说明以前succ是集合中的第一个元素(即index值为0),如今newNode跑到了succ前面,因此只须要将first指向newNode(eg:first ⇌ newNode ⇋ succ);

    若pred不为null,则将pred的next指向newNode。(这时pred也主动与newNode创建联系了,此时pred与newNode也是双向关联,eg:pred ⇌ newNode ⇋ succ
  6. 最后,让记录集合长度的size加1。

对于链表的操做仍是有些复杂的,特别是这种双向链表,不过仔细理解下,也不是什么问题(看不懂的能够边看步骤边动手画一画)。到这里,对于LinkedList的第一个添加方法就分析完了。

下面是对node(int index)方法的分析:

这也是LinkedList获取元素的核心方法,至关重要,由于后面会出现不少次,这里就顺带先分析一下了。

Node<E> node(int index) {
    // assert isElementIndex(index);

    if (index < (size >> 1)) {
        Node<E> x = first;
        for (int i = 0; i < index; i++)
            x = x.next;
        return x;
    } else {
        Node<E> x = last;
        for (int i = size - 1; i > index; i--)
            x = x.prev;
        return x;
    }
}复制代码

  细看node(int index)方法中的代码逻辑,能够看到,它是经过遍历的方式,将集合中的元素一个个拿出来,再经过该元素的prev或next拿到下一个遍历的元素,通过index次循环后,最终才拿到了index对应的元素。

  跟ArrayList相比,由于ArrayList底层是数组实现,拥有下标这个特性,在获取元素时,不须要对集合进行遍历,因此查找某个元素会特别快(在数据量特别多的状况下,ArrayList和LinkedList在效率上的差异就至关明显了)。

  不过,LinkedList对元素的获取仍是作了必定优化的,它对index与集合长度的一半作比较,来肯定是在集合的前半段仍是后半段进行查找。

四、删

1)remove(int index)

public E remove(int index) {
    checkElementIndex(index);
    return unlink(node(index));
}
E unlink(Node<E> x) {
    // assert x != null;
    final E element = x.item;
    final Node<E> next = x.next;
    final Node<E> prev = x.prev;

    if (prev == null) {
        first = next;
    } else {
        prev.next = next;
        x.prev = null;
    }

    if (next == null) {
        last = prev;
    } else {
        next.prev = prev;
        x.next = null;
    }

    x.item = null;
    size--;
    modCount++;
    return element;
}复制代码

在remove(int index)这个方法中,先经过index和node(int index)拿到了要被删除的元素x,而后调用了unlink(Node x)方法将其删除,天然,LinkedList删除元素的核心方法就是unlink(Node x),删除操做分如下几个步骤:

  1. 经过要删除的元素x拿到它的前驱节点prev和后继节点next。

  2. 若前驱节点prev为null,说明x是集合中的首个元素,直接将first指向后继节点next便可;


    若不为null,则让前驱节点prev的next指向后继节点next,再将x的prev置空。(这时prev与x的关联就解除了,并与next创建了联系)。


  3. 若后继节点next为null,说明x是集合中的最后一个元素,直接将last指向前驱节点prev便可;(下图分别对应步骤2中的两种状况)


    若不为null,则让后继节点next的prev指向前驱节点prev,再将x的next置空。(这时next与x的关联就解除了,并与prev创建了联系)。

  4. 最后,让记录集合长度的size减1。

2)remove(Object o)

public boolean remove(Object o) {
    if (o == null) {
        for (Node<E> x = first; x != null; x = x.next) {
            if (x.item == null) {
                unlink(x);
                return true;
            }
        }
    } else {
        for (Node<E> x = first; x != null; x = x.next) {
            if (o.equals(x.item)) {
                unlink(x);
                return true;
            }
        }
    }
    return false;
}复制代码

remove(Object o)这个删除元素的方法的形参o是数据自己,而不是LinkedList集合中的元素(节点),因此须要先经过节点遍历的方式,找到o数据对应的元素,而后再调用unlink(Node x)方法将其删除,关于unlink(Node x)的分析在第一个删除方法中已经提到了,可往回再看看。

五、查 & 改

LinkedList集合对数据的获取与修改均经过node(int index)方法来执行日后的操做,关于node(int index)方法的分析也已经在第一个添加方法的时候已经提过,这里也就再也不啰嗦了。

1)set(int index, E element)

public E set(int index, E element) {
    checkElementIndex(index);
    Node<E> x = node(index);
    E oldVal = x.item;
    x.item = element;
    return oldVal;
}复制代码

2)get(int index)

public E get(int index) {
    checkElementIndex(index);
    return node(index).item;
}复制代码

3、队列Queue

这里要顺带分析下java中的队列实现,why?由于java中队列的实现就是LinkedList,你可能会疑问,队列的英文是Queue,在java中也有对应的接口,怎么会跟LinkedList扯上关系呢?由于LinkedList实现了队列:

public class LinkedList<E> extends AbstractSequentialList<E> implements List<E>, Deque<E>, Cloneable, java.io.Serializable {
    ...
}复制代码

代码中的Deque是Queue的一个子接口,它继承了Queue:

public interface Deque<E> extends Queue<E> {...}复制代码

从这二者的关系,不可贵出,队列的实现方式也是链表。下面先来看看Queue的接口声明:

一、Queue

咱们知道,队列是先进先出的,添加元素只能从队尾添加,删除元素只能从队头删除,Queue中的方法就体现了这种特性。

public interface Queue<E> extends Collection<E> {
    boolean offer(E e);
    E poll();
    E peek();
    ...
}复制代码
  • offer():添加队尾元素
  • poll():删除队头元素
  • peek():获取队头元素

从上面这几个方法出发,来看看LinkedList是如何实现的。

二、LinkedList对Queue的实现

1)增

public boolean offer(E e) {
    return add(e);
}复制代码

能够看到,在LinkedList中,队列的offer(E e)方法其实是调用了LinkedList的add(E e),add(E e)已经在最前面分析过了,就是在链表的尾部添加一个元素~

2)删

public E poll() {
    final Node<E> f = first;
    return (f == null) ? null : unlinkFirst(f);
}

private E unlinkFirst(Node<E> f) {
    // assert f == first && f != null;
    final E element = f.item;
    final Node<E> next = f.next;
    f.item = null;
    f.next = null; // help GC
    first = next;
    if (next == null)
        last = null;
    else
        next.prev = null;
    size--;
    modCount++;
    return element;
}复制代码

poll()方法先拿到队头元素 f ,若 f 不为null,就调用unlinkFirst(Node f)其删除。unlinkFirst(Node f)在实现上跟unlink(Node x)差很少且相对简单,这里不作过多说明。

3)查

public E peek() {
    final Node<E> f = first;
    return (f == null) ? null : f.item;
}复制代码

peek()先经过first拿到队头元素,而后取出元素中的数据实体返回而已。

4、总结

  1. LinkedList是基于链表实现的,而且是双向链表。
  2. LinkedList中的元素就是一个个的节点,而真正的数据则存放在Node之中。
  3. LinkedList经过遍历的方式获取集合中的元素,效率比ArrayList低。
  4. Queue队列的实现方式也是链表,java中,LinkedList是Queue的实现。
相关文章
相关标签/搜索