LinkedList源码分析--基于JDK1.8

LinkedList源码分析

LinkedList的UML图:
1592201271(1).png
LinkedList真正用来存储元素的数据结构-> Node类
Node类是LinkedList中的私有内部类,LinkedList中经过Node来存储集合中的元素node

  • E:节点的值
  • Node next: 当前节点的后一个节点的引用(能够理解为指向当前节点的后一个节点的指针)
  • Node prev:当前节点的前一个节点的引用(能够理解为指向当前节点的前一个节点的指针)
private static class Node<E> {
    E item;
    Node<E> next;
    Node<E> prev;

    Node(Node<E> prev, E element, Node<E> next) {
        this.item = element;
        this.next = next;
        this.prev = prev;
    }
}

LinkedList的元素

//LinkedList节点个数,用来记录LinkedList的大小
transient int size = 0;

/**
 * 指向第一个节点的指针。用来表示LinkedList的头结点
 * Invariant: (first == null && last == null) ||
 *            (first.prev == null && first.item != null)
 */
transient Node<E> first;

/**
 * 指向最后一个节点的指针。用来表示LinkedList的尾结点
 * Invariant: (first == null && last == null) ||
 *            (last.next == null && last.item != null)
 */
transient Node<E> last;

LinkedList的构造函数(两个)

ArrayList的构造函数有三个,比LinkedList多提供了一个设置初始化容量来初始化类。LinkedList没有提供该方法,缘由:由于LinkedList底层是经过链表实现的,每添加新元素的时候,都是经过连接新的节点实现的,也就是说它的容量是随着元素的个数的变化而动态变化的。而ArrayList底层是经过数组来存储新添加的元素的,因此咱们能够为ArrayList设置初始容量(也就是设置数组的大小)数组

/**
 * 空参构造
 */
public LinkedList() {
}

/**
 * 构造包含指定集合元素的列表,按照集合的迭代器返回元素的顺序
 * 传入一个结合做为参数初始化LinkedList。
 *
 * @param  c 将其元素放置在此列表中的集合
 * @throws NullPointerException 若是指定的集合为空
 */
public LinkedList(Collection<? extends E> c) {
    this();
    addAll(c);
}

LinkedList的构造函数(带参数)

在LinkedList带集合参数的构造函数中有一个重要的方法addAll(int index, Collection),这块儿的方法有点绕,若是没看懂,建议手画一遍。数据结构

/**
 * 经过调用addAll(int index, Collection<? extends E> c)添加 集合
 */
public boolean addAll(Collection<? extends E> c) {
    return addAll(size, c);
}
/**
 * checkPositionIndex(index); 检查传入的参数是否合法
 */
public boolean addAll(int index, Collection<? extends E> c) {
    checkPositionIndex(index);
    // 将集合转换为数组
    Object[] a = c.toArray();
    // numNew 存储数组的长度
    int numNew = a.length;
    // 若是 c:待添加的集合为null,直接返回false,不进行后面的操做
    if (numNew == 0)
        return false;
    // pred:指代 待添加节点的前一个节点
    // succ:指的是待添加节点的位置
    Node<E> pred, succ;
     // 若是index==size,说明此时须要添加LinkedList的集合中每个元素都是在LinkedList最后面。因此把succ设置为null, pred指向尾结点
     // 不然的话succ指向插入待插入位置的节点。这里用到了node(index)方法,pred指向succ节点的前一个节点
    if (index == size) {
        // 新添加的元素的位置是位于LinkedList最后一个元素的后面,也就是在LinkedList尾部追加元素
        succ = null;
        pred = last;
    } else {
        succ = node(index);
        pred = succ.prev;
    }
    /**
      * 遍历数组中的每个元素。在每次遍历的时候,都新建一个节点,该节点的值存储数组a中遍历的值,该节点的prev存储pred节点,next设置为null。
      * 接着判断该节点的前一个节点是否为空,若是为空的话,则把当前节点设置为头结点
      * 不然的话就把当前节点的前一个节点的next值设置为当前节点。最后把pred指向当前节点,方便后续节点的添加
      */
    for (Object o : a) {
        @SuppressWarnings("unchecked") E e = (E) o;
        Node<E> newNode = new Node<>(pred, e, null);
        if (pred == null)
            first = newNode;
        else
            pred.next = newNode;
        pred = newNode;
    }
    /**
      * 当succ为null时,也就是新添加的节点位于LinkedList集合的最后一个元素的后面。
      * 上面的for遍历的a的全部元素,此时的pred指向的是Linked中的最后一个元素,因此把last指向pred指向的节点
      * 当不为空的时候,代表在LinkedList集合中添加的元素,须要把pred的next指向succ上,succ的prev指向pred
      */
    if (succ == null) {
        last = pred;
    } else {
        pred.next = succ;
        succ.prev = pred;
    }
    // 从新设置集合的大小
    size += numNew;
    // 修改的次数-自增。
    modCount++;
    return true;
}

LinkedList中的一些辅助方法

  • linkFirst(E e){};把参数中的元素做为链表的第一个元素
/**
 * 连接e做为第一个元素。
 */
private void linkFirst(E e) {
    final Node<E> f = first;// LinkedList中的第一个元素first赋给 f
    // 组建新的node,新添加的元素的succ(后指针指向给 f)
    final Node<E> newNode = new Node<>(null, e, f);
    // 将新插入的节点e,赋给first
    first = newNode;
    // 若是 f== null ;说明是空链表,把新节点设置为尾结点
    if (f == null)
        last = newNode;
    else
        f.prev = newNode;
    size++;
    modCount++;
}
  • linkLast(E e){};把参数中的元素做为链表的最后一个元素
/**
 * 连接e做为最后一个元素。
 */
void linkLast(E e) {
    // 获取尾部元素
    final Node<E> l = last; 
    // 以尾部元素为前继结点建立一个新节点
    final Node<E> newNode = new Node<>(l, e, null);
    // 更新尾部节点为须要插入的节点
    last = newNode;

    if (l == null)
        //若是为空链表的状况:同时更新first节点为须要插入的节点。(也就是说,该节点便是头结点也是尾节点last)
        first = newNode;
    else
        // 不是空链表的状况:将原来的尾部节点(如今是却是第二个节点)的next指向须要插入的节点
        l.next = newNode;
    size++;  // 更新链表大小和修改次数,插入完毕
    modCount++;
}
  • linkBefore(E e,Node succ);在非空节点succ以前插入元素 e
/**
 * 将元素e插入到非空节点succ以前。
 */
void linkBefore(E e, Node<E> succ) {
    // assert succ != null;
    // 建立一个pred变量指向succ节点的前一个节点
    final Node<E> pred = succ.prev;
    // 建立一个新节点,他的prev设置为咱们新建的pred变量,后节点设置为succ
    final Node<E> newNode = new Node<>(pred, e, succ);
    // succ的上节点(prev)指向新建的节点
    succ.prev = newNode;
    // 判断succ的前节点是否为null,为null,则把新节点设置为链表的头结点
    if (pred == null)
        first = newNode;
    else
        // 不为空把,succ的前一个节点的next指向新节点
        pred.next = newNode;
    size++;
    modCount++;
}
  • unlinkFirst( Node f ){};删除LinkedList中的第一个节点。(该节点不为空,返回删除节点的值)。这是一个私有方法,咱们不可以调用,assert f == first && f != null; 参数f是头结点,并且f不能为null
/**
 * 解除非空第一个节点f的连接。
 */
private E unlinkFirst(Node<E> f) {
    // assert f == first && f != null;
    // 定义一个变量element,值为待删除节点的值。
    final E element = f.item;
    // 定义变量next,值为:待删除的节点的下一个节点
    final Node<E> next = f.next;
    // f节点的值设置为空
    f.item = null;
    f.next = null; // help GC
    // 将变量next设置为头节点
    first = next;
    // 判断f的下一个节点是否为空,为空:把last设置为空
    if (next == null)
        last = null;
    else
        // 不为空,将next的前节点设置为空。next为头结点
        next.prev = null;
    size--;
    modCount++;
    return element;
}
  • unlinkLast(Node l){};删除LinkedList的最后一个节点(该节点不为空,并返回删除节点对应的值)
/**
 * Unlinks non-null last node l.
 */
private E unlinkLast(Node<E> l) {
    // assert l == last && l != null;
    // 建立变量element,值为:待删除的节点的值
    final E element = l.item;
    // 建立变量 prev:值为:待删除的节点的前节点
    final Node<E> prev = l.prev;
    // 待删除的节点的值赋空
    l.item = null;
    l.prev = null; // help GC
    // 将last指向 新建的节点 prev 
    last = prev;
    // 判断待删除的节点的前节点是否为空,为空:该链表则为空链表,将头结点first赋null值
    if (prev == null)
        first = null;
    else
        // 不为空,将待删除的前节点的next指向 null
        prev.next = null;
    size--;
    modCount++;
    return element;//返回删除的节点的值
}
  • unlink(Node e);删除一个节点,该节点不为空
/**
 * Unlinks non-null node x.
 */
E unlink(Node<E> x) {
    // assert x != null;
    // 变量 element:值:要删除的节点的值
    final E element = x.item;
    // 新建变量:next,值:要删除的节点的下一个节点
    final Node<E> next = x.next;
    // 新建变量:prev,值:要删除的节点的上一个节点
    final Node<E> prev = x.prev;
    // 判断要删除的节点的上一个节点为空,为空:则删除的是头结点,将first指向新建的next
    if (prev == null) {
        first = next;
    } else {
        // 不为空:将要删除的节点的上一个节点的next指向要删除的节点的下一个节点
        prev.next = next;
        x.prev = null;
    }
    // 判断要删除的节点的下一个节点是否为空,为空:则删除的尾结点,将last指向prev,也就是指向要删除的节点的上一个节点
    if (next == null) {
        last = prev;
    } else {
        // 不为空,将要删除的节点的下一个节点的上节点指向-》要删除的节点的上个节点
        next.prev = prev;
        x.next = null;
    }
    // 这一步就把要删除的节点赋了空值,有助于gc回收
    x.item = null;
    size--;
    modCount++;
    return element;
}
  • Node node(int index); 计算指定索引上的节点,并返回。 这里LinkedList不是从头开始进行遍历,而是先比较一下index更靠近链表的头结点仍是尾结点,而后进行遍历,获取对应index的节点
/**
 * 返回指定元素索引处的(非空)节点。
 */
Node<E> node(int index) {
    // assert isElementIndex(index);
    
    if (index < (size >> 1)) {
        Node<E> x = first;
        for (int i = 0; i < index; i++)
            x = x.next;
        return x;
    } else {
        Node<E> x = last;
        for (int i = size - 1; i > index; i--)
            x = x.prev;
        return x;
    }
}

以上是一些辅助方法,在LinkedList的add,get,remove等方法中都会使用到相应的方法。函数

LinkedList中的contains(Object o);

public boolean contains(Object o) {
    return indexOf(o) != -1;
}

public int indexOf(Object o) {
    int index = 0;
    if (o == null) {
        for (Node<E> x = first; x != null; x = x.next) {
            if (x.item == null)
                return index;
            index++;
        }
    } else {
        for (Node<E> x = first; x != null; x = x.next) {
            if (o.equals(x.item))
                return index;
            index++;
        }
    }
    return -1;
}

indexOf(Object o)方法中分两种状况,源码分析

  1. 首先判断传入的参数 o 是否是空,测试

    1. 为空:for循环进行查找,找第一个节点的item的值==null的,找到返回对应的下标,没有则返回-1
    2. 不为空,for循环进行查找,找第一个节点的item的值与o相等的,找到返回对应的下标,没有返回-1;

我的认为看懂了上面的方法,其余的方法都简单明了。优化

LinkedList和ArrayList的区别

  • 顺序插入的速度ArrayList会快些,LinkedList的速度会稍慢一些。由于ArrayList只是在指定的位置上赋值便可,而LinkedList则须要建立Node对象,而且须要创建先后关联,若是对象比较大的话,速度会稍微慢一些
  • LinkedList占用的内存空间要大一些
  • 数组遍历的方式ArrayList推荐使用for循环,而LinkedList则推荐使用foreach,若是使用for循环,效率将会很慢。下面有测试代码
  • LinkedList作插入、删除的时候,慢在寻址,快在只须要改变先后Entrty的引用地址;ArrayList作插入、删除的时候,慢在数组元素的批量copy,快在寻址。

因此,若是待插入、删除的元素是在数据结构的前半段,尤为是很是靠前的位置的时候,LinkedList的效率将大大快过ArrayList,由于ArrayList将批量copy大量的元素;越日后,对于LinkedList来讲,由于它是双向链表,因此在第2个元素后面和在倒数第2个元素后面插入一个元素在效率上基本没有差异,可是ArrayList因为copy的元素愈来愈少,操做速度确定会愈来愈快this

为何不建议使用for循环迭代LinkedList

测试:spa

步骤:一、分别建立一个LinkedList和一个ArrayList;
    二、分别插入100000条数据
    三、分别使用for,foreach。iterator遍历,记录所用时间
LinkedList<String> linkedList = new LinkedList<String>();

ArrayList<String> arrayList = new ArrayList<String>();

for(int i = 0; i < 100000; i ++) {
    linkedList.add("linkedList -- " + i);
    arrayList.add("arrayList -- " + i);
}

// ------------------------foreach-----------------------
long befor = System.currentTimeMillis();
for(String ii : arrayList){
}
long after = System.currentTimeMillis();
System.out.println("Arraylist使用foreach遍历的时间是:"+(after-befor)+"ms");

befor = System.currentTimeMillis();
for(String ii : linkedList){
}
after = System.currentTimeMillis();
System.out.println("Linkedlist使用foreach遍历的时间:"+(after-befor)+"ms");
// ------------------------Iterator-----------------------
Iterator<String> arrayListIterator = arrayList.iterator();
befor = System.currentTimeMillis();
while(arrayListIterator.hasNext()) {
    arrayListIterator.next();
}
after = System.currentTimeMillis();
System.out.println("Arraylist使用Iterator遍历的时间是:"+(after-befor)+"ms");


Iterator<String> linkedListIterator = arrayList.iterator();
befor = System.currentTimeMillis();
while(linkedListIterator.hasNext()) {
    linkedListIterator.next();
}
after = System.currentTimeMillis();
System.out.println("Linkedlist使用Iterator遍历的时间是:"+(after-befor)+"ms");
// -------------------------for----------------------------

befor = System.currentTimeMillis();
for (int i = 0; i < arrayList.size(); i++) {
    arrayList.get(i);
}
after = System.currentTimeMillis();
System.out.println("Arraylist使用for遍历的时间是:"+(after-befor)+"ms");



befor = System.currentTimeMillis();
for (int i = 0; i < linkedList.size(); i++) {
    linkedList.get(i);
}
after = System.currentTimeMillis();
System.out.println("Linkedlist使用for遍历的时间是:"+(after-befor)+"ms");


// 第1次运行结果
/**
  * Arraylist使用foreach遍历的时间是:7ms
  *  Linkedlist使用foreach遍历的时间:10ms
  * Arraylist使用Iterator遍历的时间是:2ms
  * Linkedlist使用Iterator遍历的时间是:1ms
  * Arraylist使用for遍历的时间是:0ms
  * Linkedlist使用for遍历的时间是:35070ms
  */
// 第2次运行结果
/**
  * Arraylist使用foreach遍历的时间是:2ms
  *  Linkedlist使用foreach遍历的时间:4ms
  * Arraylist使用Iterator遍历的时间是:1ms
  * Linkedlist使用Iterator遍历的时间是:1ms
  * Arraylist使用for遍历的时间是:0ms
  * Linkedlist使用for遍历的时间是:37262ms
  */

10万条记录。能够看出,不论是foreach仍是Iterator,速度都差异不大,可是对于for循环时,linkedList的for循环遍历的时间很长指针

缘由分析

LinkedList的get();

public E get(int index) {
    checkElementIndex(index);
    return node(index).item;
}
Node<E> node(int index) {
    // assert isElementIndex(index);

    if (index < (size >> 1)) {
        Node<E> x = first;
        for (int i = 0; i < index; i++)
            x = x.next;
        return x;
    } else {
        Node<E> x = last;
        for (int i = size - 1; i > index; i--)
            x = x.prev;
        return x;
    }
}

因为LinkedList是双链表,因此经过index去获取的时候回判断index是在前半段仍是后半段,前半段正序遍历,后半段倒序遍历,这也是Linked优化的部分。那么为何使用不一样的for循环遍历LinkedList会很慢呢?
例:

  • get(0):直接拿到Node(0)的地址,获取里面的数据
  • get(1):先拿到Node(0)的地址,在从Node(0)中获取到Node(1)的地址,在拿到Node(1)的数据
  • get(2):先拿到Node(0)的地址,在从Node(0)中获取Node(1)的地址,在从Node(1)中获取Node(2)的地址,在获取到Node(2)的数据

以此类推,也就是说,LinkedList在get任何数据的时候,会把前面的数据走一遍,随着LinkedList的容量愈来愈大,时间的消耗就会愈来愈长 因此说建议使用迭代器或者foreach循环去遍历LinkedList,这种方式是直接按照地址去找数据的,将大大提高遍历LinkedList的效率。

相关文章
相关标签/搜索