这是 2020 年的第一篇文章! 今天,你学习了吗?html
ArrayList 是最经常使用的 List 实现类,今天咱们从源码角度来分析一下这个类。java
首先,咱们来看一下 ArrayList 的继承关系,这是一个 UML 图:git
对于 ArrayList,咱们一般是这样使用的:面试
List<Object> list = new ArrayList<>();
复制代码
下面咱们简单看一下接口概要:数组
public class ArrayList<E> extends AbstractList<E> implements List<E>, RandomAccess, Cloneable, java.io.Serializable {
// ...
}
复制代码
ArrayList 继承了 AbstractList 这个抽象类,实现了 List,RandomAccess,Cloneable 和序列化接口。安全
这里须要注意一下 RandomAccess 接口,这个接口没有任何方法,实现这个接口即意味着支持快速随机访问(下标访问)。快速随机访问速度 > 迭代器遍历速度。多线程
快速随机访问的速度是固定的,好比 ArrayList 的 set(i, e), get(i) 等方法,其时间复杂度都是 O(1)dom
查看 ArrayList 源码,咱们看到它主要有以下一些属性,关于这些属性的描述都标注下面了:ide
// 默认初始化容量
private static final int DEFAULT_CAPACITY = 10;
// 用于空实例的共享空数组实例
private static final Object[] EMPTY_ELEMENTDATA = {};
// 用于默认大小空实例的共享空数组实例,与 EMPTY_ELEMENTDATA 的区别在于前者知道当第一个元素插入时该如何扩充数组
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
// 存储这个 ArrayList 元素的数组。ArrayList 的容量就是这个数组的长度。任何空 ArrayList,若是其 elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA,则当添加第一个元素时,ArrayList 会扩容到 DEFAULT_CAPACITY 大小。
transient Object[] elementData;
// ArrayList 的大小,指元素的个数
private int size;
// 数组可分配的最大大小
// 某些虚拟机在一个数组里保留了一些标题字。尝试分配更大的数组可能会致使 OutOfMemoryError
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
复制代码
从基本属性能够看出, ArrayList 的底层是基于数组的!post
即 Object[] elementData
这个属性
这里须要注意一点:
平时使用 ArrayList,我我的习惯这样构造:
List<Integer> list = new ArrayList<>();
复制代码
实际上,ArrayList 有三个构造器:默认构造器、带初始化容量参数的构造器、带集合参数的构造器
默认构造器
// 使用默认容量 10 构造一个空的 List
public ArrayList() {
// 这里能够看到使用了属性 DEFAULTCAPACITY_EMPTY_ELEMENTDATA
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
复制代码
带初始化容量的构造器
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
// 构建指定容量的数组
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
// 使用 EMPTY_ELEMENTDATA
this.elementData = EMPTY_ELEMENTDATA;
} else {
// 负数,抛出 IllegalArgumentException
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
}
}
复制代码
带集合参数的构造器
// 构造一个包含指定集合元素的 list,元素顺序按照集合的迭代器返回的顺序
public ArrayList(Collection<? extends E> c) {
elementData = c.toArray();
if ((size = elementData.length) != 0) {
// c.toArray might (incorrectly) not return Object[] (see 6260652)
if (elementData.getClass() != Object[].class)
elementData = Arrays.copyOf(elementData, size, Object[].class);
} else {
// replace with empty array.
this.elementData = EMPTY_ELEMENTDATA;
}
}
复制代码
EMPTY_ELEMENTDATA 与 DEFAULT_EMPTY_ELEMENTDATA
二者的区别在于,使用前者时,当添加第一个元素时,elementData.length = 1;而当使用后者时,会调用 ensureCapacityInternal 方法,使 elmentData.length = DEFAULT_CAPACITY = 10
注意,扩容发生在实际插入元素的时候!使用前两个构造器,elementData 仍是空数组。
下面重点总结一下 ArrayList 的扩容机制。
我的理解是,当初始化 ArrayList 时,JVM 并不知道程序会存多少数据进去,而数组又必须在初始化时就声明其容量,这样就形成一个问题,最迟在第一个元素插入时,必须指定数组容量大小、初始化数组以容纳元素。(ArrayList 实际上也正是这么作的!)
那么,程序怎么知道你到底须要多大的容量呢?1 仍是 100w ?
最好的办法是能够动态扩容!
ArrayList 就实现了这个扩容功能,咱们能够调用方法主动扩容,也可让 ArrayList 本身扩容。下面来说一下 ArrayList 的扩容具体是怎么实现的。这个讲解主要是针对源码的分析。
ArrayList 的扩容是由下面这段代码实现的,我已经加上了注释:
// 扩容 ArrayList 实例,使其至少能放下 minCapacity 个元素
public void ensureCapacity(int minCapacity) {
int minExpand = (elementData != DEFAULTCAPACITY_EMPTY_ELEMENTDATA)
// any size if not default element table
? 0
// larger than default for default empty table. It's already
// supposed to be at default size.
: DEFAULT_CAPACITY;
if (minCapacity > minExpand) {
ensureExplicitCapacity(minCapacity);
}
}
private static int calculateCapacity(Object[] elementData, int minCapacity) {
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
return Math.max(DEFAULT_CAPACITY, minCapacity);
}
return minCapacity;
}
private void ensureCapacityInternal(int minCapacity) {
ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}
// 确保明确的容量
private void ensureExplicitCapacity(int minCapacity) {
modCount++; // 注意,这里递增了 modCount
// overflow-conscious code
if (minCapacity - elementData.length > 0)
grow(minCapacity); // 正式扩容
}
// 扩容,以确保该 elementData 数组的大小至少能容纳 minCapacity 个元素
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1); // 即扩容到 1.5 倍,等价于 n = o + o/2
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}
// 能够扩容的最大容量,当想要扩容的容量大于 MAX_ARRAY_SIZE 时调用
private static int hugeCapacity(int minCapacity) {
if (minCapacity < 0) // overflow
throw new OutOfMemoryError();
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}
复制代码
能够看到,实际扩容方法是:grow(int minCapacity)。最关键的一行代码是:
int newCapacity = oldCapacity + (oldCapacity >> 1); // 等价于 n = o + o/2
复制代码
这里使用位运算,它的速度很是快!
总结,ArrayList 的扩容是每次扩容到原大小的 1.5 倍。
那么,什么时候进行扩容呢?
从 public void ensureCapacity(int minCapacity)
能够看出,咱们能够主动调用该方法进行扩容。
此外,在调用 add/addAll 等添加元素的方法时,ArrayList 也会调用内部扩容方法(ensureCapacityInternal
)来主动扩容。以 add 方法为例:
// 追加元素 e 到 list 的末尾
public boolean add(E e) {
ensureCapacityInternal(size + 1); // 咱们主要,ensureCapacityInternal 这个方法会调用 ensureExplicitCapacity 这个方法,后者中一行代码 modCount++
elementData[size++] = e;
return true;
}
复制代码
在上面的扩容方法,以及后面会提到的 add 等方法中,都利用了数组的底层方法。毕竟 ArrayList 是基于数组的嘛!下面咱们来看一下这个数组的底层方法具体是什么意思?
咱们在 ArrayList 的源码中能够看到出现了两个有关数组复制操做的方法,一个是 Arrays 类中的 Arrays.copyOf 方法,一个是 System.arraycopy 方法,观察源码,前者是基于后者的:
// 复制指定的数组,截断或填充 null 值使其达到指定长度
// 返回值与 original 数组具备相同的值
public static <T,U> T[] copyOf(U[] original, int newLength, Class<? extends T[]> newType) {
@SuppressWarnings("unchecked")
T[] copy = ((Object)newType == (Object)Object[].class)
? (T[]) new Object[newLength]
: (T[]) Array.newInstance(newType.getComponentType(), newLength);
// 调用了 System 类的 arraycopy 方法
System.arraycopy(original, 0, copy, 0,
Math.min(original.length, newLength));
return copy;
}
复制代码
public static native void arraycopy(Object src, int srcPos, Object dest, int destPos, int length);
复制代码
详细解释一下:
看敖冰冰的文章,里面提到了这样一个问题:使用 public ArrayList(int initialCapacity)
这个构造器构建 ArrayList 时,什么时候初始化数组?
经过源码能够看到,在构造器被调用时,就初始化了数组 !
this.elementData = new Object[initialCapacity];
复制代码
可是,咱们须要注意了!这个时候还不能调用 list.get(i) 和 set(i, e) 方法。
嗯?嗯?嗯?!!
缘由很简单,list 的 size 此时仍是 0 !
而 ArrayList 添加元素、获取元素的操做都会对数组的边界值(index 和 size 的关系)进行检查。
好比 get(i) 方法:
public E get(int index) {
rangeCheck(index);
return elementData(index);
}
复制代码
rangCheck 方法会检查 index 和 size 之间的关系,若是 index >= size,就会抛出异常:
private void rangeCheck(int index) {
if (index >= size)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}
复制代码
好比:
public static void main(String[] args) {
List<Integer> list = new ArrayList<>(10);
Integer a = list.get(0);
System.out.println(a);
}
复制代码
运行这段代码,会报如下异常:
Exception in thread "main" java.lang.IndexOutOfBoundsException: Index: 0, Size: 0
at java.util.ArrayList.rangeCheck(ArrayList.java:657)
at java.util.ArrayList.get(ArrayList.java:433)
at com.aegis.MapTest.main(MapTest.java:13)
复制代码
下面咱们来总结一下 ArrayList 里的经常使用方法:
下面是 ArrayList 源码中 public 方法的总结,目前不涉及 JDK 8 相关部分。
void trimToSize()
public void trimToSize() {
modCount++;
if (size < elementData.length) {
elementData = (size == 0)
? EMPTY_ELEMENTDATA
: Arrays.copyOf(elementData, size);
}
}
复制代码
int size()
public int size() {
return size;
}
复制代码
boolean isEmpty()
public boolean isEmpty() {
return size == 0;
}
复制代码
boolean contains(Object o)
public boolean contains(Object o) {
return indexOf(o) >= 0;
}
复制代码
int indexOf(Object o)
public int indexOf(Object o) {
if (o == null) {
for (int i = 0; i < size; i++)
if (elementData[i]==null)
return i;
} else {
for (int i = 0; i < size; i++)
if (o.equals(elementData[i]))
return i;
}
return -1;
}
复制代码
int lastIndexOf(Object o)
public int lastIndexOf(Object o) {
if (o == null) {
for (int i = size-1; i >= 0; i--)
if (elementData[i]==null)
return i;
} else {
for (int i = size-1; i >= 0; i--)
if (o.equals(elementData[i]))
return i;
}
return -1;
}
复制代码
Object clone()
public Object clone() {
try {
ArrayList<?> v = (ArrayList<?>) super.clone();
v.elementData = Arrays.copyOf(elementData, size);
v.modCount = 0;
return v;
} catch (CloneNotSupportedException e) {
// 这是不该该发生的,由于 ArrayList 实现了 Clone 接口,即 Cloneable 的
throw new InternalError(e);
}
}
复制代码
public void clear()
public void clear() {
modCount++;
// clear to let GC do its work
for (int i = 0; i < size; i++)
elementData[i] = null;
size = 0;
}
复制代码
Object[] toArray()
public Object[] toArray() {
return Arrays.copyOf(elementData, size);
}
复制代码
T[] toArray(T[] a)
public <T> T[] toArray(T[] a) {
if (a.length < size)
// Make a new array of a's runtime type, but my contents:
return (T[]) Arrays.copyOf(elementData, size, a.getClass());
System.arraycopy(elementData, 0, a, 0, size);
if (a.length > size)
a[size] = null;
return a;
}
复制代码
E get(int index)
public E get(int index) {
// 范围检查,若是 index 超出 list 大小,就抛出 IndexOutOfBoundsException
rangeCheck(index);
return elementData(index);
}
复制代码
E set(int index, E element)
public E set(int index, E element) {
// 检查边界
rangeCheck(index);
// 旧的元素
E oldValue = elementData(index);
// 设置 index 处为新元素 element
elementData[index] = element;
return oldValue;
}
复制代码
boolean add(E e)
public boolean add(E e) {
// 检查容量 - 便是否须要扩容
ensureCapacityInternal(size + 1); // Increments modCount!!
// 将 size 位置设为
elementData[size++] = e;
return true;
}
复制代码
void add(int index, E element)
public void add(int index, E element) {
// 检查边界
rangeCheckForAdd(index);
// 检查容量 - 如须要则扩容
ensureCapacityInternal(size + 1); // Increments modCount!!
// 将数组中 index 位置开始的数据,拷贝到 index+1 到 size 位置
System.arraycopy(elementData, index, elementData, index + 1,
size - index);
// 将 index 位置设为新元素
elementData[index] = element;
size++;
}
复制代码
E remove(int index)
public E remove(int index) {
// 检查边界
rangeCheck(index);
// 修改 modCount,以便 fail-fast 机制生效
modCount++;
// 获取 index 位置的元素 -- 即要被删除的元素
E oldValue = elementData(index);
int numMoved = size - index - 1;
if (numMoved > 0)
// 向左移动元素
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
// 将原先的最后一位设为 null
elementData[--size] = null; // clear to let GC do its work
return oldValue;
}
复制代码
boolean remove(Object o)
public boolean remove(Object o) {
if (o == null) {
// 要删除的对象为 null,则寻找第一个 null 值
for (int index = 0; index < size; index++)
if (elementData[index] == null) {
// 调用 fastRemove
fastRemove(index);
return true;
}
} else {
//
for (int index = 0; index < size; index++)
if (o.equals(elementData[index])) {
fastRemove(index);
return true;
}
}
return false;
}
复制代码
boolean addAll(Collection<? extends E> c)
public boolean addAll(Collection<? extends E> c) {
// 集合转数组
Object[] a = c.toArray();
int numNew = a.length;
// 确保容量
ensureCapacityInternal(size + numNew); // Increments modCount
// 从数组拷贝元素到 list 中
System.arraycopy(a, 0, elementData, size, numNew);
size += numNew;
return numNew != 0;
}
复制代码
boolean addAll(int index, Collection<? extends E> c)
public boolean addAll(int index, Collection<? extends E> c) {
// 边界值检查
rangeCheckForAdd(index);
// 要插入的元素和数量
Object[] a = c.toArray();
int numNew = a.length;
ensureCapacityInternal(size + numNew); // Increments modCount
int numMoved = size - index;
if (numMoved > 0)
// 首先,后移以前的元素
System.arraycopy(elementData, index, elementData, index + numNew,
numMoved);
// 而后插入新元素
System.arraycopy(a, 0, elementData, index, numNew);
size += numNew;
return numNew != 0;
}
复制代码
boolean removeAll(Collection<?> c)
public boolean removeAll(Collection<?> c) {
Objects.requireNonNull(c);
return batchRemove(c, false);
}
复制代码
boolean retainAll(Collection<?> c)
public boolean retainAll(Collection<?> c) {
Objects.requireNonNull(c);
return batchRemove(c, true);
}
复制代码
List 返回的迭代器是 ListIterator 接口,比默认的 Iterator,多出了 hasPrevious 和 previous 方法。
ArrayList 中有两个 ListIterator 的实现类:ListItr 和 Itr。区别就是前者具备修改元素的 set 和 add 方法
listIterator
public ListIterator<E> listIterator(int index) {
if (index < 0 || index > size)
throw new IndexOutOfBoundsException("Index: "+index);
return new ListItr(index);
}
复制代码
public ListIterator<E> listIterator() {
return new ListItr(0);
}
复制代码
iterator
public Iterator<E> iterator() {
return new Itr();
}
复制代码
ListItr 和 Itr 内部类
public List<E> subList(int fromIndex, int toIndex) {
subListRangeCheck(fromIndex, toIndex, size);
return new SubList(this, 0, fromIndex, toIndex);
}
复制代码
基于数组,元素有序,支持快速随机访问,即下标访问。
实现了动态扩容机制,每次扩容会增大到 1.5 倍
元素能够为 null
线程不安全。在多线程状况下,请使用 Collections.synchronizedList 方法把 ArrayList 包装为线程安全版本,或直接使用古老的 Vector
参考资料:
Java 集合深刻理解之 AbstractList —— CSDN 拭心
Java 集合深刻理解之 ArrayList —— CSDN 拭心
ArrayList 详细介绍 —— skywang12345
写在后面
这篇文章写了快一个星期了,看了源码,看了几位知名博主的文章,在想要多讲一点东西的基础上又想要简练一点,直到今天(2020年大年初二)凌晨才把主要内容写完。 认真写一篇文章真的太难了。下面的 HashMap,会更难!哈哈哈敬请期待啦!
最近传染病很严重,但愿你们都能安心待在家,注意安全!祝你们新年快乐!家家平安! 也但愿咱们能趁着这几天看看书,学学习,2020年的经济形势恐怕会比较严峻,就业也是如此!
一块儿加油吧!
-- 写于 2020.01.26 12:54