最近在研读OkHttp源码,发现它的Dispatcher分发器使用了ArrayDeque数据集合,这个集合类是java.util里提供的双端队列/栈,非线程安全,可是性能很好,很是值得研究一下。javascript
咱们先总体推测一下ArrayDeque的设计思路。java
每一种集合类的具体功能,基本上都是增/删/改/查四大项,ArrayDeque也不例外,只不过它更贴近于栈的功能,主要操做栈顶和栈底的数据,对于栈中的数据,只有delete一个函数。数组
Java中通常只有两种基础的数据容器,数组或链表。数组排列紧密、下标查找快、中间插入慢;链表排列稀疏、查找慢,中间插入快。对于栈结构来讲,采用数组更具优点,ArrayDeque也是采用了数组来做为基本数据容器,也须要处理数组扩容问题。安全
不过,传统的数组都是线性数组,向尾部添加数据当然很方便,可是向中间添加数据的话,就须要挪动插入点以后的全部数据,若是向头部添加数据的话,整个数组都要挪一遍,虽然Java提供了Native函数System.arrayCopy来提高效率,可是对内存的操做是不可避免的。bash
为了提升效率,ArrayDeque采用了循环数组的设计,也就是说虽然基础容器是一个普通的数组(默认容量16),可是在逻辑上,这个数组没有固定的开头或结尾,既能够直接向尾部添加数据,也能够直接向头部以前添加数据,不须要大面积地移动数据。
逻辑上的概念大概是这样的:markdown
循环数组在概念上没有左右边界,可是Java并无这样的数组,Java只能提供固定大小的数组,这样的话,如何实现循环数组就转变为如何利用固定数组实现循环数组。
相对于线性数组,循环数组是连续的,可是数组的头和尾可能在任何位置,因此循环数组在真实数据中的映射大概是这样:函数
主要判断头的新位置在左侧仍是右侧。
先看添加:
head的新位置必定是head-1,若是获得的结果为-1,就须要挪到右侧,也就是物理数组中的最后一个位置length-1。
若是让咱们本身来写,多是这样写:工具
if(head-1<0){ head=elements.length -1; }else{ head=head-1; } elements[head]=e; 复制代码
事实上,ArrayDeque使用了更精妙的实现,他用一步位与运算实现了这个功能:性能
elements[head = (head - 1) & (elements.length - 1)] = e;
复制代码
这行代码具体什么意思呢?
当head-1为-1时,其实是11111111&00001111,结果是00001111,也就是物理数组的尾部15;
当head-1为较小的值如3时,其实是00000011&00001111,结果是00000011,仍是3。
当head增加如head+1超过物理数组长度如16时,其实是00010000&00001111,结果是00000000,也就是0,这样就回到了物理数组的头部。
因此,位与运算能够很轻松地实现把数据控制在某个范围内。
回过头来,咱们再看删除头的代码:优化
elements[h] = null; // Must null out slot head = (h + 1) & (elements.length - 1); 复制代码
先清空数据,而后移动head位置,也是用位与运算实现的。
位运算原本就很是高效,ArrayDeque的这种写法,更是用一行代码覆盖了函数中的全部场景,很是精妙。
主要判断尾的新位置在左侧仍是右侧,具体操做和上一步添加/删除头相似。
删除中间元素时,即便是循环数组,也须要批量移动数组元素了,因此删除中间元素实际上面临三个问题,一是须要在左侧或右侧删除,二是须要挪动头或尾,三是优化须要,尽可能少得移动数组元素。
ArrayDeque其实是先从第三个问题入手的,先判断中间元素里head近仍是离tail近,而后移动较近的那一端。
不过,较近的一端只是逻辑上较近,物理数组上,可能被分红了两截,这就须要作两次数组元素的批量移动。
//ArrayDeque源码(部分状况) System.arraycopy(elements, 0, elements, 1, i); elements[0] = elements[mask]; System.arraycopy(elements, h, elements, h + 1, mask - h); 复制代码
若是让咱们本身写,可能也是分条件判断,分别计算两截的数据。
ArrayDeque又使用了位与运算:
return (tail - head) & (elements.length - 1); 复制代码
也是只有一行,当物理上被分为两截时,tail-head会是负数,整个操做至关于取模运算,例如,当tail为3,head为14,物理数组长度16时,运算的就是11110101&00001111,值为00000101,也就是5。
从基本操做上,若是物理上不连续,先复制右侧,再补上左侧。
toArray的问题在于新数组的长度是动态的,为了生成大小恰好的新数组,ArrayDeque使用了Arrays工具类来实现这个特定长度的数组,并同时实现对head一侧数据的复制:
boolean wrap = (tail < head); int end = wrap ? tail + elements.length : tail; Object[] a = Arrays.copyOfRange(elements, head, end); if (wrap) System.arraycopy(elements, 0, a, elements.length - head, tail); 复制代码
这样的话,若是物理空间连续,就直接复制完成;
但若是物理空间不连续,第一次Arrays.copyOfRange须要保证一次性生成足够的物理空间,因此end的值不能是length(不然长度就只有length-head这么长),而应该是tail+length。
数据容器的扩容其实能够分解为两个问题,一是什么时候开始扩容,二是旧数组数据的复制。
对于什么时候开始扩容的问题,为了减小检查的次数,ArrayDeque采用了对head和tail是否重合的检查,只要tail和head不重合,就说明tail后面/head前面还有空间,因此只要在添加头/尾时检查head==tail便可。
对于旧数组数据的复制,空间扩容和问题和toArray有些相似,不一样的是新数组的长度是可知的(2倍),因此能够直接new一个定长的数组,这样就不须要Array.copyOfRange函数,能够统一使用System.arrayCopy:
Object[] a = new Object[newCapacity]; System.arraycopy(elements, p, a, 0, r); System.arraycopy(elements, 0, a, r, p); 复制代码
相比ArrayList,咱们能够看到ArrayDeque大量减小了System.arrayCopy的使用,只在delete、clone、扩容和toArray函数中使用了这个函数,其余操做中都不须要大量移动数组元素,这也能够说明ArrayDeque这个数据集合的性能很是优良。