面经分享：如何破解 Java 集合类面试题

时间 2019-12-08

标签分享如何破解 java 集合面试栏目 Java 繁體版

原文原文链接

今日招式：Java集合类面试题

Java集合类绝对是咱们的老朋友了，Java技术江湖里，谁人不知，谁人不晓，它的使用率很是高，使用难度却也不大，这也致使了不少人对它不屑一顾，却不知其中却暗藏玄机，今天咱们不妨一块儿来破解一下Java集合类的面试题。面试

面试官经常使用招式：

只见面试官微微一笑，拔出长剑，向你刺来，你赶忙拔剑相迎，几招事后，你才意识到面试官使的都是虚招，只是试探你而已。算法

1.Java集合框架的基础接口有哪些？

Collection为集合层级的根接口。一个集合表明一组对象，这些对象即为它的元素。Java平台不提供这个接口任何直接的实现。
Set是一个不能包含重复元素的集合。这个接口对数学集合抽象进行建模，被用来表明集合，就如一副牌。
List是一个有序集合，能够包含重复元素。你能够经过它的索引来访问任何元素。List更像长度动态变换的数组。
Map是一个将key映射到value的对象.一个Map不能包含重复的key：每一个key最多只能映射一个value。
一些其它的接口有Queue、Dequeue、SortedSet、SortedMap和ListIterator。复制代码

2.Iterater和ListIterator之间有什么区别？

（1）咱们可使用Iterator来遍历Set和List集合，而ListIterator只能遍历List。数据库

（2）Iterator只能够向前遍历，而LIstIterator能够双向遍历。api

（3）ListIterator从Iterator接口继承，而后添加了一些额外的功能，好比添加一个元素、替换一个元素、获取前面或后面元素的索引位置。数组

3.遍历一个List有哪些不一样的方式？

List<String> strList = new ArrayList<>();for(String obj : strList){   System.out.println(obj); }
Iterator<String> it = strList.iterator(); while(it.hasNext()){   String obj = it.next();   System.out.println(obj); }复制代码

使用迭代器更加线程安全，由于它能够确保，在当前遍历的集合元素被更改的时候，它会抛出ConcurrentModificationException。缓存

4.在Java中，HashMap是如何工做的？

HashMap在Map.Entry静态内部类实现中存储key-value对。HashMap使用哈希算法，在put和get方法中，它使用hashCode()和equals()方法。当咱们经过传递key-value对调用put方法的时候，HashMap使用Key hashCode()和哈希算法来找出存储key-value对的索引。Entry存储在LinkedList中，因此若是存在entry，它使用equals()方法来检查传递的key是否已经存在，若是存在，它会覆盖value，若是不存在，它会建立一个新的entry而后保存。当咱们经过传递key调用get方法时，它再次使用hashCode()来找到数组中的索引，而后使用equals()方法找出正确的Entry，而后返回它的值。下面的图片解释了详细内容。
其它关于HashMap比较重要的问题是容量、负荷系数和阀值调整。HashMap默认的初始容量是32，负荷系数是0.75。阀值是为负荷系数乘以容量，不管什么时候咱们尝试添加一个entry，若是map的大小比阀值大的时候，HashMap会对map的内容进行从新哈希，且使用更大的容量。容量老是2的幂，因此若是你知道你须要存储大量的key-value对，好比缓存从数据库里面拉取的数据，使用正确的容量和负荷系数对HashMap进行初始化是个不错的作法。复制代码

5.hashCode()和equals()方法有何重要性？

HashMap使用Key对象的hashCode()和equals()方法去决定key-value对的索引。当咱们试着从HashMap中获取值的时候，这些方法也会被用到。若是这些方法没有被正确地实现，在这种状况下，两个不一样Key也许会产生相同的hashCode()和equals()输出，HashMap将会认为它们是相同的，而后覆盖它们，而非把它们存储到不一样的地方。一样的，全部不容许存储重复数据的集合类都使用hashCode()和equals()去查找重复，因此正确实现它们很是重要。equals()和hashCode()的实现应该遵循如下规则：复制代码

（1）若是o1.equals(o2)，那么o1.hashCode() == o2.hashCode()老是为true的。安全

（2）若是o1.hashCode() == o2.hashCode()，并不意味着o1.equals(o2)会为true。性能优化

6.咱们可否使用任何类做为Map的key？

咱们可使用任何类做为Map的key，然而在使用它们以前，须要考虑如下几点：复制代码

（1）若是类重写了equals()方法，它也应该重写hashCode()方法。bash

（2）类的全部实例须要遵循与equals()和hashCode()相关的规则。请参考以前提到的这些规则。数据结构

（3）若是一个类没有使用equals()，你不该该在hashCode()中使用它。

（4）用户自定义key类的最佳实践是使之为不可变的，这样，hashCode()值能够被缓存起来，拥有更好的性能。不可变的类也能够确保hashCode()和equals()在将来不会改变，这样就会解决与可变相关的问题了。

好比，我有一个类MyKey，在HashMap中使用它。
//传递给MyKey的name参数被用于equals()和hashCode()中 MyKey key = new MyKey('Pankaj'); //assume hashCode=1234 myHashMap.put(key, 'Value'); // 如下的代码会改变key的hashCode()和equals()值 key.setName('Amit'); //assume new hashCode=7890 //下面会返回null，由于HashMap会尝试查找存储一样索引的key，而key已被改变了，匹配失败，返回null myHashMap.get(new MyKey('Pankaj'));
那就是为什么String和Integer被做为HashMap的key大量使用。复制代码

7.HashMap和HashTable有何不一样？

（1）HashMap容许key和value为null，而HashTable不容许。

（2）HashTable是同步的，而HashMap不是。因此HashMap适合单线程环境，HashTable适合多线程环境。

（3）在Java1.4中引入了LinkedHashMap，HashMap的一个子类，假如你想要遍历顺序，你很容易从HashMap转向LinkedHashMap，可是HashTable不是这样的，它的顺序是不可预知的。

（4）HashMap提供对key的Set进行遍历，所以它是fail-fast的，但HashTable提供对key的Enumeration进行遍历，它不支持fail-fast。

（5）HashTable被认为是个遗留的类，若是你寻求在迭代的时候修改Map，你应该使用CocurrentHashMap。

8.ArrayList和Vector有何异同点？

ArrayList和Vector在不少时候都很相似。复制代码

（1）二者都是基于索引的，内部由一个数组支持。

（2）二者维护插入的顺序，咱们能够根据插入顺序来获取元素。

（3）ArrayList和Vector的迭代器实现都是fail-fast的。

（4）ArrayList和Vector二者容许null值，也可使用索引值对元素进行随机访问。

如下是ArrayList和Vector的不一样点。复制代码

（1）Vector是同步的，而ArrayList不是。然而，若是你寻求在迭代的时候对列表进行改变，你应该使用CopyOnWriteArrayList。

（2）ArrayList比Vector快，它由于有同步，不会过载。

（3）ArrayList更加通用，由于咱们可使用Collections工具类轻易地获取同步列表和只读列表。

9.Array和ArrayList有何区别？何时更适合用Array？

Array能够容纳基本类型和对象，而ArrayList只能容纳对象。
Array是指定大小的，而ArrayList大小是固定的。
Array没有提供ArrayList那么多功能，好比addAll、removeAll和iterator等。尽管ArrayList明显是更好的选择，但也有些时候Array比较好用。复制代码

（1）若是列表的大小已经指定，大部分状况下是存储和遍历它们。

（2）对于遍历基本数据类型，尽管Collections使用自动装箱来减轻编码任务，在指定大小的基本类型的列表上工做也会变得很慢。

（3）若是你要使用多维数组，使用[][]比List>更容易。

10.ArrayList和LinkedList有何区别？

ArrayList和LinkedList二者都实现了List接口，可是它们之间有些不一样。复制代码

（1）ArrayList是由Array所支持的基于一个索引的数据结构，因此它提供对元素的随机访问，复杂度为O(1)，但LinkedList存储一系列的节点数据，每一个节点都与前一个和下一个节点相链接。因此，尽管有使用索引获取元素的方法，内部实现是从起始点开始遍历，遍历到索引的节点而后返回元素，时间复杂度为O(n)，比ArrayList要慢。

（2）与ArrayList相比，在LinkedList中插入、添加和删除一个元素会更快，由于在一个元素被插入到中间的时候，不会涉及改变数组的大小，或更新索引。

（3）LinkedList比ArrayList消耗更多的内存，由于LinkedList中的每一个节点存储了先后节点的引用。

11.哪些集合类是线程安全的？

Vector、HashTable、Properties和Stack是同步类，因此它们是线程安全的，能够在多线程环境下使用。Java1.5并发API包括一些集合类，容许迭代时修改，由于它们都工做在集合的克隆上，因此它们在多线程环境中是安全的。复制代码

12.Collections类是什么？

Java.util.Collections是一个工具类仅包含静态方法，它们操做或返回集合。它包含操做集合的多态算法，返回一个由指定集合支持的新集合和其它一些内容。这个类包含集合框架算法的方法，好比折半搜索、排序、混编和逆序等。复制代码

13.Comparable和Comparator接口有何区别？

Comparable和Comparator接口被用来对对象集合或者数组进行排序。Comparable接口被用来提供对象的天然排序，咱们可使用它来提供基于单个逻辑的排序。
Comparator接口被用来提供不一样的排序算法，咱们能够选择须要使用的Comparator来对给定的对象集合进行排序。复制代码

14.咱们如何对一组对象进行排序？

若是咱们须要对一个对象数组进行排序，咱们可使用Arrays.sort()方法。若是咱们须要排序一个对象列表，咱们可使用Collection.sort()方法。两个类都有用于天然排序（使用Comparable）或基于标准的排序（使用Comparator）的重载方法sort()。Collections内部使用数组排序方法，全部它们二者都有相同的性能，只是Collections须要花时间将列表转换为数组。复制代码

高手过招

面试官见你应对自如，知道你也不是等闲之辈，因而眼神也变得专一起来，因而大家双双跃起，在空中展开厮斗，虽然面试官每一招都很是到位，可是你依然能够与之抗衡。

一、HashMap为何不直接使用hashCode()处理后的哈希值直接做为table的下标？

HashMap本身实现了本身的hash()方法，经过两次扰动使得它本身的哈希值高低位自行进行异或运算，下降哈希碰撞几率也使得数据分布更平均；

在保证数组长度为2的幂次方的时候，使用hash()运算以后的值与运算（&）（数组长度 - 1）来获取数组下标的方式进行存储，这样一来是比取余操做更加有效率，二来也是由于只有当数组长度为2的幂次方时，h&(length-1)才等价于h%length，三来解决了“哈希值与数组大小范围不匹配”的问题；

二、为何数组长度要保证为2的幂次方呢？

只有当数组长度为2的幂次方时，h&(length-1)才等价于h%length，即实现了key的定位，2的幂次方也能够减小冲突次数，提升HashMap的查询效率；

若是 length 为 2 的次幂则 length-1 转化为二进制一定是 11111……的形式，在于 h 的二进制与操做效率会很是的快，并且空间不浪费；若是 length 不是 2 的次幂，好比 length 为 15，则 length - 1 为 14，对应的二进制为 1110，在于 h 与操做，最后一位都为 0 ，而 0001，0011，0101，1001，1011，0111，1101 这几个位置永远都不能存放元素了，空间浪费至关大，更糟的是这种状况中，数组可使用的位置比数组长度小了不少，这意味着进一步增长了碰撞的概率，减慢了查询的效率！这样就会形成空间的浪费。

三、HashMap的put方法的具体流程？

四、ConcurrentHashMap的具体实现知道吗？

答：在JDK1.7中，ConcurrentHashMap采用Segment + HashEntry的方式进行实现，结构以下：

该类包含两个静态内部类 HashEntry 和 Segment ；前者用来封装映射表的键值对，后者用来充当锁的角色； Segment 是一种可重入的锁 ReentrantLock，每一个 Segment 守护一个HashEntry 数组里得元素，当对 HashEntry 数组的数据进行修改时，必须首先得到对应的 Segment 锁。

在JDK1.8中，放弃了Segment臃肿的设计，取而代之的是采用Node + CAS + Synchronized来保证并发安全进行实现，结构以下：

插入元素过程（建议去看看源码）：

若是相应位置的Node尚未初始化，则调用CAS插入相应的数据；

else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {    if (casTabAt(tab, i, null, new Node<K,V>(hash, key, value, null)))        break;                   // no lock when adding to empty bin}复制代码

若是相应位置的Node不为空，且当前该节点不处于移动状态，则对该节点加synchronized锁，若是该节点的hash不小于0，则遍历链表更新节点或插入新节点；

if (fh >= 0) {    binCount = 1;    for (Node<K,V> e = f;; ++binCount) {        K ek;        if (e.hash == hash &&            ((ek = e.key) == key ||             (ek != null && key.equals(ek)))) {            oldVal = e.val;            if (!onlyIfAbsent)                e.val = value;            break;        }        Node<K,V> pred = e;        if ((e = e.next) == null) {            pred.next = new Node<K,V>(hash, key, value, null);            break;        }    }}复制代码

若是该节点是TreeBin类型的节点，说明是红黑树结构，则经过putTreeVal方法往红黑树中插入节点；若是binCount不为0，说明put操做对数据产生了影响，若是当前链表的个数达到8个，则经过treeifyBin方法转化为红黑树，若是oldVal不为空，说明是一次更新操做，没有对元素个数产生影响，则直接返回旧值；若是插入的是一个新节点，则执行addCount()方法尝试更新元素个数baseCount；

五、HashMap的扩容操做是怎么实现的？

答：经过分析源码咱们知道了HashMap经过resize()方法进行扩容或者初始化的操做，下面是对源码进行的一些简单分析：

/** * 该函数有2中使用状况：1.初始化哈希表；2.当前数组容量太小，须要扩容 */final Node<K,V>[] resize() {    Node<K,V>[] oldTab = table;// 扩容前的数组（当前数组）    int oldCap = (oldTab == null) ? 0 : oldTab.length;// 扩容前的数组容量（数组长度）    int oldThr = threshold;// 扩容前数组的阈值    int newCap, newThr = 0;
    if (oldCap > 0) {        // 针对状况2：若扩容前的数组容量超过最大值，则再也不扩容        if (oldCap >= MAXIMUM_CAPACITY) {            threshold = Integer.MAX_VALUE;            return oldTab;        }        // 针对状况2：若没有超过最大值，就扩容为原来的2倍（左移1位）        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&                oldCap >= DEFAULT_INITIAL_CAPACITY)            newThr = oldThr << 1; // double threshold    }
    // 针对状况1：初始化哈希表（采用指定或者使用默认值的方式）    else if (oldThr > 0) // initial capacity was placed in threshold        newCap = oldThr;    else {               // zero initial threshold signifies using defaults        newCap = DEFAULT_INITIAL_CAPACITY;        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);    }
    // 计算新的resize上限    if (newThr == 0) {        float ft = (float)newCap * loadFactor;        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?                (int)ft : Integer.MAX_VALUE);    }    threshold = newThr;    @SuppressWarnings({"rawtypes","unchecked"})    Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];    table = newTab;    if (oldTab != null) {        // 把每个bucket都移动到新的bucket中去        for (int j = 0; j < oldCap; ++j) {            Node<K,V> e;            if ((e = oldTab[j]) != null) {                oldTab[j] = null;                if (e.next == null)                    newTab[e.hash & (newCap - 1)] = e;                else if (e instanceof TreeNode)                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);                else { // preserve order                    Node<K,V> loHead = null, loTail = null;                    Node<K,V> hiHead = null, hiTail = null;                    Node<K,V> next;                    do {                        next = e.next;                        if ((e.hash & oldCap) == 0) {                            if (loTail == null)                                loHead = e;                            else                                loTail.next = e;                            loTail = e;                        }                        else {                            if (hiTail == null)                                hiHead = e;                            else                                hiTail.next = e;                            hiTail = e;                        }                    } while ((e = next) != null);                    if (loTail != null) {                        loTail.next = null;                        newTab[j] = loHead;                    }                    if (hiTail != null) {                        hiTail.next = null;                        newTab[j + oldCap] = hiHead;                    }                }            }        }    }    return newTab;}复制代码

武学根基

虽然刚刚的打斗确实激烈，招式也十分好看，可是背后隐藏着的武学基础倒是有共同之处的。在本篇里指的即是Java集合类的基础知识点。

其实Java集合类的面试题远不止如此，面试官可能会问你每一个实现细节，因此即便你见过了全部的面试题型，而且都紧紧记住，那又有什么用呢，不能理解其原理，光会表面招式，最后就会被轻易击败。

下面咱们不妨就见招拆招，说Java集合类里的那些基础、门道以及正确掌握这部份内容的方法。

初来乍到

第一次接触集合类，遇到的是ArrayList，当时连<>表明泛型都不知道，让我new一个ArrayList对象都不利索，直到开始了解到它的api，才感受其实这个玩意也并非很复杂呀，不就是put，get等一些看起来就很简单的方法吗。

小试牛刀

抱着这样的想法，我开始在一些项目和练习题中使用ArrayList，用法确实不难，正常状况咱们只须要使用put，get，remove等方法，不过有时候也会遇到一些问题，好比你在用for循环删除ArrayList的元素时，就会发现，若是你按照下标来删除，是会报错的，这就让我很头大了，不理解其实现原理，光会用api，看来仍是不行啊。

渐入佳境

我一直认为，面试是学习的一大动力，当时为了面试大厂，确实也看了不少面试题，集合类是跨不过去的一道坎，而且须要深刻到源码里去理解，好比hashmap的底层原理，绝对是大场面试中最爱考的一道题目，因而我跟着几位大牛的博客（后面有推荐）复习了一整遍hashmap的实现原理，理解了80%左右的内容，这才可以应付大厂的面试题。

学有所成

当你理解了整个hashmap的实现原理以后，你就会发现大部分面试题都难不倒你了。我本身作了一个总结，每当面试官问我“JDK里的hashmap是怎么实现的”我基本上都会用如下内容作回答。

固然，这仅供参考，切不可死记硬背，毕竟这只是我本身理解后整理出来的东西。

hashmap是数组和链表的组合结构，数组是一个Entry数组，entry是k-V键值对类型，因此一个entry数组存着很entry节点，一个entry的位置经过key的hashcode方法，再进行hash（移位等操做），最后与表长-1进行相与操做，其实就是取hash值到的后n - 1位，n表明表长是2的n次方。

hashmap的默认负载因子是0.75，阈值是16 * 0.75 = 12；初始长度为16；

hashmap的增删改查方式比较简单，都是遍历，替换。有一点要注意的是key相等时，替换元素，不相等时连成链表。

除此以外，1.8jdk改进了hashmap，当链表上的元素个数超过8个时自动转化成红黑树，节点变成树节点，以提升搜索效率和插入效率到logn。

还有一点值得一提的是，hashmap的扩容操做，因为hashmap非线程安全，扩容时若是多线程并发进行操做，则可能有两个线程分别操做新表和旧表，致使节点成环，查询时会造成死锁。chm避免了这个问题。

另外，扩容时会将旧表元素移到新表，原来的版本移动时会有rehash操做，每一个节点都要rehash，很是不方便，而1.8改为另外一种方式，对于同一个index下的链表元素，因为一个元素的hash值在扩容后只有两种状况，要么是hash值不变，要么是hash值变为原来值+2^n次方，这是由于表长翻倍，因此hash值取后n位，第一位要么是0要么是1，因此hash值也只有两种状况。这两种状况的元素分别加到两个不一样的链表。这两个链表也只须要分别放到新表的两个位置便可，是否是很酷。

最后有一个比较冷门的知识点，hashmap1.7版本链表使用的是节点的头插法，扩容时转移链表仍然使用头插法，这样的结果就是扩容后链表会倒置，而hashmap.1.8在插入时使用尾插法，扩容时使用头插法，这样能够保证顺序不变。

读者福利

给你们推荐一个架构技术交流群：714827309 ，里面会分享一些资深架构师录制的视频录像：有Spring，MyBatis，Netty源码分析，高并发、高性能、分布式、微服务架构的原理，JVM性能优化这些成为架构师必备的知识体系。还能领取免费的学习资源，相信对于已经工做和遇到技术瓶颈的码友，在这个群里会有你须要的内容。点击连接加入群聊【JAVA高级架构技术交流】：jq.qq.com/?_wv=1027&a…