关于集合中一些常考的知识点总结

本章主要总结了集合的一些基础但有重点的知识点,例如他们的底层数据结构以及集合之间的区别,其中 HashMap 最为重点。面试

集合

Java的集合框架中能够分为两大类:第一类是按照单个元素存储的 Collection 集合,其中 Set, List, Queue 都实现了 Collection 接口。第二类是按照 Key-Value 存储的 Map 集合。数组

List

List常量的两个子类分别是 ArrayList 和 LinkedList 这两个集合。安全

(1)、ArrayList 的特色。数据结构

A. ArrayList 底层数据结构是数组,数组的特色就是能够快速随机访问,直接根据下标定位,缺点是插入和删除速度比较慢,须要移动元素。多线程

B. ArrayList 每次扩容以后的大小为以前的 1.5 倍。默认初始容量大小为 10。框架

(2)、LinkedList 的特色性能

LinkedList 底层数据结构是双向链表,链表的特色就是随机访问速度慢,必须一个一个遍历,不能直接经过下标定位,不过在插入、删除方面速度就比较快。不过因为链表是内存分配不要求连续,内存的利用率比较高。.net

LinkedList 还实现了另一个接口Deque,即 double-ended queue,使得 LinkedList 同时具备队列的特性。线程

(3)、vector 的特色code

vector 和 ArrayList 基本同样,不过 Vector 是线程安全的,而 ArrayList 是线程不安全的,

ArrayList 和 LinkedList 都是线程不安全的集合。

Map

Map 是一种 key-value 的集合,其经常使用的集合实现类有 HashMap, HashTable, TreeMap。

(1)、HashMap(重重点)

HashMap 的底层数据结构是 链表 + 数组,若是对他的底层结构不大懂的能够看我以前写的一篇文章:HashMap的存取原理你知道多少

HashMap 在进行 put 操做时,容许 key 和 value 为 null,且是线程不安全的,因此 HashMap 的性能很是好,只不过在多线程的环境下使用,须要给他加上对应的锁

重点数据:HashMap 的默认容量为 capacity = 16, 默认扩容因子 loadFactor = 0.75,至于扩容因子有什么用,下面会涉及到。

不过须要注意的是,HashMap 内部用变量 threshold 变量来表示 HashMap 中能放入的元素个数,且在 threshold 不超过最大值前提下, threshold = loadFactor * capacity。

也就是说,当元素的个数达到 threshold 以后,就会触发 HashMap 的扩容,而不是达到 capacity 才触发扩容。每次扩容以后的容量为以前的 2 倍

而 ArrayList 则是元素达到 capacity 时才触发扩容。

还有一个须要注意的是,HashMap 容量并不会在 new 的时候分配,而是在第一次 put 的时候才完成建立的。

public V put(K key, V value){
    if(table == EMPTY_TABLE){
        // 初始化
        inflateTable(threshold);
    }
}

默认初始化容量大小 capacity = 16,若是咱们在初始化的时候指定了容量的大小 initialCapacity,则会先计算出比 initialCapacity 大的 2 的幂存入 threshold,而且也会把初始化容量置为 capacity = threshold。例如当咱们指定初始容量 initialCapacity = 26 的话,则 threshold = 32, capacity = 32。

(2)、HashTable的特色

a. HashTable 和 HashMap 在工做原理上几乎同样,不过 HashTable 是线程安全的,如图

不过锁是直接加在方法外面,因此在多线程环境下,性能极差。

不过在多线程的环境下,咱们优先使用 ConcurrentHashMap 集合,这个集合在工做原理上也几乎和前面两个同样,但它是线程安全的,而且不像 HashTable 那样,把整个方法都给加锁了,而是把方法里面的关键代码加锁了,如图:

因此在处理速度上比较快。

b. HashTable 不容许 key 和 value 为 null。

c. HashMap 的迭代器是 fail-fast 机制(快速失败机制), 而 HashTable 则是 fail-safe 机制(快速安全),若是不知道 fail-fast 与 fail-safe 的,能够看我以前写 的一篇文章:谈谈fail-fast与fail-safe

(3)、LinkedHashMap 的特色

LinkedHashMap 是 HashMap 的一个子类,咱们知道 HashMap是在插入的时候是根据哈希码来选择位置的,是无序的,而 LinkedHashMap 在插入的时候具备双向链表的特性,内部使用链表维护了插入的顺序,可以保证输出的顺序和输入时的相同。

LinkedHashMap 也是线程不安全的,而且容许 key-value 为 null。

(4)、TreeMap

TreesMap 的底层数据结构是红黑树,和 HashMap 不一样,它的 get, put, remove 操做都是 O(logn) 的时间复杂度,而且元素是有序的。

一样,TreeMap 也是线程不安全的。

Set

Set 是一种不容许出现重复元素的集合类型,经常使用的三个实现类是 HashSet、TreeSet 和 LinkedHashSet。

(1)、HashSet

HashSet 其实是用 HashMap 来实现的,如图

只是 Value 被固定为一个静态对象

使用 Key 来保证集合元素的惟一性,不过它不保证集合元素的顺序。

(2)、TreeSet

TreeSet 也是用 TreeMap 来实现的,底层为树结构,TreeSet 则可以保证集合元素是有序的。

(3)、LinkedHashSet

LinkedHashSet 继承 HashSet,具备 HashSet 优势,不过与 HashSet 不一样的是,LinkedHashSet 内部使用了链表来维护元素的插入顺序。

这些知识点若是都能本身打开源码配合看一下,不少有关集合的面试题就能够应付了。

最后推广下个人公众号:苦逼的码农戳我便可关注,文章都会首发于个人公众号,期待各路英雄的关注交流。

相关文章
相关标签/搜索