在 Java2中,有一套设计优良的接口和类组成了Java集合框架Collection,使程序员操做成批的数据或对象元素极为方便。这些接口和类有不少对抽象数据类型操做的API,而这是咱们经常使用的且在数据结构中熟知的。例如Map,Set,List等。而且Java用面向对象的设计对这些数据结构和算法进行了封装,这就极大的减化了程序员编程时的负担。程序员也能够以这个集合框架为基础,定义更高级别的数据抽象,好比栈、队列和线程安全的集合等,从而知足本身的须要。
Java2的集合框架,抽其核心,主要有三种:List、Set和Map。以下图所示:
须要注意的是,这里的 Collection、List、Set和Map都是接口(Interface),不是具体的类实现。 List lst = new ArrayList(); 这是咱们日常常用的建立一个新的List的语句,在这里, List是接口,ArrayList才是具体的类。
经常使用集合类的继承结构以下:
Collection<--List<--Vector
Collection<--List<--ArrayList
Collection<--List<--LinkedList
Collection<--Set<--HashSet
Collection<--Set<--HashSet<--LinkedHashSet
Collection<--Set<--SortedSet<--TreeSet
Map<--SortedMap<--TreeMap
Map<--HashMap
-----------------------------------------------SB分割线------------------------------------------
List:
List是有序的Collection,使用此接口可以精确的控制每一个元素插入的位置。用户可以使用索引(元素在List中的位置,相似于数组下 >标)来访问List中的元素,这相似于Java的数组。
Vector:
基于数组(Array)的List,其实就是封装了数组所不具有的一些功能方便咱们使用,因此它难易避免数组的限制,同时性能也不可能超越数组。因此,在可能的状况下,咱们要多运用数组。另外很重要的一点就是Vector是线程同步的(sychronized)的,这也是Vector和ArrayList 的一个的重要区别。
ArrayList:
同Vector同样是一个基于数组上的链表,可是不一样的是ArrayList不是同步的。因此在性能上要比Vector好一些,可是当运行到多线程环境中时,可须要本身在管理线程的同步问题。
LinkedList:
LinkedList不一样于前面两种List,它不是基于数组的,因此不受数组性能的限制。
它每个节点(Node)都包含两方面的内容:
1.节点自己的数据(data);
2.下一个节点的信息(nextNode)。
因此当对LinkedList作添加,删除动做的时候就不用像基于数组的ArrayList同样,必须进行大量的数据移动。只要更改nextNode的相关信息就能够实现了,这是LinkedList的优点。
List总结: java
--------------------------------------NB分割线------------------------------------
Set:
Set是一种不包含重复的元素的无序Collection。
HashSet:
虽然Set同List都实现了Collection接口,可是他们的实现方式却大不同。List基本上都是以Array为基础。可是Set则是在 HashMap的基础上来实现的,这个就是Set和List的根本区别。HashSet的存储方式是把HashMap中的Key做为Set的对应存储项。看看 HashSet的add(Object obj)方法的实现就能够一目了然了。 程序员
Java代码 算法
public boolean add(Object obj) { return map.put(obj, PRESENT) == null; }
这个也是为何在Set中不能像在List中同样有重复的项的根本缘由,由于HashMap的key是不能有重复的。
LinkedHashSet:
HashSet的一个子类,一个链表。
TreeSet:
SortedSet的子类,它不一样于HashSet的根本就是TreeSet是有序的。它是经过SortedMap来实现的。
Set总结: 数据库
--------------------------------------2B分割线------------------------------------
Map:
Map 是一种把键对象和值对象进行关联的容器,而一个值对象又能够是一个Map,依次类推,这样就可造成一个多级映射。对于键对象来讲,像Set同样,一个 Map容器中的键对象不容许重复,这是为了保持查找结果的一致性;若是有两个键对象同样,那你想获得那个键对象所对应的值对象时就有问题了,可能你获得的并非你想的那个值对象,结果会形成混乱,因此键的惟一性很重要,也是符合集合的性质的。固然在使用过程当中,某个键所对应的值对象可能会发生变化,这时会按照最后一次修改的值对象与键对应。对于值对象则没有惟一性的要求,你能够将任意多个键都映射到一个值对象上,这不会发生任何问题(不过对你的使用却可能会形成不便,你不知道你获得的究竟是那一个键所对应的值对象)。
Map有两种比较经常使用的实现:HashMap和TreeMap。
HashMap也用到了哈希码的算法,以便快速查找一个键,
TreeMap则是对键按序存放,所以它便有一些扩展的方法,好比firstKey(),lastKey()等,你还能够从TreeMap中指定一个范围以取得其子Map。
键和值的关联很简单,用put(Object key,Object value)方法便可将一个键与一个值对象相关联。用get(Object key)可获得与此key对象所对应的值对象。
--------------------------------------JB分割线------------------------------------
其它:
1、几个经常使用类的区别
1.ArrayList: 元素单个,效率高,多用于查询
2.Vector: 元素单个,线程安全,多用于查询
3.LinkedList:元素单个,多用于插入和删除
4.HashMap: 元素成对,元素可为空
5.HashTable: 元素成对,线程安全,元素不可为空
2、Vector、ArrayList和LinkedList
大多数状况下,从性能上来讲ArrayList最好,可是当集合内的元素须要频繁插入、删除时LinkedList会有比较好的表现,可是它们三个性能都比不上数组,另外Vector是线程同步的。因此:
若是能用数组的时候(元素类型固定,数组长度固定),请尽可能使用数组来代替List;
若是没有频繁的删除插入操做,又不用考虑多线程问题,优先选择ArrayList;
若是在多线程条件下使用,能够考虑Vector;
若是须要频繁地删除插入,LinkedList就有了用武之地;
若是你什么都不知道,用ArrayList没错。
3、Collections和Arrays
在 Java集合类框架里有两个类叫作Collections(注意,不是Collection!)和Arrays,这是JCF里面功能强大的工具,但初学者每每会忽视。按JCF文档的说法,这两个类提供了封装器实现(Wrapper Implementations)、数据结构算法和数组相关的应用。
想必你们不会忘记上面谈到的“折半查找”、“排序”等经典算法吧,Collections类提供了丰富的静态方法帮助咱们轻松完成这些在数据结构课上烦人的工做:
binarySearch:折半查找。
sort:排序,这里是一种相似于快速排序的方法,效率仍然是O(n * log n),但倒是一种稳定的排序方法。
reverse:将线性表进行逆序操做,这个但是从前数据结构的经典考题哦!
rotate:以某个元素为轴心将线性表“旋转”。
swap:交换一个线性表中两个元素的位置。
……
Collections还有一个重要功能就是“封装器”(Wrapper),它提供了一些方法能够把一个集合转换成一个特殊的集合,以下:
unmodifiableXXX:转换成只读集合,这里XXX表明六种基本集合接口:Collection、List、Map、Set、SortedMap和SortedSet。若是你对只读集合进行插入删除操做,将会抛出UnsupportedOperationException异常。
synchronizedXXX:转换成同步集合。
singleton:建立一个仅有一个元素的集合,这里singleton生成的是单元素Set,
singletonList和singletonMap分别生成单元素的List和Map。
空集:由Collections的静态属性EMPTY_SET、EMPTY_LIST和EMPTY_MAP表示。 编程
1、Array , Arrays
Java全部“存储及随机访问一连串对象”的作法,array是最有效率的一种。
一、
效率高,但容量固定且没法动态改变。
array还有一个缺点是,没法判断其中实际存有多少元素,length只是告诉咱们array的容量。
二、Java中有一个Arrays类,专门用来操做array。
arrays中拥有一组static函数,
equals():比较两个array是否相等。array拥有相同元素个数,且全部对应元素两两相等。
fill():将值填入array中。
sort():用来对array进行排序。
binarySearch():在排好序的array中寻找元素。
System.arraycopy():array的复制。
2、Collection , Map
若撰写程序时不知道究竟须要多少对象,须要在空间不足时自动扩增容量,则须要使用容器类库,array不适用。
一、Collection 和 Map 的区别
容器内每一个为之所存储的元素个数不一样。
Collection类型者,每一个位置只有一个元素。
Map类型者,持有 key-value pair,像个小型数据库。
二、各自旗下的子类关系
Collection
--List: 将以特定次序存储元素。因此取出来的顺序可能和放入顺序不一样。
--ArrayList / LinkedList / Vector
--Set : 不能含有重复的元素
--HashSet / TreeSet
Map
--HashMap
--HashTable
--TreeMap
三、其余特征
* List,Set,Map将持有对象一概视为Object型别。
* Collection、List、Set、Map都是接口,不能实例化。
继承自它们的 ArrayList, Vector, HashTable, HashMap是具象class,这些才可被实例化。
* vector容器确切知道它所持有的对象隶属什么型别。vector不进行边界检查。
3、Collections
Collections是针对集合类的一个帮助类。提供了一系列静态方法实现对各类集合的搜索、排序、线程彻底化等操做。
至关于对Array进行相似操做的类——Arrays。
如,Collections.max(Collection coll); 取coll中最大的元素。
Collections.sort(List list); 对list中元素排序
4、如何选择?
一、容器类和Array的区别、择取
* 容器类仅能持有对象引用(指向对象的指针),而不是将对象信息copy一份至数列某位置。
* 一旦将对象置入容器内,便损失了该对象的型别信息。
二、
* 在各类Lists中,最好的作法是以ArrayList做为缺省选择。当插入、删除频繁时,使用LinkedList();
Vector老是比ArrayList慢,因此要尽可能避免使用。
* 在各类Sets中,HashSet一般优于HashTree(插入、查找)。只有当须要产生一个通过排序的序列,才用TreeSet。
HashTree存在的惟一理由:可以维护其内元素的排序状态。
* 在各类Maps中
HashMap用于快速查找。
* 当元素个数固定,用Array,由于Array效率是最高的。
结论:最经常使用的是ArrayList,HashSet,HashMap,Array。
注意:
一、Collection没有get()方法来取得某个元素。只能经过iterator()遍历元素。
二、Set和Collection拥有如出一辙的接口。
三、List,能够经过get()方法来一次取出一个元素。使用数字来选择一堆对象中的一个,get(0)...。(add/get)
四、通常使用ArrayList。用LinkedList构造堆栈stack、队列queue。
五、Map用 put(k,v) / get(k),还可使用containsKey()/containsValue()来检查其中是否含有某个key/value。
HashMap会利用对象的hashCode来快速找到key。
* hashing
哈希码就是将对象的信息通过一些转变造成一个独一无二的int值,这个值存储在一个array中。
咱们都知道全部存储结构中,array查找速度是最快的。因此,能够加速查找。
发生碰撞时,让array指向多个values。即,数组每一个位置上又生成一个梿表。
六、Map中元素,能够将key序列、value序列单独抽取出来。
使用keySet()抽取key序列,将map中的全部keys生成一个Set。
使用values()抽取value序列,将map中的全部values生成一个Collection。
为何一个生成Set,一个生成Collection?那是由于,key老是独一无二的,value容许重复数组
参考:Java Collection安全