Set集合不包含重复的元素,这是使用Set的主要缘由。有三种常见的Set实现——HashSet, TreeSet和LinkedHashSet。何时使用它们,使用哪一个是个重要的问题。整体而言,若是你须要一个访问快速的Set,你应该使用HashSet;当你须要一个排序的Set,你应该使用TreeSet;当你须要记录下插入时的顺序时,你应该使用LinedHashSet。 html
Set接口继承了Collection接口。Set集合中不能包含重复的元素,每一个元素必须是惟一的。你只需将元素加入set中,重复的元素会自动移除。 java
HashSet是采用hash表来实现的。其中的元素没有按顺序排列,add()、remove()以及contains()等方法都是复杂度为O(1)的方法。 git
TreeSet是采用树结构实现(红黑树算法)。元素是按顺序进行排列,可是add()、remove()以及contains()等方法都是复杂度为O(log (n))的方法。它还提供了一些方法来处理排序的set,如first(), last(), headSet(), tailSet()等等。 github
LinkedHashSet介于HashSet和TreeSet之间。它也是一个hash表,可是同时维护了一个双链表来记录插入的顺序。基本方法的复杂度为O(1)。 算法
1
2
3
4
5
6
7
8
9
10
11
|
TreeSet tree =newTreeSet();
tree.add(12);
tree.add(63);
tree.add(34);
tree.add(45);
Iterator iterator = tree.iterator();
System.out.print("Tree set data: ");
while(iterator.hasNext()) {
System.out.print(iterator.next() +" ");
}
|
输出以下: dom
1
|
Tree set data: 12 34 45 63
|
如今让咱们定义一个Dog类: ide
1
2
3
4
5
6
7
8
9
10
11
|
classDog {
intsize;
publicDog(ints) {
size = s;
}
publicString toString() {
returnsize +"";
}
}
|
咱们将“dog”添加到TreeSet中: 性能
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
importjava.util.Iterator;
importjava.util.TreeSet;
publicclassTestTreeSet {
publicstaticvoidmain(String[] args) {
TreeSet dset =newTreeSet();
dset.add(newDog(2));
dset.add(newDog(1));
dset.add(newDog(3));
Iterator iterator = dset.iterator();
while(iterator.hasNext()) {
System.out.print(iterator.next() +" ");
}
}
}
|
编译正常,可是运行时出错: 测试
1
2
3
4
|
Exception in thread "main" java.lang.ClassCastException: spa collection.Dog cannot be cast to java.lang.Comparable
at java.util.TreeMap.put(Unknown Source)
at java.util.TreeSet.add(Unknown Source)
at collection.TestTreeSet.main(TestTreeSet.java:22)
|
由于TreeSet是有序的,Dog类必须实现java.lang.Comparable的compareTo()方法才行:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
classDogimplementsComparable{
intsize;
publicDog(ints) {
size = s;
}
publicString toString() {
returnsize +"";
}
@Override
publicintcompareTo(Dog o) {
returnsize - o.size;
}
}
|
输出:
1
|
1 2 3
|
1
2
3
4
5
6
7
8
9
10
|
HashSet dset =newHashSet();
dset.add(newDog(2));
dset.add(newDog(1));
dset.add(newDog(3));
dset.add(newDog(5));
dset.add(newDog(4));
Iterator iterator = dset.iterator();
while(iterator.hasNext()) {
System.out.print(iterator.next() +" ");
}
|
输出:
1
|
5 3 2 1 4
|
注意输出顺序是不肯定的。
1
2
3
4
5
6
7
8
9
10
|
LinkedHashSet dset =newLinkedHashSet();
dset.add(newDog(2));
dset.add(newDog(1));
dset.add(newDog(3));
dset.add(newDog(5));
dset.add(newDog(4));
Iterator iterator = dset.iterator();
while(iterator.hasNext()) {
System.out.print(iterator.next() +" ");
}
|
输出的顺序时肯定的,就是插入的顺序。
1
|
2 1 3 5 4
|
下面的代码测试了以上三个类的add()方法的性能。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
|
publicstaticvoidmain(String[] args) {
Random r =newRandom();
HashSet<Dog> hashSet =newHashSet<Dog>();
TreeSet<Dog> treeSet =newTreeSet<Dog>();
LinkedHashSet<Dog> linkedSet =newLinkedHashSet<Dog>();
// start time
longstartTime = System.nanoTime();
for(inti =0; i <1000; i++) {
intx = r.nextInt(1000-10) +10;
hashSet.add(newDog(x));
}
// end time
longendTime = System.nanoTime();
longduration = endTime - startTime;
System.out.println("HashSet: "+ duration);
// start time
startTime = System.nanoTime();
for(inti =0; i <1000; i++) {
intx = r.nextInt(1000-10) +10;
treeSet.add(newDog(x));
}
// end time
endTime = System.nanoTime();
duration = endTime - startTime;
System.out.println("TreeSet: "+ duration);
// start time
startTime = System.nanoTime();
for(inti =0; i <1000; i++) {
intx = r.nextInt(1000-10) +10;
linkedSet.add(newDog(x));
}
// end time
endTime = System.nanoTime();
duration = endTime - startTime;
System.out.println("LinkedHashSet: "+ duration);
}
|
从输出看来,HashSet是最快的:
1
2
3
|
HashSet: 2244768
TreeSet: 3549314
LinkedHashSet: 2263320
|
*这个测试并非很是精确,但足以反映基本的状况。