HashSet vs. TreeSet vs. LinkedHashSet

时间 2019-11-12

标签 hashset treeset linkedhashset 栏目 Java 繁體版

原文原文链接

Set集合不包含重复的元素，这是使用Set的主要缘由。有三种常见的Set实现——HashSet, TreeSet和LinkedHashSet。何时使用它们，使用哪一个是个重要的问题。整体而言，若是你须要一个访问快速的Set，你应该使用HashSet；当你须要一个排序的Set，你应该使用TreeSet；当你须要记录下插入时的顺序时，你应该使用LinedHashSet。 html

1. Set接口

Set接口继承了Collection接口。Set集合中不能包含重复的元素，每一个元素必须是惟一的。你只需将元素加入set中，重复的元素会自动移除。 java

2. HashSet vs. TreeSet vs. LinkedHashSet

HashSet是采用hash表来实现的。其中的元素没有按顺序排列，add()、remove()以及contains()等方法都是复杂度为O(1)的方法。 git

TreeSet是采用树结构实现(红黑树算法)。元素是按顺序进行排列，可是add()、remove()以及contains()等方法都是复杂度为O(log (n))的方法。它还提供了一些方法来处理排序的set，如first(), last(), headSet(), tailSet()等等。 github

LinkedHashSet介于HashSet和TreeSet之间。它也是一个hash表，可是同时维护了一个双链表来记录插入的顺序。基本方法的复杂度为O(1)。算法

3. TreeSet的例子

         TreeSet tree =newTreeSet(); 
       
         tree.add(12); 
       
         tree.add(63); 
       
         tree.add(34); 
       
         tree.add(45); 
       
         Iterator iterator = tree.iterator(); 
       
         System.out.print("Tree set data: "); 
       
         while(iterator.hasNext()) { 
       
             System.out.print(iterator.next() +" "); 
       
         }

输出以下： dom

1	Tree set data: 12 34 45 63

如今让咱们定义一个Dog类： ide

         classDog { 
       
             intsize; 
       
             publicDog(ints) { 
       
                 size = s; 
       
             } 
       
             publicString toString() { 
       
                 returnsize +""; 
       
             } 
       
         }

咱们将“dog”添加到TreeSet中：性能

         importjava.util.Iterator; 
       
         importjava.util.TreeSet; 
       
         publicclassTestTreeSet { 
       
             publicstaticvoidmain(String[] args) { 
       
                 TreeSet dset =newTreeSet(); 
       
                 dset.add(newDog(2)); 
       
                 dset.add(newDog(1)); 
       
                 dset.add(newDog(3)); 
       
                 Iterator iterator = dset.iterator(); 
       
                 while(iterator.hasNext()) { 
       
                     System.out.print(iterator.next() +" "); 
       
                 } 
       
             } 
       
         }

编译正常，可是运行时出错：测试

4

 Exception in thread "main" java.lang.ClassCastException:  spa
 collection.Dog cannot be cast to java.lang.Comparable 

          at java.util.TreeMap.put(Unknown Source) 
    
          at java.util.TreeSet.add(Unknown Source) 
    
          at collection.TestTreeSet.main(TestTreeSet.java:22)

由于TreeSet是有序的，Dog类必须实现java.lang.Comparable的compareTo()方法才行:

         classDogimplementsComparable{ 
       
             intsize; 
       
             publicDog(ints) { 
       
                 size = s; 
       
             } 
       
             publicString toString() { 
       
                 returnsize +""; 
       
             } 
       
             @Override 
       
             publicintcompareTo(Dog o) { 
       
                     returnsize - o.size; 
       
             } 
       
         }

输出:

1

         1 2 3 
       

4. HashSet的例子

         HashSet dset =newHashSet(); 
       
         dset.add(newDog(2)); 
       
         dset.add(newDog(1)); 
       
         dset.add(newDog(3)); 
       
         dset.add(newDog(5)); 
       
         dset.add(newDog(4)); 
       
         Iterator iterator = dset.iterator(); 
       
         while(iterator.hasNext()) { 
       
             System.out.print(iterator.next() +" "); 
       
         }

输出：

1

         5 3 2 1 4 
       

注意输出顺序是不肯定的。

5. LinkedHashSet的例子

         LinkedHashSet dset =newLinkedHashSet(); 
       
         dset.add(newDog(2)); 
       
         dset.add(newDog(1)); 
       
         dset.add(newDog(3)); 
       
         dset.add(newDog(5)); 
       
         dset.add(newDog(4)); 
       
         Iterator iterator = dset.iterator(); 
       
         while(iterator.hasNext()) { 
       
             System.out.print(iterator.next() +" "); 
       
         }

输出的顺序时肯定的，就是插入的顺序。

1

         2 1 3 5 4 
       

6. 性能测试

下面的代码测试了以上三个类的add()方法的性能。

         publicstaticvoidmain(String[] args) { 
       
             Random r =newRandom(); 
       
             HashSet<Dog> hashSet =newHashSet<Dog>(); 
       
             TreeSet<Dog> treeSet =newTreeSet<Dog>(); 
       
             LinkedHashSet<Dog> linkedSet =newLinkedHashSet<Dog>(); 
       
             // start time 
       
             longstartTime = System.nanoTime(); 
       
             for(inti =0; i <1000; i++) { 
       
                 intx = r.nextInt(1000-10) +10; 
       
                 hashSet.add(newDog(x)); 
       
             } 
       
             // end time 
       
             longendTime = System.nanoTime(); 
       
             longduration = endTime - startTime; 
       
             System.out.println("HashSet: "+ duration); 
       
             // start time 
       
             startTime = System.nanoTime(); 
       
             for(inti =0; i <1000; i++) { 
       
                 intx = r.nextInt(1000-10) +10; 
       
                 treeSet.add(newDog(x)); 
       
             } 
       
             // end time 
       
             endTime = System.nanoTime(); 
       
             duration = endTime - startTime; 
       
             System.out.println("TreeSet: "+ duration); 
       
             // start time 
       
             startTime = System.nanoTime(); 
       
             for(inti =0; i <1000; i++) { 
       
                 intx = r.nextInt(1000-10) +10; 
       
                 linkedSet.add(newDog(x)); 
       
             } 
       
             // end time 
       
             endTime = System.nanoTime(); 
       
             duration = endTime - startTime; 
       
             System.out.println("LinkedHashSet: "+ duration); 
       
         }

从输出看来，HashSet是最快的：

         HashSet: 2244768 
       
         TreeSet: 3549314 
       
         LinkedHashSet: 2263320

*这个测试并非很是精确，但足以反映基本的状况。