为何要重写hashcode和equals方法?初级程序员在面试中不多能说清楚。

  我在面试 Java初级开发的时候,常常会问:你有没有重写过hashcode方法?很多候选人直接说没写过。我就想,或许真的没写过,因而就再经过一个问题确认:你在用HashMap的时候,键(Key)部分,有没有放过自定义对象?而这个时候,候选人说放过,因而两个问题的回答就自相矛盾了。
  
  最近问下来,这个问题广泛回答不大好,因而在本文里,就干脆从hash表讲起,讲述HashMap的存数据规则,由此你们就天然清楚上述问题的答案了。
  
  1 经过Hash算法来了解HashMap对象的高效性
  
  咱们先复习数据结构里的一个知识点:在一个长度为n(假设是10000)的线性表(假设是ArrayList)里,存放着无序的数字;若是咱们要找一个指定的数字,就不得不经过从头至尾依次遍从来查找,这样的平均查找次数是n除以2(这里是5000)。
  
  咱们再来观察Hash表(这里的Hash表纯粹是数据结构上的概念,和Java无关)。它的平均查找次数接近于1,代价至关小,关键是在Hash表里,存放在其中的数据和它的存储位置是用Hash函数关联的。
  
  咱们假设一个Hash函数是x*x%5。固然实际状况里不可能用这么简单的Hash函数,咱们这里纯粹为了说明方便,而Hash表是一个长度是11的线性表。若是咱们要把6放入其中,那么咱们首先会对6用Hash函数计算一下,结果是1,因此咱们就把6放入到索引号是1这个位置。一样若是咱们要放数字7,通过Hash函数计算,7的结果是4,那么它将被放入索引是4的这个位置。这个效果以下图所示。
  
  这样作的好处很是明显。好比咱们要从中找6这个元素,咱们能够先经过Hash函数计算6的索引位置,而后直接从1号索引里找到它了。
  
  不过咱们会遇到“Hash值冲突”这个问题。好比通过Hash函数计算后,7和8会有相同的Hash值,对此Java的HashMap对象采用的是”链地址法“的解决方案。效果以下图所示。
  
  具体的作法是,为全部Hash值是i的对象创建一个同义词链表。假设咱们在放入8的时候,发现4号位置已经被占,那么就会新建一个链表结点放入8。一样,若是咱们要找8,那么发现4号索引里不是8,那会沿着链表依次查找。
  
  虽然咱们仍是没法完全避免Hash值冲突的问题,可是Hash函数设计合理,仍能保证同义词链表的长度被控制在一个合理的范围里。这里讲的理论知识并不是无的放矢,你们能在后文里清晰地了解到重写hashCode方法的重要性。
  
  2 为何要重写equals和hashCode方法
  
  当咱们用HashMap存入自定义的类时,若是不重写这个自定义类的equals和hashCode方法,获得的结果会和咱们预期的不同。咱们来看WithoutHashCode.java这个例子。
  
  在其中的第2到第18行,咱们定义了一个Key类;在其中的第3行定义了惟一的一个属性id。当前咱们先注释掉第9行的equals方法和第16行的hashCode方法。java

  1   import java.util.HashMap;
  
  2   class Key {
  
  3       private Integer id;
  
  4       public Integer getId()
  
  5   {return id; }
  
  6       public Key(Integer id)
  
  7   {this.id = id;  }
  
  8   //故意先注释掉equals和hashCode方法
  
  9   //  public boolean equals(Object o) {
  
  10  //      if (o == null || !(o instanceof Key))
  
  11  //      { return false; }
  
  12  //      else
  
  13  //      { return this.getId().equals(((Key) o).getId());}
  
  14  //  }
  
  15
  
  16  //  public int hashCode()
  
  17  //  { return id.hashCode(); }
  
  18  }
  
  19
  
  20  public class WithoutHashCode {
  
  21      public static void main(String[] args) {
  
  22          Key k1 = new Key(1);
  
  23          Key k2 = new Key(1);
  
  24          HashMap<Key,String> hm = new HashMap<Key,String>();
  
  25          hm.put(k1, "Key with id is 1");
  
  26          System.out.println(hm.get(k2));
  
        public class Factory
        private CustomerOperation _www.mcyulegw.com customerOperation = null;
        private OrderOperation www.dfgjpt.com_orderOperation = null;
        public Customer Customers
            Factory factory = new Factory();
            factory .Orders.Get(www.yongshiyule178.com);
            factory .Customers.Get();
            Console.ReadLine(www.yongshi123.cn );程序员

  在main函数里的第22和23行,咱们定义了两个Key对象,它们的id都是1,就比如它们是两把相同的都能打开同一扇门的钥匙。
  
  在第24行里,咱们经过泛型建立了一个HashMap对象。它的键部分能够存放Key类型的对象,值部分能够存储String类型的对象。
  
  在第25行里,咱们经过put方法把k1和一串字符放入到hm里; 而在第26行,咱们想用k2去从HashMap里获得值;这就比如咱们想用k1这把钥匙来锁门,用k2来开门。这是符合逻辑的,但从当前结果看,26行的返回结果不是咱们想象中的那个字符串,而是null。
  
  缘由有两个—没有重写。第一是没有重写hashCode方法,第二是没有重写equals方法。
  
  当咱们往HashMap里放k1时,首先会调用Key这个类的hashCode方法计算它的hash值,随后把k1放入hash值所指引的内存位置。
  
  关键是咱们没有在Key里定义hashCode方法。这里调用的还是Object类的hashCode方法(全部的类都是Object的子类),而Object类的hashCode方法返回的hash值实际上是k1对象的内存地址(假设是1000)。
  
  若是咱们随后是调用hm.get(k1),那么咱们会再次调用hashCode方法(仍是返回k1的地址1000),随后根据获得的hash值,能很快地找到k1。
  
  但咱们这里的代码是hm.get(k2),当咱们调用Object类的hashCode方法(由于Key里没定义)计算k2的hash值时,其实获得的是k2的内存地址(假设是2000)。因为k1和k2是两个不一样的对象,因此它们的内存地址必定不会相同,也就是说它们的hash值必定不一样,这就是咱们没法用k2的hash值去拿k1的缘由。
  
  当咱们把第16和17行的hashCode方法的注释去掉后,会发现它是返回id属性的hashCode值,这里k1和k2的id都是1,因此它们的hash值是相等的。
  
  咱们再来更正一下存k1和取k2的动做。存k1时,是根据它id的hash值,假设这里是100,把k1对象放入到对应的位置。而取k2时,是先计算它的hash值(因为k2的id也是1,这个值也是100),随后到这个位置去找。
  
  但结果会出乎咱们意料:明明100号位置已经有k1,但第26行的输出结果依然是null。其缘由就是没有重写Key对象的equals方法。
  
  HashMap是用链地址法来处理冲突,也就是说,在100号位置上,有可能存在着多个用链表形式存储的对象。它们经过hashCode方法返回的hash值都是100。
  
  当咱们经过k2的hashCode到100号位置查找时,确实会获得k1。但k1有可能仅仅是和k2具备相同的hash值,但未必和k2相等(k1和k2两把钥匙未必能开同一扇门),这个时候,就须要调用Key对象的equals方法来判断二者是否相等了。
  
  因为咱们在Key对象里没有定义equals方法,系统就不得不调用Object类的equals方法。因为Object的固有方法是根据两个对象的内存地址来判断,因此k1和k2必定不会相等,这就是为何依然在26行经过hm.get(k2)依然获得null的缘由。
  
  为了解决这个问题,咱们须要打开第9到14行equals方法的注释。在这个方法里,只要两个对象都是Key类型,并且它们的id相等,它们就相等。
  
  3 对面试问题的说明
  
  因为在项目里常常会用到HashMap,因此我在面试的时候必定会问这个问题∶你有没有重写过hashCode方法?你在使用HashMap时有没有重写hashCode和equals方法?你是怎么写的?
  
  根据问下来的结果,我发现初级程序员对这个知识点广泛没掌握好。重申一下,若是你们要在HashMap的“键”部分存放自定义的对象,必定要在这个对象里用本身的equals和hashCode方法来覆盖Object里的同名方法。面试

相关文章
相关标签/搜索