讲讲HashCode的做用

前言算法

Object提供给咱们了一个Native的方法“public native int hashCode();”,本文讲讲Hash是什么以及HashCode的做用post

 

Hashthis

先用一张图看下什么是Hash
spa

Hash是散列的意思,就是把任意长度的输入,经过散列算法变换成固定长度的输出,该输出就是散列值。关于散列值,有如下几个关键结论:code

一、若是散列表中存在和散列原始输入K相等的记录,那么K一定在f(K)的存储位置上对象

二、不一样关键字通过散列算法变换后可能获得同一个散列地址,这种现象称为碰撞blog

三、若是两个Hash值不一样(前提是同一Hash算法),那么这两个Hash值对应的原始输入一定不一样内存

 

HashCodeget

而后讲下什么是HashCode,总结几个关键点:hash

一、HashCode的存在主要是为了查找的快捷性,HashCode是用来在散列存储结构中肯定对象的存储地址的

二、若是两个对象equals相等,那么这两个对象的HashCode必定也相同

三、若是对象的equals方法被重写,那么对象的HashCode方法也尽可能重写

四、若是两个对象的HashCode相同,不表明两个对象就相同,只能说明这两个对象在散列存储结构中,存放于同一个位置

 

HashCode有什么用

回到最关键的问题,HashCode有什么用?不妨举个例子:

一、假设内存中有0 1 2 3 4 5 6 7 8这8个位置,若是我有个字段叫作ID,那么我要把这个字段存放在以上8个位置之一,若是不用HashCode而任意存放,那么当查找时就须要到8个位置中去挨个查找

二、使用HashCode则效率会快不少,把ID的HashCode%8,而后把ID存放在取得余数的那个位置,而后每次查找该类的时候均可以经过ID的HashCode%8求余数直接找到存放的位置了

三、若是ID的 HashCode%8算出来的位置上自己已经有数据了怎么办?这就取决于算法的实现了,好比ThreadLocal中的作法就是从算出来的位置向后查找第 一个为空的位置,放置数据;HashMap的作法就是经过链式结构连起来。反正,只要保证放的时候和取的时候的算法一致就好了。

四、若是ID的 HashCode%8相等怎么办(这种对应的是第三点说的链式结构的场景)?这时候就须要定义equals了。先经过HashCode%8来判断类在哪一 个位置,再经过equals来在这个位置上寻找须要的类。对比两个类的时候也差很少,先经过HashCode比较,假如HashCode相等再判断 equals。若是两个类的HashCode都不相同,那么这两个类一定是不一样的

举个实际的例子Set。咱们知道Set里面的元素是不能够重复的,那么如何作到?Set是根据equals()方法来判断两个元素是否相等的。比方 说Set里面已经有1000个元素了,那么第1001个元素进来的时候,最多可能调用1000次equals方法,若是equals方法写得复杂,对比的 东西特别多,那么效率会大大下降。使用HashCode就不同了,比方说HashSet,底层是基于HashMap实现的,先经过HashCode取一 个模,这样一会儿就固定到某个位置了,若是这个位置上没有元素,那么就能够确定HashSet中一定没有和新添加的元素equals的元素,就能够直接存 放了,都不须要比较;若是这个位置上有元素了,逐一比较,比较的时候先比较HashCode,HashCode都不一样接下去都不用比了,确定不一 样,HashCode相等,再equals比较,没有相同的元素就存,有相同的元素就不存。若是原来的Set里面有相同的元素,只要HashCode的生 成方式定义得好(不重复),无论Set里面原来有多少元素,只须要执行一次的equals就能够了。这样一来,实际调用equals方法的次数大大下降, 提升了效率。

 

为何重写Object的equals(Object obj)方法尽可能要重写Object的hashCode()方法

咱们在重写Object的equals(Object obj)方法的时候,应该尽可能重写hashCode()方法,这是有缘由的,下面详细解释下:

复制代码
 1 public class HashCodeClass  2 {  3 private String str0;  4 private double dou0;  5 private int int0;  6  7 public boolean equals(Object obj)  8  {  9 if (obj instanceof HashCodeClass) 10  { 11 HashCodeClass hcc = (HashCodeClass)obj; 12 if (hcc.str0.equals(this.str0) && 13 hcc.dou0 == this.dou0 && 14 hcc.int0 == this.int0) 15  { 16 return true; 17  } 18 return false; 19  } 20 return false; 21  } 22 }
复制代码
复制代码
 1 public class TestMain  2 {  3 public static void main(String[] args)  4  {  5 System.out.println(new HashCodeClass().hashCode());  6 System.out.println(new HashCodeClass().hashCode());  7 System.out.println(new HashCodeClass().hashCode());  8 System.out.println(new HashCodeClass().hashCode());  9 System.out.println(new HashCodeClass().hashCode()); 10 System.out.println(new HashCodeClass().hashCode()); 11  } 12 }
复制代码

打印出来的值是:

1901116749
1807500377
355165777
1414159026
1569228633
778966024

咱们但愿两个HashCodeClass类equals的前提是两个HashCodeClass的str0、dou0、int0分别相等。OK,那么这个类不重写hashCode()方法是有问题的。

如今个人HashCodeClass都没有赋初值,那么这6个HashCodeClass应该是所有equals的。若是以HashSet为 例,HashSet内部的HashMap的table自己的大小是16,那么6个HashCode对16取模分别为1三、九、一、二、九、8。第一个放入 table[13]的位置、第二个放入table[9]的位置、第三个放入table[1]的位置。。。可是明明是所有equals的6个 HashCodeClass,怎么能这么作呢?HashSet自己要求的就是equals的对象不重复,如今6个equals的对象在集合中却有5份(因 为有两个计算出来的模都是9)。

那么咱们该怎么作呢?重写hashCode方法,根据str0、dou0、int0搞一个算法生成一个尽可能惟一的hashCode,这样就保证了 str0、dou0、int0都相等的两个HashCodeClass它们的HashCode是相等的,这就是重写equals方法必须尽可能要重写 hashCode方法的缘由。看下JDK中的一些类,都有这么作:

Integer的

复制代码
 1 public int hashCode() {  2 return value;  3  }  4  5 public boolean equals(Object obj) {  6 if (obj instanceof Integer) {  7 return value == ((Integer)obj).intValue();  8  }  9 return false; 10 }
复制代码

String的

复制代码
 1 public int hashCode() {  2 int h = hash;  3 if (h == 0) {  4 int off = offset;  5 char val[] = value;  6 int len = count;  7  8 for (int i = 0; i < len; i++) {  9 h = 31*h + val[off++]; 10  } 11 hash = h; 12  } 13 return h; 14  } 15 16 public boolean equals(Object anObject) { 17 if (this == anObject) { 18 return true; 19  } 20 if (anObject instanceof String) { 21 String anotherString = (String)anObject; 22 int n = count; 23 if (n == anotherString.count) { 24 char v1[] = value; 25 char v2[] = anotherString.value; 26 int i = offset; 27 int j = anotherString.offset; 28 while (n-- != 0) { 29 if (v1[i++] != v2[j++]) 30 return false; 31  } 32 return true; 33  } 34  } 35 return false; 36 }
复制代码

HashMap中的实体类Entry

复制代码
public final int hashCode() { return (key==null ? 0 : key.hashCode()) ^ (value==null ? 0 : value.hashCode()); } public final boolean equals(Object o) { if (!(o instanceof Map.Entry)) return false; Map.Entry e = (Map.Entry)o; Object k1 = getKey(); Object k2 = e.getKey(); if (k1 == k2 || (k1 != null && k1.equals(k2))) { Object v1 = getValue(); Object v2 = e.getValue(); if (v1 == v2 || (v1 != null && v1.equals(v2))) return true; } return false; }
复制代码
相关文章
相关标签/搜索