Java 基础：hashCode方法

时间 2019-11-06

标签 java 基础 hashcode 方法栏目 Java 繁體版

原文原文链接

Writer：BYSocket（泥沙砖瓦浆木匠）java

微博：BYSocket程序员

豆瓣：BYSocket
web

1、前言

泥瓦匠最近被项目搞的天昏地暗。发现有些要给本身一些目标，关于技术的目标：
算法

专一很重要。专一Java 基础 + H5（学习）数据结构

其余操做系统，算法，数据结构当成课外书博览。有时候，就是那样你越是专一方面越多对本身打击越大学啥啥都很差。今天带来Java基础：hashCode方法socket

2、hashCode方法

hash code(散列码，也能够叫哈希码值)是对象产生的一个整型值。其生成没有规律的。两者散列码能够获取对象中的信息，转成那个对象的“相对惟一”的整型值。全部对象都有一个散列码，hashCode()是根类 Object 的一个方法。散列表的工做原理在Java基础不展开讲，只要知道它是一种快速的“字典”便可。下面引用老外一张图：函数

3、两个小例子

首先泥瓦匠引用一段来自 Object规范【JavaSE6】:性能

hashCode的常规协定是：学习

一、在 Java 应用程序执行期间，在对同一对象屡次调用 hashCode 方法时，必须一致地返回相同的整数，前提是将对象进行 equals 比较时所用的信息没有被修改。从某一应用程序的一次执行到同一应用程序的另外一次执行，该整数无需保持一致。优化

二、若是根据 equals(Object) 方法，两个对象是相等的，那么对这两个对象中的每一个对象调用 hashCode 方法都必须生成相同的整数结果。

三、若是根据equals方法，两个对象不相等，那么对这两个对象中的任一对象上调用 hashCode 方法不要求必定生成不一样的整数结果。可是，程序员应该意识到，为不相等的对象生成不一样整数结果能够提升哈希表的性能。

因为hashCode定义在根类Object，因此每一个对象都是Object，都具备一个默认的散列值，便是对象的存储地址。泥瓦匠请你们看一下这个例子：

public class HashCodeTest
{
    public static void main(String[] args)
    {
        String s = "hashCode";
        StringBuilder sb = new StringBuilder(s);
        System.out.println("hashCode1: " + s.hashCode() + " " + sb.hashCode());
         
        String s1 = new String("hashCode");
        StringBuilder sb1 = new StringBuilder(s1);
        System.out.println("hashCode2: " + s1.hashCode() + " " + sb1.hashCode());
         
        // are they equals?
        System.out.println("s  s1 : " + s.equals(s1));
        System.out.println("sb sb1: " + sb.equals(sb1));
    }
}

run 一下，能够在控制台看到：

hashCode1: 147696667 1385112968
hashCode2: 147696667 870919696
s  s1 : true
sb sb1: false

泥瓦匠小结：

一、s 与 s1相等，且hashCode同样。验证了【hashCode的常规协定】的第二条。缘由是字符串的散列码由内容导出的。（这个第二个例子咱们会验证）

二、StringBuilder 里面没有定义hashCode方法，因此导出的是Object默认的对对象存储的地址。（注意到Object的hashCode方法前面有个native的修饰符，这表示hashCode方法是由非java语言实现的，具体的方法实如今外部，返回内存对象的地址。）详情请看认识&理解关键字 native 实战篇。

泥瓦匠刚刚提到字符串散列码是由内容导出的。下面看看String的hashCode的实现。

 /** The value is used for character storage */private char value[];
 
private int hash;// Default to 0
 
/**
 * Returns a hash code for this string. The hash code for a
 * String object is computed as
 * s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]
 */
public int hashCode()
{
    int h = hash;
    if (h == 0 && value.length > 0)
    {
        char val[] = value;
         
        for (int i = 0; i < value.length; i++)
        {
            h = 31 * h + val[i];
        }
        hash = h;
    }
    return h;
}

泥瓦匠小结：

一、s[0]*31^(n-1) + s[1]*31^(n-2) + … + s[n-1] 数学公式表明什么？

s[i]是string的第i个字符，n是String的长度。31为啥呢？下面引用《Effective Java》的原话：

之因此选择31，是由于它是个奇素数，若是乘数是偶数，而且乘法溢出的话，信息就会丢失，由于与2相乘等价于移位运算。使用素数的好处并非很明显，可是习惯上都使用素数来计算散列结果。31有个很好的特性，就是用移位和减法来代替乘法，能够获得更好的性能：31*i==(i<<5)-i。如今的VM能够自动完成这种优化。

4、结论和忠告

确实hashCode有点晦涩，有多是由于那个数学散列函数。下面是《Effective Java》中的结论点：

一、若是对象有相同的散列码，被映射到同一个散列桶，这样散列表退化称为链表，这样性能下降。

二、相等的对象必须具备相等的散列码

三、为不相等的对象产生不相等的散列码

四、不要试图从散列码计算中排除掉一个对象关键部分来提升性能

Writer：BYSocket（泥沙砖瓦浆木匠）

微博：BYSocket

豆瓣：BYSocket