欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

搞懂JAVAObject中的hashCode()

程序员文章站 2024-01-09 17:18:59
目录object中的hashcode()hashcode()和equals()重写的hashcode()方法object中的hashcode()hashcode方法用来返回对象的哈希值,提供该方法是为...

object中的hashcode()

hashcode方法用来返回对象的哈希值,提供该方法是为了支持哈希表,例如hashmap,hashtable等,在object类中的代码如下:

 public native int hashcode();

这是一个native声明的本地方法,返回一个int型的整数。由于在object中,因此每个对象都有一个默认的哈希值。

在openjdk8根路径/hotspot/src/share/vm/runtime路径下的synchronizer.cpp文件中,有生成哈希值的代码:

static inline intptr_t get_next_hash(thread * self, oop obj) {
  intptr_t value = 0 ;
  if (hashcode == 0) {
     // 返回随机数
     value = os::random() ;
  } else
  if (hashcode == 1) {
     //用对象的内存地址根据某种算法进行计算
     intptr_t addrbits = cast_from_oop<intptr_t>(obj) >> 3 ;
     value = addrbits ^ (addrbits >> 5) ^ gvars.stwrandom ;
  } else
  if (hashcode == 2) {
     // 始终返回1,用于测试
     value = 1 ;            
  } else
  if (hashcode == 3) {
     //从0开始计算哈希值
     value = ++gvars.hcsequence ;
  } else
  if (hashcode == 4) {
     //输出对象的内存地址
     value = cast_from_oop<intptr_t>(obj) ;
  } else {
     // 默认的hashcode生成算法,利用xor-shift算法产生伪随机数
     unsigned t = self->_hashstatex ;
     t ^= (t << 11) ;
     self->_hashstatex = self->_hashstatey ;
     self->_hashstatey = self->_hashstatez ;
     self->_hashstatez = self->_hashstatew ;
     unsigned v = self->_hashstatew ;
     v = (v ^ (v >> 19)) ^ (t ^ (t >> 8)) ;
     self->_hashstatew = v ;
     value = v ;
  }

  value &= markoopdesc::hash_mask;
  if (value == 0) value = 0xbad ;
  assert (value != markoopdesc::no_hash, "invariant") ;
  tevent (hashcode: generate) ;
  return value;
}

源码中的hashcode其实是jvm启动的一个参数,每一个分支对应一个生成策略,通过-xx:hashcode可以切换hashcode的生成策略。

下面验证第2种生成策略,用软件idea输入参数-xx:hashcode=2,可以看到输出结果正是1,从而进一步验证了上面的源码。

搞懂JAVAObject中的hashCode()

搞懂JAVAObject中的hashCode()

hashcode()和equals()

hashcode()和equals()用来标识对象,两个方法协同工作用来判断两个对象是否相等。对象通过调用 object.hashcode()生成哈希值,由于不可避免地会存在哈希值冲突的情况 因此hashcode 相同时 还需要再调用 equals 进行一次值的比较,但是若hashcode不同,将直接判定两个对象不同,跳过 equals ,这加快了冲突处理效率。 object 类定义中对 hashcode和 equals 要求如下:

  • 如果两个对象的equals的结果是相等的,则两个对象的 hashcode 的返回结果也必须是相同的。
  • 任何时候重写equals,都必须同时重写hashcode。

下面看一个小例子:

import java.util.hashmap;
import java.util.objects;

/**
 * @author mazouri
 * @create 2021-08-10 23:59
 */
public class person {
    //用户id,唯一确定用户
    private string id;
    private string name;

    public person(string id, string name) {
        this.id = id;
        this.name = name;
    }

    @override
    public boolean equals(object o) {
        if (this == o) return true;
        if (!(o instanceof person)) return false;
        person person = (person) o;
        return objects.equals(id, person.id) && objects.equals(name, person.name);
    }

    public static void main(string[] args) {
        hashmap<person, integer> map = new hashmap<>();
        //key:person类型  value:integer类型
        map.put(new person("1","张三"),100);
        system.out.println(map.get(new person("1", "张三")));
    }
}

我们将person类的实例作为key,value为这个对象的考试成绩。我们期望通过map.get(new person("1", "张三"))获取该对象的考试成绩,但上面代码的输出结果为null。原因就在于person类中没有覆盖hashcode方法,从而导致两个相等的实例具有不同的哈希值。hashmap中get()的核心代码如下

if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))
     return first;

if条件表达式中的e.hash == hash是先决条件,只有相等才会执行&&后面的代码。equals不相等时并不强制要求哈希值相等,但是一个优秀的哈希算法应尽可能让元素均匀分布,降低冲突发生的概率,即在equals不相等时尽量让哈希值也不相等,这样&&或||短路操作一旦生效,会极大提高程序的效率。像上面的例子,因为没有重写hashcode方法,两个对象有两个哈希值,获取对象时可能在别的哈希桶中查找,即使凑巧在一个哈希桶,因为哈希值不一样,也找不到原来那一个对象。
你可以根据你自己的需求设计重写hashcode方法,或者调用jdk提供好的,比如

  @override
    public int hashcode() {
        return objects.hash(id, name);
    }

这样就能解决问题,但是这个运行速度慢一些,因为它们会引发数组的创建,以便传入数目可变的参数, 如果参数中有基本类型,还需要装箱和拆箱 ,建议只将这类散列函数用于不太注重性能的情况。

重写的hashcode()方法

java为许多常用的数据类型重写了hashcode()方法,比如string,integer,double等。比如在integer类中哈希值就是其int类型的数据。

  public static int hashcode(int value) {
        return value;
    }

总结

本篇文章就到这里了,希望能给你带来帮助,也希望您能够多多关注的更多内容!

相关标签: Object hashCode()