欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

散列集合的HashCode&Equals

程序员文章站 2024-03-22 16:23:04
...

hashCode是什么?

    hashCode是jdk根据“对象的地址”算出来的int类型的数值(注意这说的是由 Object 类定义的 hashCode 方法该方法的作用就是返回一个哈希码值也就是一串数字确实会针对不同的对象确实会返回不同的整数。但是如果子类复写了这个方法,那就不一定了,因为鬼知道你会怎么复写这个方法), public int hashCode()返回该对象的哈希码值。支持此方法是为了提高哈希表(java.util.Hashtable 提供的哈希表)的性能。
  所以说,不同的对象鬼知道你都对这个对象做了什么可能会生成相同的hashcode值。相同的对象生成的hashcode一定相同

hashCode的作用,以及为什么有时候要复写hashCode?

    对于包含容器类型的程序设计语言来说,基本上都会涉及到hashCode。在Java中也一样,hashCode方法的主要作用是为了配合基于散列的集合(无序集合),这样的散列集合包括Set接口,Queue接口,Map接口。
    为什么这么说呢?考虑一种情况,当向集合中插入对象时,如何判别在集合中是否已经存在该对象了?(注意:散列集合中不允许重复的元素存在)
   大多数人都会想到调用equals方法来逐个进行比较,这个方法确实可行。但是如果集合中已经存在一万条数据或者更多的数据,如果采用equals方法去逐一比较,效率必然是一个问题。此时hashCode方法的作用就体现出来了,当集合要添加新的对象时,先调用这个对象的hashCode方法,得到对应的hashcode值,实际上在HashMap的具体实现中会用一个table保存已经存进去的对象的hashcode值,如果table中没有该hashcode值,它就可以直接存进去,不用再进行任何比较了(这样就大大的提升了它的效率);

那么我们来看一下,如何获一个对象的hashcode(哈希码值)。

以String类为例(它重写了hashCode与equals方法):

public int hashCode() {
        int h = hash;
        if (h == 0 && count > 0) {
            for (int i = 0; i < count; i++) {
                h = 31 * h + charAt(i);
            }
            hash = h;
        }
        return h;
    }

这就出现了一个很尴尬的问题,只要字符串不一样那么他们的hashcode就不一样吗?
看例子:(根据源码公式转换的哈希码值)
"Aa" = 'A' * 31 + 'a' = 2112
"BB" = 'B' * 31 + 'B' = 2112
答案显然是不一定的,很正常,这是因为String类重写了hashCode方法和equals方法。

重点来喽纯属个人理解如有不当请不吝指教,为什么要重写hashCode方法和equals方法呢?反正不是吃饱了撑的
  前面已经说了当集合要添加新的对象时,先调用这个对象的hashCode方法,得到对应的hashcode值,实际上在HashMap的具体实现中会用一个table保存已经存进去的对象的hashcode值,如果table中没有该hashcode值,它就可以直接存进去,不用再进行任何比较了(这样就大大的提升了它的效率),再说一遍省的往上翻。
  拿String这个类这是大牛已经为我们封装好的类,如果你追求性能的话完全可以拿这个类作为参考来解释一下,假如说String类没有重写这两个方法,会怎么样呢?当然是我new了一个字符串,往某个散列集合里面插,不管字符串的内容是什么都会插进去,因为他们返回的hashCode都不同前面有解释为什么会不同,这样就不能保证散列集合的元素唯一性元素唯一性主要是说对象的属性内容而不是说对象,所以复写的hashCode是根据内容生成的明白了吧。假如String类只复写了hashCode方法,那么“aa”“aa”这两个字符串虽然返回的hashCode是一样的(如果不复写就会不一样可以插进去)因为源码中 :

public boolean equals(Object obj) {
      return (this == obj);
  }
这两个对象引用是不同的肯定返回false,照样插进去,又违背了元素的唯一性

而再String类中

  public boolean equals(Object anObject) {
        if (this == anObject) {
            return true;
        }
        if (anObject instanceof String) {
            String anotherString = (String) anObject;
            int n = count;
            if (n == anotherString.count) {
                int i = 0;
                while (n-- != 0) {
                    if (charAt(i) != anotherString.charAt(i))
                            return false;
                    i++;
                }
                return true;
            }
        }
        return false;
    }
字符串返回true肯定插不进去啊!

总结

    说了这么多,其实只要记住散列集合的元素唯一性,主要是说对象的内容。比如String类,通过复写那两个方法,让相同内容的字符串插不进去。如果你的项目性能要求没有到极其严苛的地步时,你设计的实体类没必要复写这两个方法,但是如果不复写的话就算对象属性内容一样,也会插进去。
  如果你需要集合里面元素内容不一样的话,你就要重写这两个方法。原则和String类的一样。
   hashCode 的常规协定是:
   在 Java 应用程序执行期间,在对同一对象多次调用 hashCode 方法时,必须一致地返回相同的整数,前提是将对象进行 equals 比较时所用的信息没有被修改。从某一应用程序的一次执行到同一应用程序的另一次执行,该整数无需保持一致。
  如果根据 equals(Object) 方法,两个对象是相等的,那么对这两个对象中的每个对象调用 hashCode 方法都必须生成相同的整数结果。
  如果根据 equals(java.lang.Object) 方法,两个对象不相等,那么对这两个对象中的任一对象上调用 hashCode 方法不 要求一定生成不同的整数结果。但是,程序员应该意识到,为不相等的对象生成不同整数结果可以提高哈希表的性能。
  实际上,由 Object 类定义的 hashCode 方法确实会针对不同的对象返回不同的整数。(这一般是通过将该对象的内部地址转换成一个整数来实现的,但是 JavaTM 编程语言不需要这种实现技巧。)