散列集合的HashCode&Equals

程序员文章站 2024-03-22 16:23:04

...

hashCode是什么？

hashCode是jdk根据“对象的地址”算出来的int类型的数值（注意这说的是由 Object 类定义的 hashCode 方法^{该方法的作用就是返回一个哈希码值也就是一串数字}确实会针对不同的对象确实会返回不同的整数。但是如果子类复写了这个方法，那就不一定了，因为鬼知道你会怎么复写这个方法）， public int hashCode()返回该对象的哈希码值。支持此方法是为了提高哈希表（java.util.Hashtable 提供的哈希表）的性能。
　　所以说，不同的对象^{鬼知道你都对这个对象做了什么}可能会生成相同的hashcode值。相同的对象生成的hashcode一定相同

hashCode的作用，以及为什么有时候要复写hashCode？

对于包含容器类型的程序设计语言来说，基本上都会涉及到hashCode。在Java中也一样，hashCode方法的主要作用是为了配合基于散列的集合（无序集合），这样的散列集合包括Set接口，Queue接口，Map接口。
为什么这么说呢？考虑一种情况，当向集合中插入对象时，如何判别在集合中是否已经存在该对象了？（注意：散列集合中不允许重复的元素存在）
　　大多数人都会想到调用equals方法来逐个进行比较，这个方法确实可行。但是如果集合中已经存在一万条数据或者更多的数据，如果采用equals方法去逐一比较，效率必然是一个问题。此时hashCode方法的作用就体现出来了，当集合要添加新的对象时，先调用这个对象的hashCode方法，得到对应的hashcode值，实际上在HashMap的具体实现中会用一个table保存已经存进去的对象的hashcode值，如果table中没有该hashcode值，它就可以直接存进去，不用再进行任何比较了(这样就大大的提升了它的效率)；

那么我们来看一下，如何获一个对象的hashcode（哈希码值）。

以String类为例（它重写了hashCode与equals方法）：

public int hashCode() {
        int h = hash;
        if (h == 0 && count > 0) {
            for (int i = 0; i < count; i++) {
                h = 31 * h + charAt(i);
            }
            hash = h;
        }
        return h;
    }

这就出现了一个很尴尬的问题，只要字符串不一样那么他们的hashcode就不一样吗？
看例子：（根据源码公式转换的哈希码值）
"Aa" = 'A' * 31 + 'a' = 2112
"BB" = 'B' * 31 + 'B' = 2112
答案显然是不一定的，很正常，这是因为String类重写了hashCode方法和equals方法。

重点来喽^{纯属个人理解如有不当请不吝指教}，为什么要重写hashCode方法和equals方法呢？^{反正不是吃饱了撑的}
　　前面已经说了^{当集合要添加新的对象时，先调用这个对象的hashCode方法，得到对应的hashcode值，实际上在HashMap的具体实现中会用一个table保存已经存进去的对象的hashcode值，如果table中没有该hashcode值，它就可以直接存进去，不用再进行任何比较了(这样就大大的提升了它的效率)}，再说一遍省的往上翻。
　　拿String这个类^{这是大牛已经为我们封装好的类，如果你追求性能的话完全可以拿这个类作为参考}来解释一下，假如说String类没有重写这两个方法，会怎么样呢？当然是我new了一个字符串，往某个散列集合里面插，不管字符串的内容是什么都会插进去，因为他们返回的hashCode都不同^{前面有解释为什么会不同}，这样就不能保证散列集合的元素唯一性^{元素唯一性主要是说对象的属性内容而不是说对象,所以复写的hashCode是根据内容生成的}明白了吧。假如String类只复写了hashCode方法，那么“aa”“aa”这两个字符串虽然返回的hashCode是一样的（如果不复写就会不一样可以插进去）因为源码中 :

public boolean equals(Object obj) {
      return (this == obj);
  }
这两个对象引用是不同的肯定返回false，照样插进去，又违背了元素的唯一性

而再String类中

  public boolean equals(Object anObject) {
        if (this == anObject) {
            return true;
        }
        if (anObject instanceof String) {
            String anotherString = (String) anObject;
            int n = count;
            if (n == anotherString.count) {
                int i = 0;
                while (n-- != 0) {
                    if (charAt(i) != anotherString.charAt(i))
                            return false;
                    i++;
                }
                return true;
            }
        }
        return false;
    }
字符串返回true肯定插不进去啊！

总结

说了这么多，其实只要记住散列集合的元素唯一性，主要是说对象的内容。比如String类，通过复写那两个方法，让相同内容的字符串插不进去。如果你的项目性能要求没有到极其严苛的地步时，你设计的实体类没必要复写这两个方法，但是如果不复写的话就算对象属性内容一样，也会插进去。
　　如果你需要集合里面元素内容不一样的话，你就要重写这两个方法。原则和String类的一样。
　　 hashCode 的常规协定是:
　　在 Java 应用程序执行期间，在对同一对象多次调用 hashCode 方法时，必须一致地返回相同的整数，前提是将对象进行 equals 比较时所用的信息没有被修改。从某一应用程序的一次执行到同一应用程序的另一次执行，该整数无需保持一致。
　　如果根据 equals(Object) 方法，两个对象是相等的，那么对这两个对象中的每个对象调用 hashCode 方法都必须生成相同的整数结果。
　　如果根据 equals(java.lang.Object) 方法，两个对象不相等，那么对这两个对象中的任一对象上调用 hashCode 方法不要求一定生成不同的整数结果。但是，程序员应该意识到，为不相等的对象生成不同整数结果可以提高哈希表的性能。
　　实际上，由 Object 类定义的 hashCode 方法确实会针对不同的对象返回不同的整数。（这一般是通过将该对象的内部地址转换成一个整数来实现的，但是 JavaTM 编程语言不需要这种实现技巧。）

上一篇：为运算表达式设计优先级

下一篇： websocket简介博客分类： websocket websocket

散列集合的HashCode&Equals

hashCode是什么？

hashCode的作用，以及为什么有时候要复写hashCode？

总结

散列集合的HashCode&Equals

散列的定义与整数散列

用Hash算法对密码进行散列，以及获取Salt的工具类

shiro的散列算法

散列函数的三种简单实现

一个简单的散列（hashing）函数

基于散列表(线性探查的哈希表和链式散列)的字典实现

PTA 7-43 字符串关键字的散列映射 (25 point(s))

数据结构与算法的JavaScript描述——散列（HashTable）

Python之 for in 循环遍历列表、元组、集合、字典类型的案列

散列集合的HashCode&Equals

hashCode是什么？

hashCode的作用，以及为什么有时候要复写hashCode？

总结

散列集合的HashCode&Equals

散列的定义与整数散列

用Hash算法对密码进行散列，以及获取Salt的工具类

shiro的散列算法

散列函数的三种简单实现

一个简单的散列（hashing）函数

基于散列表(线性探查的哈希表和链式散列)的字典实现

PTA 7-43 字符串关键字的散列映射 (25 point(s))

数据结构与算法的JavaScript描述——散列（HashTable）

Python之 for in 循环遍历 列表、元组、集合、字典类型的案列

Python之 for in 循环遍历列表、元组、集合、字典类型的案列