HashMap底层实现原理

程序员文章站 2022-06-04 19:56:26

...

HashMap的出现

在线性表（数组，链表等），树中，关键字与其它的存放位置不存在对应的关系，在查找关键字的时候需要逐个比对，虽然出现了二分查找等各种提高效率的的查找算法，但这些并不够，我们需要查找关键时候不需进行比对，一次找到，因此把关键字和其对应的存储位置间建立对应的关系，由此哈希表应运而生。

数据结构中有数组和链表来实现对数据的存储，但这两者基本上是两个极端。

数组

存储区间是连续的，占用内存严重，故空间复杂的很大。但数组的二分查找时间复杂度小，为O(1)；数组的特点是：寻址容易，插入和删除困难

链表：

链表存储区间离散，占用内存比较宽松，故空间复杂度很小，但时间复杂度很大，达O（N）。链表的特点是：寻址困难，插入和删除容易。

综合两者的特性，做出一种寻址容易，插入删除也容易的数据结构——哈希表
哈希表（(Hash table）既满足了数据的查找方便，同时不占用太多的内容空间，使用也十分方便。
哈希表有多种不同的实现方法，我接下来解释的是最常用的一种方法—— 拉链法，我们可以理解为“链表的数组”，长度为16，每个元素存储的是一个链表的头结点。

HashMap 采用一种所谓的“Hash 算法”来决定每个元素的存储位置。当程序执行 map.put(String,Obect)方法时，系统将调用String的 hashCode() 方法得到其 hashCode 值——每个 Java 对象都有 hashCode() 方法，都可通过该方法获得它的 hashCode 值。得到这个对象的 hashCode 值之后，系统会根据该 hashCode 值来决定该元素的存储位置。源码如下:

 public V put(K key, V value) {  
        if (key == null)  
            return putForNullKey(value);  
        int hash = hash(key.hashCode());  
        int i = indexFor(hash, table.length);  
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {  
            Object k;  
            //判断当前确定的索引位置是否存在相同hashcode和相同key的元素，如果存在相同的hashcode和相同的key的元素，那么新值覆盖原来的旧值，并返回旧值。  
            //如果存在相同的hashcode，那么他们确定的索引位置就相同，这时判断他们的key是否相同，如果不相同，这时就是产生了hash冲突。  
            //Hash冲突后，那么HashMap的单个bucket里存储的不是一个 Entry，而是一个 Entry 链。  
            //系统只能必须按顺序遍历每个 Entry，直到找到想搜索的 Entry 为止——如果恰好要搜索的 Entry 位于该 Entry 链的最末端（该 Entry 是最早放入该 bucket 中），  
            //那系统必须循环到最后才能找到该元素。  
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {  
                V oldValue = e.value;  
                e.value = value;  
                return oldValue;  
            }  
        }  
        modCount++;  
        addEntry(hash, key, value, i);  
        return null;  
    }

上面程序中用到了一个重要的内部接口：Map.Entry，每个 Map.Entry 其实就是一个 key-value 对。从上面程序中可以看出：当系统决定存储 HashMap 中的 key-value 对时，完全没有考虑 Entry 中的 value，仅仅只是根据 key 来计算并决定每个 Entry 的存储位置。这也说明了前面的结论：我们完全可以把 Map 集合中的 value 当成 key 的附属，当系统决定了 key 的存储位置之后，value 随之保存在那里即可。

hashmap解决hash冲突采用的是链地址法， HashMap里面没有出现hash冲突时，没有形成单链表时，hashmap查找元素很快,get()方法能够直接定位到元素，但是出现单链表后，单个bucket 里存储的不是一个 Entry，而是一个 Entry 链，系统只能必须按顺序遍历每个 Entry，直到找到想搜索的 Entry 为止——如果恰好要搜索的 Entry 位于该 Entry 链的最末端（该 Entry 是最早放入该 bucket 中），那系统必须循环到最后才能找到该元素。

当创建 HashMap 时，有一个默认的负载因子（load factor），其默认值为 0.75，这是时间和空间成本上一种折衷：增大负载因子可以减少 Hash 表（就是那个 Entry 数组）所占用的内存空间，但会增加查询数据的时间开销，而查询是最频繁的的操作（HashMap 的 get() 与 put() 方法都要用到查询）；减小负载因子会提高数据查询的性能，但会增加 Hash 表所占用的内存空间。

HashMap存储数据的容器是一个线性数组，一般情况是通过hash(key)&len-1获得，也就是元素的key的哈希值对数组长度取模得到。

线性的数组怎么实现按键值对来存取数据呢？

HashMap里面实现一个静态内部类Entry，其重要的属性有 key , value, next，
从属性key,value我们就能很明显的看出来Entry就是HashMap键值对实现的一个基础bean，我们上面说到HashMap的基础就是一个线性数组，这个数组就是Entry[]，Map里面的内容都保存在Entry[]里面。

如果两个key通过hash%Entry[].length得到的index相同，会不会有覆盖的危险？

这里HashMap里面用到链式数据结构的一个概念。上面我们提到过Entry类里面有一个next属性，作用是指向下一个Entry。打个比方，第一个键值对A进来，通过计算其key的hash得到的index=0，记做:Entry[0] = A。一会后又进来一个键值对B，通过计算其index也等于0，现在怎么办？HashMap会这样做:B.next = A,Entry[0] = B,如果又进来C,index也等于0,那么C.next = B,Entry[0] = C；这样我们发现index=0的地方其实存取了A,B,C三个键值对,他们通过next这个属性链接在一起。所以疑问不用担心。也就是说数组中存储的是最后插入的元素。此外方式长度不够，HashMap里面设置一个因子，随着map的size越来越大，Entry[]会以一定的规则加长长度。

hashMap是可以存储null值的，null key总是存放在Entry[]数组的第一个元素。，但是hashTable不可以。

https://blog.csdn.net/xie_xiansheng/article/details/71747346?locationNum=3&fps=1

HashMap底层实现原理

HashMap的出现

数组

链表：

线性的数组怎么实现按键值对来存取数据呢？

如果两个key通过hash%Entry[].length得到的index相同，会不会有覆盖的危险？

hashMap是可以存储null值的，null key总是存放在Entry[]数组的第一个元素。，但是hashTable不可以。

IOS图片无限轮播器的实现原理

Yii支持多域名cors原理的实现

并发编程CountDownLatch，CyclicBarrier，Semaphore实现原理分析

Java中增强for循环的实现原理和坑详解

Spring Cache的基本使用与实现原理详解

Java笛卡尔积算法原理与实现方法详解

浅谈Java 并发的底层实现

android书架效果实现原理与代码

Python字典的核心底层原理讲解

android IntentService实现原理及内部代码分享

HashMap底层实现原理

HashMap的出现

数组

链表：

线性的数组怎么实现按键值对来存取数据呢？

如果两个key通过hash%Entry[].length得到的index相同，会不会有覆盖的危险？

hashMap是可以存储null值的，null key总是存放在Entry[]数组的第一个元素。 ，但是hashTable不可以。

IOS图片无限轮播器的实现原理

Yii支持多域名cors原理的实现

并发编程CountDownLatch，CyclicBarrier，Semaphore实现原理分析

Java中增强for循环的实现原理和坑详解

Spring Cache的基本使用与实现原理详解

Java笛卡尔积算法原理与实现方法详解

浅谈Java 并发的底层实现

android书架效果实现原理与代码

Python字典的核心底层原理讲解

android IntentService实现原理及内部代码分享

hashMap是可以存储null值的，null key总是存放在Entry[]数组的第一个元素。，但是hashTable不可以。