HashMap原理

程序员文章站 2022-06-04 18:50:07

...

有一次被问到HashMap的实现原理，没回答出来。今天看了一下源码，记录如下：

首先看get方法，看其如何找到值对象。

得到key的哈希值
根据哈希值计算得到索引
从数组里取得一个Entry，并且该entry是一个链表。

public V get(Object key) {
        if (key == null)
            return getForNullKey();
        int hash = hash(key.hashCode());//获取哈希值
        for (Entry<K,V> e = table[indexFor(hash, table.length)];//根据哈希值得到索引
             e != null;
             e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
                return e.value;
        }
        return null;
    }

由此可知HashMap的基本数据结构就是一个一维数组，并且数组上每个元素都可能是一个单向链表的头。每个链表上存放的元素都是Key的哈希值相同的对象。（由此基本可以回答面试问题了）

继续看hash方法：

/**
     * Applies a supplemental hash function to a given hashCode, which
     * defends against poor quality hash functions.  This is critical
     * because HashMap uses power-of-two length hash tables, that
     * otherwise encounter collisions for hashCodes that do not differ
     * in lower bits. Note: Null keys always map to hash 0, thus index 0.
     */
    static int hash(int h) {
        // This function ensures that hashCodes that differ only by
        // constant multiples at each bit position have a bounded
        // number of collisions (approximately 8 at default load factor).
        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }

这个方法很奇特，用到了“>>>”这样的无符号右移位操作符，不管什么花招，目的只有一个：为了防止某些hashcode算法太糟糕，低位不变化（从二进制角度看），所以进行移位操作，把高位和低位的数据进行混乱合并，最终把高位反映到低位部分来。为什么要这么做呢？因为hashmap的另一个函数indexFor只管低位数据。

static int indexFor(int h, int length) {
        return h & (length-1);
    }

这个计算索引的方法，简单粗暴的用本质上就是求余数的方法，得到索引。虽然这里用了位操作，我想那是为了效率。

接着看put方法，我最感兴趣的是新增一个数据达到临界点需要扩大数组的情况，重点在这个resize方法里：

void resize(int newCapacity) {
        Entry[] oldTable = table;
        int oldCapacity = oldTable.length;
        if (oldCapacity == MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return;
        }

        Entry[] newTable = new Entry[newCapacity];
        transfer(newTable);
        table = newTable;
        threshold = (int)(newCapacity * loadFactor);
    }

看过以后，发现其实也很简单，分配一个新的数组，把数据都转移到新的数组里。resize既管扩大，也管缩小。

上一篇：吃什么食物对上火有好处

下一篇： SQL注入的2个小Trick及示例总结

HashMap原理

Java之HashMap源码分析（第五篇:访问元素）

PDO防注入原理分析以及注意事项，pdo注入_PHP教程

javascript设计模式 – 享元模式原理与用法实例分析

javascript设计模式 – 职责链模式原理与用法实例分析

JavaScript ES6 Class类实现原理详解

javascript设计模式 – 代理模式原理与用法实例分析

javascript设计模式 – 迭代器模式原理与用法实例分析

php中的ini配置原理详解_PHP

Vue.mixin Vue.extend(Vue.component)的原理与区别

交换机的基本原理及配置