JDK1.7的HashMap的put(key, value)源码剖析

程序员文章站 2022-06-27 14:23:38

HashMap的put操作源码解析 [toc] 1、官方文档 1.1、继承结构 1.2、类型参数： 2、put(key, value) HashMap是一种以键——值对的形式来存储数据的数据结构。HashMap允许使用 null 值和 null 键，它并不能保证你存放数据和取出的顺序是一致的。接下 ......

hashmap的put操作源码解析

hashmap的put操作源码解析

1、官方文档

1.1、继承结构

java.lang.object
  java.util.abstractmap<k,v>
      java.util.hashmap<k,v>

1.2、类型参数：

k - 此映射所维护的键的类型
v - 所映射值的类型

2、put(key, value)

hashmap是一种以键——值对的形式来存储数据的数据结构。hashmap允许使用 null 值和 null 键，它并不能保证你存放数据和取出的顺序是一致的。

接下来就以下面的代码来看一下put是怎么将数据存放到map中的。

public class hashmaptest {
    public static void main(string[] args) {
        map<string, object> map = new hashmap<string, object>();
        map.put(null, "map-value");
        map.put(map-key", "map-value");
        
        system.out.println(map);
    }
}

2.1、重点源码部分截取

在map.put()这里打个断点f5(我用的eclipse)跟踪进去。我们就会进到put方法中：

public v put(k key, v value) {
    if (table == empty_table) {
        inflatetable(threshold);
    }
    if (key == null)
        return putfornullkey(value);
    int hash = hash(key);
    int i = indexfor(hash, table.length);
    for (entry<k,v> e = table[i]; e != null; e = e.next) {
        object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            v oldvalue = e.value;
            e.value = value;
            e.recordaccess(this);
            return oldvalue;
        }
    }

    modcount++;
    addentry(hash, key, value, i);
    return null;
}

这里的empty_table是hashmap的一个静态常量，是一个entry数组，默认值是空数组，table是hashmap的一个属性且其默认值就是empty_table，这个table也就是我们数据存放的地方，至此为止可以知道，hashmap其实是一个数组，但它又不是一个纯粹的数组。下面会进行解释。

static final entry<?,?>[] empty_table = {};

transient entry<k,v>[] table = (entry<k,v>[]) empty_table;

而这个entry其实是hashmap的一个内部类，定义如下(仅截取部分代码)，记住这个类，记住这个构造方法：它在new entry的时候接收了一个entry对象，并将自己的next指向了传入的entry对象形成一个链表，其自身是表头。

static class entry<k,v> implements map.entry<k,v> {
        final k key;
        v value;
        entry<k,v> next;
        int hash;

        entry(int h, k k, v v, entry<k,v> n) {
            value = v;
            next = n;
            key = k;
            hash = h;
        }
}

从上面我们可以看出来这个entry其实是一个链表，它存放了 key 和 value 并且还有一个指向下一个节点的引用 entry，剩下的这个 hash 就是 key 的哈希值。

现在我们可以捋一捋hashmap的结构了。首先hashmap是一个entry数组，而这个entry是一个单向链表，我们大致可以将其结构画成如下图所示：

JDK1.7的HashMap的put(key, value)源码剖析

2.2、put(key, value)源码分析

public v put(k key, v value) {
    if (table == empty_table) {
        inflatetable(threshold);
    }
    
    if (key == null)
        return putfornullkey(value);
    int hash = hash(key);
    int i = indexfor(hash, table.length);
    for (entry<k,v> e = table[i]; e != null; e = e.next) {
        object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            v oldvalue = e.value;
            e.value = value;
            e.recordaccess(this);
            return oldvalue;
        }
    }

    modcount++;
    addentry(hash, key, value, i);
    return null;
}

因为我们在实例化hashmap的时候使用的是无参构造方法，所以第一次 put 数据的时候table为空

if (table == empty_table) {
    inflatetable(threshold); 
}

上面这段代码会被执行，inflatetable(threshold) 会将table初始化为一个长度为16的entry数组。

它会对我们的key进行空判断，如果是空就会执行下面的代码：

if (key == null)
        return putfornullkey(value);

putfornullkey(value) 的实现如下：

private v putfornullkey(v value) {
    for (entry<k,v> e = table[0]; e != null; e = e.next) {
        if (e.key == null) {
            v oldvalue = e.value;
            e.value = value;
            e.recordaccess(this);
            return oldvalue;
        }
    }
    modcount++;
    addentry(0, null, value, 0);
    return null;
}

void addentry(int hash, k key, v value, int bucketindex) {
    if ((size >= threshold) && (null != table[bucketindex])) {
        resize(2 * table.length);
        hash = (null != key) ? hash(key) : 0;
        bucketindex = indexfor(hash, table.length);
    }

    createentry(hash, key, value, bucketindex);
}

void createentry(int hash, k key, v value, int bucketindex) {
    entry<k,v> e = table[bucketindex];
    table[bucketindex] = new entry<>(hash, key, value, e);
    size++;
}

2.2.1 、`key`为`null`的情况

从上面可以看出来，如果key为null的话，它会从table中取出下标为0也就是第一个元素，没忘记的话我们应该还知道它一个entry，是一个链表，如果这个元素不是null，那么就会遍历这个链表，并判断当前这个entry节点对象的key是不是null。

如果是null(key相同了)：使用oldvalue来存放当前这个entry节点对象的value，然后将我们新的值(map-value)赋给当前节点，再将原值oldvalue返回回去。
如果遍历完链表的所有节点都没有找到key为null的节点就会调用addentry(0, null, value, 0)，这个方法前面的if(){***}这块代码是判断当前table是否要进行扩容。这里只做简单讲述。

size是当前table存放的entry链表的个数，拿我上面画的那个hapshmap结构来看就是4。

如果我们实例化hashmap的时候没有给大小那么：threshold = loadfactor(负载因子默认为0.75f) * default_initial_capacity(hashmap默认大小也就是table长度为16)，所以threshold = 12。

如果我们给了大小为initialcapacity，那么负载因子还是默认的0.75f，但是threshold不需要算了，值就是initialcapacity。如果我们同时给了hashmap的大小initialcapacity和负载因子loadfactor，那么hashmap就使用我们给定的负载因子值作为新的负载因子，给定的hashmap大小作为threshold。ok第一个条件结束。

null != table[bucketindex]就很好理解了，就是我当前这个节点要存放的位置是空的。

满足上面两个条件，hashmap就会进行扩容，扩容后的大小为扩容前的2倍，然后对key重新计算它的hash值以及数组下标。
继续put内容，从上面源码我们可以知道key为null的情况下它的hash值是0，至于bucketindex的计算是这样的h & (length-1)，也是将hash值与table的长度按位相与值也是。至此也就是确定了key为null的这个节点将存放在table的第一个位置上。然后就会调用createentry(0, null, "map-value", 0);
在createentry(int hash, k key, v value, int bucketindex)这个方法里首先拿到table中下标为bucketindex的链表的表头：entry<k,v> e = table[bucketindex];然后再用entry对象的构造方法new一个entry将我们的hash值，key，value，链表的表头作为参数传入：table[bucketindex] = new entry<>(hash, key, value, e);就这样我们的这个新节点就放在了原来的表头的前面作为新的表头了。没看懂的再回到上面看一下entry的构造方法，我有重点标注的。

2.2.2、 `key`不为`null`的情况

源码依旧拿下来

public v put(k key, v value) {
    if (table == empty_table) {
        inflatetable(threshold);
    }
    
    if (key == null)
        return putfornullkey(value);
    int hash = hash(key);
    int i = indexfor(hash, table.length);
    for (entry<k,v> e = table[i]; e != null; e = e.next) {
        object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            v oldvalue = e.value;
            e.value = value;
            e.recordaccess(this);
            return oldvalue;
        }
    }

    modcount++;
    addentry(hash, key, value, i);
    return null;
}

首先说一下hash值：对于相同的key它们的hash值是相同的。但是hash值相同，它们的key却不一定是相同的，这就是哈希碰撞。
key不为null的话它会根据key算出这个key对就的hash值以及它的bucketindex，然后拿到table中下标为bucketindex的这个entry链表，然后遍历这个链表，判断当前节点的hash其实也就是当前节点的key的hash是否等于我们传入的map-key的hash，然后判断当前节点的key是否与我们传入的key相同。

如果以上条件都满足了，那么就是key相同了，就会跟key为null的分析中的第一条一样将新值覆盖旧值，并将旧值返回回去。

如果遍历完这个链表以上条件没有得到满足，那么就会跟key为null的分析中的第四条一样，获得table下标为i的链表的表头e，然后将我们的map-key, map-value, hash以及表头e作为参数new一个新的entry对象并将它的next指向原来的表头e，它也就变成了新的表头了。

3、完结

最怕你的能力配不上你的野心。

上一篇：【Python3爬虫】selenium入门

下一篇： Java 并发编程的可见性、有序性和原子性

JDK1.7的HashMap的put(key, value)源码剖析

hashmap的put操作源码解析

1、官方文档

1.1、继承结构

1.2、类型参数：

2、put(key, value)

2.1、重点源码部分截取

2.2、put(key, value)源码分析

2.2.1 、`key`为`null`的情况

2.2.2、 `key`不为`null`的情况

3、完结

基于JDK1.7的HashMap源码详解