探究HashMap线性不安全（一）——重温HashMap的put操作

程序员文章站 2022-06-20 23:27:19

内容网上很多资料都详细地讲解了HashMap底层的实现，但是讲到HashMap的并发操作不是线性安全时，往往一笔带过：在多个线程并发扩容时，会在执行transfer()方法转移键值对时，造成链表成环，导致程序在执行get操作时形成死循环。对于没有研究过该过程的童鞋，很难费解这句话的含义。 ......

内容

　　网上很多资料都详细地讲解了hashmap底层的实现，但是讲到hashmap的并发操作不是线性安全时，往往一笔带过：在多个线程并发扩容时，会在执行transfer()方法转移键值对时，造成链表成环，导致程序在执行get操作时形成死循环。

　　对于没有研究过该过程的童鞋，很难费解这句话的含义。下面笔者分四个小节带着大家共同研究一下jdk1.7和jdk1.8版本下hashmap的线性不安全是怎么发生的，并详细探究链表成环的形成过程。如果你对于hashmap底层的put、get操作不清楚，建议先学习参考1中的内容。

适合人群

　　java进阶

参考

　　1、 hashmap底层数据结构原理

　　2、为什么hashmap非线程安全

　　 3、 hashmap并发情况下的成环原因（笔者认为该文是一种误解）

正文

　　了解过hashmap底层实现的童鞋都知道，向hashmap存入键值对时，如果当前map中键值对的个数size已经大于等于扩容的阈值threshold，并且对应链表上数据不为空时，线程会执行resize()方法对hashmap扩容。过程如下：

 1 public v put(k key, v value) {
 2     //判断key是否为null，如果是null则将该键值对存放到到index为0的位置上
 3     if (key == null)
 4         return putfornullkey(value);
 5     //计算key的hash值
 6     int hash = hash(key);
 7     //对hash值取模求key对应的index
 8     int i = indexfor(hash, table.length);
 9     //判断key是否已经存在，若存在则覆盖对应的value值，并返回旧value值
10     for (entry<k,v> e = table[i]; e != null; e = e.next) {
11         object k;
12         if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
13             v oldvalue = e.value;
14             e.value = value;
15             e.recordaccess(this);
16             return oldvalue;
17         }
18     }
19     
20     modcount++;
21     //若键值对不存在，则插入到table中
22     addentry(hash, key, value, i);
23     return null;
24 }

 1 void addentry(int hash, k key, v value, int bucketindex) {
 2     //扩容的两个条件：map中键值对的个数size已经大于等于扩容的阈值threshold，table的当前位置上已经存在键值对。
 3     if ((size >= threshold) && (null != table[bucketindex])) {
 4         //扩容操作具体由resize()方法执行。
 5         resize(2 * table.length);
 6         hash = (null != key) ? hash(key) : 0;
 7         bucketindex = indexfor(hash, table.length);
 8     }
 9      //将键值对存入到指定index位置的链上
10     createentry(hash, key, value, bucketindex);
11 }

　　resize()方法中的transfer()方法用于将oldtable中的原有键值对信息复制到扩容后的newtable中。

 1 void resize(int newcapacity) {    
 2     //使用oldtable指向扩容前的table
 3     entry[] oldtable = table;
 4     int oldcapacity = oldtable.length;
 5     //如果hashmap的容量已经达到最大值，那么将扩容阈值threshold设置为integer的最大值
 6     if (oldcapacity == maximum_capacity) {
 7         threshold = integer.max_value;
 8         return;
 9     }
10     //按照传入的容量，创建新的table
11     entry[] newtable = new entry[newcapacity];
12     //usealthashing在初始化后为false
13     boolean oldalthashing = usealthashing;
14     usealthashing |= sun.misc.vm.isbooted() &&
15             (newcapacity >= holder.alternative_hashing_threshold);
16     //jvm启动后，但由于扩容后的容量newcapacity<alternative_hashing_threshold，usealthashing也为false
17     //false与false异或，rehash=false，因此不会对key值重新进行hash计算。
18     boolean rehash = oldalthashing ^ usealthashing;
19     //进行新旧table数据的迁移
20     transfer(newtable, rehash);
21     //将table指向迁移后的newtable
22     table = newtable;
23     //按照计算公式为newcapacity * loadfactor更新扩容阈值threshold
24     threshold = (int)math.min(newcapacity * loadfactor, maximum_capacity + 1);
25 }

　　通过调试可知holder.alternative_hashing_threshold为integer.max_value

　　因此默认情况下rehash为false，扩容过程中不会对key值重新计算hash。下一节将详细探究hashmap扩容的键值对迁移过程，多线程并发执行transfer()方法是如何产生环形链表的。

上一篇： PS用滤镜制作漂亮的火焰花朵

下一篇：使用PHP制作新闻系统的思路

探究HashMap线性不安全（一）——重温HashMap的put操作

探究HashMap线性不安全（一）——重温HashMap的put操作

探究HashMap线性不安全（二）——链表成环的详细过程

探究HashMap线性不安全（一）——重温HashMap的put操作