JDK1.7的HashMap的put(key, value)源码剖析
目录
hashmap的put操作源码解析
1、官方文档
1.1、继承结构
java.lang.object java.util.abstractmap<k,v> java.util.hashmap<k,v>
1.2、类型参数:
k - 此映射所维护的键的类型 v - 所映射值的类型
2、put(key, value)
hashmap
是一种以键——值
对的形式来存储数据的数据结构。hashmap
允许使用 null 值和 null 键,它并不能保证你存放数据和取出的顺序是一致的。
接下来就以下面的代码来看一下put
是怎么将数据存放到map
中的。
public class hashmaptest { public static void main(string[] args) { map<string, object> map = new hashmap<string, object>(); map.put(null, "map-value"); map.put(map-key", "map-value"); system.out.println(map); } }
2.1、重点源码部分截取
在map.put()
这里打个断点f5(我用的eclipse)
跟踪进去。我们就会进到put
方法中:
public v put(k key, v value) { if (table == empty_table) { inflatetable(threshold); } if (key == null) return putfornullkey(value); int hash = hash(key); int i = indexfor(hash, table.length); for (entry<k,v> e = table[i]; e != null; e = e.next) { object k; if (e.hash == hash && ((k = e.key) == key || key.equals(k))) { v oldvalue = e.value; e.value = value; e.recordaccess(this); return oldvalue; } } modcount++; addentry(hash, key, value, i); return null; }
这里的empty_table
是hashmap
的一个静态常量,是一个entry数组,默认值是空数组,table
是hashmap
的一个属性且其默认值就是empty_table
,这个table也就是我们数据存放的地方,至此为止可以知道,hashmap其实是一个数组,但它又不是一个纯粹的数组。下面会进行解释。
static final entry<?,?>[] empty_table = {}; transient entry<k,v>[] table = (entry<k,v>[]) empty_table;
而这个entry
其实是hashmap的一个内部类,定义如下(仅截取部分代码),记住这个类,记住这个构造方法:它在new entry
的时候接收了一个entry
对象,并将自己的next
指向了传入的entry
对象形成一个链表,其自身是表头。
static class entry<k,v> implements map.entry<k,v> { final k key; v value; entry<k,v> next; int hash; entry(int h, k k, v v, entry<k,v> n) { value = v; next = n; key = k; hash = h; } }
从上面我们可以看出来这个entry
其实是一个链表,它存放了 key 和 value 并且还有一个指向下一个节点的引用 entry
, 剩下的这个 hash
就是 key 的哈希值。
现在我们可以捋一捋hashmap的结构了。首先hashmap
是一个entry
数组,而这个entry
是一个单向链表,我们大致可以将其结构画成如下图所示:
2.2、put(key, value)源码分析
public v put(k key, v value) { if (table == empty_table) { inflatetable(threshold); } if (key == null) return putfornullkey(value); int hash = hash(key); int i = indexfor(hash, table.length); for (entry<k,v> e = table[i]; e != null; e = e.next) { object k; if (e.hash == hash && ((k = e.key) == key || key.equals(k))) { v oldvalue = e.value; e.value = value; e.recordaccess(this); return oldvalue; } } modcount++; addentry(hash, key, value, i); return null; }
- 因为我们在实例化hashmap的时候使用的是无参构造方法,所以第一次
put
数据的时候table
为空
if (table == empty_table) { inflatetable(threshold); }
上面这段代码会被执行,inflatetable(threshold)
会将table
初始化为一个长度为16
的entry
数组。
- 它会对我们的
key
进行空判断,如果是空就会执行下面的代码:
if (key == null) return putfornullkey(value);
putfornullkey(value)
的实现如下:
private v putfornullkey(v value) { for (entry<k,v> e = table[0]; e != null; e = e.next) { if (e.key == null) { v oldvalue = e.value; e.value = value; e.recordaccess(this); return oldvalue; } } modcount++; addentry(0, null, value, 0); return null; } void addentry(int hash, k key, v value, int bucketindex) { if ((size >= threshold) && (null != table[bucketindex])) { resize(2 * table.length); hash = (null != key) ? hash(key) : 0; bucketindex = indexfor(hash, table.length); } createentry(hash, key, value, bucketindex); } void createentry(int hash, k key, v value, int bucketindex) { entry<k,v> e = table[bucketindex]; table[bucketindex] = new entry<>(hash, key, value, e); size++; }
2.2.1 、key
为null
的情况
从上面可以看出来,如果key
为null
的话,它会从table
中取出下标为0也就是第一个元素,没忘记的话我们应该还知道它一个entry
,是一个链表,如果这个元素不是null
,那么就会遍历这个链表,并判断当前这个entry
节点对象的key
是不是null
。
- 如果是
null
(key
相同了): 使用oldvalue
来存放当前这个entry
节点对象的value
,然后将我们新的值(map-value
)赋给当前节点,再将原值oldvalue
返回回去。 - 如果遍历完链表的所有节点都没有找到
key
为null
的节点就会调用addentry(0, null, value, 0)
,这个方法前面的if(){***}
这块代码是判断当前table是否要进行扩容。这里只做简单讲述。
size
是当前table
存放的entry链表的个数,拿我上面画的那个hapshmap
结构来看就是4。
如果我们实例化hashmap的时候没有给大小那么:threshold
=loadfactor
(负载因子默认为0.75f
) *default_initial_capacity
(hashmap默认大小也就是table长度为16
),所以threshold
=12
。
如果我们给了大小为initialcapacity
,那么负载因子还是默认的0.75f
,但是threshold不需要算了,值就是initialcapacity
。如果我们同时给了hashmap
的大小initialcapacity
和负载因子loadfactor
,那么hashmap
就使用我们给定的负载因子值作为新的负载因子,给定的hashmap
大小作为threshold
。ok第一个条件结束。
null != table[bucketindex]
就很好理解了,就是我当前这个节点要存放的位置是空的。
满足上面两个条件,hashmap
就会进行扩容,扩容后的大小为扩容前的2倍,然后对key
重新计算它的hash
值以及数组下标。 - 继续
put
内容,从上面源码我们可以知道key
为null
的情况下它的hash
值是0,至于bucketindex
的计算是这样的h & (length-1)
,也是将hash
值与table
的长度按位相与值也是。至此也就是确定了key
为null
的这个节点将存放在table的第一个位置上。然后就会调用createentry(0, null, "map-value", 0);
- 在
createentry(int hash, k key, v value, int bucketindex)
这个方法里首先拿到table
中下标为bucketindex
的链表的表头:entry<k,v> e = table[bucketindex];
然后再用entry
对象的构造方法new
一个entry
将我们的hash
值,key
,value
,链表的表头作为参数传入:table[bucketindex] = new entry<>(hash, key, value, e);
就这样我们的这个新节点就放在了原来的表头的前面作为新的表头了。没看懂的再回到上面看一下entry
的构造方法,我有重点标注的。
2.2.2、 key
不为null
的情况
源码依旧拿下来
public v put(k key, v value) { if (table == empty_table) { inflatetable(threshold); } if (key == null) return putfornullkey(value); int hash = hash(key); int i = indexfor(hash, table.length); for (entry<k,v> e = table[i]; e != null; e = e.next) { object k; if (e.hash == hash && ((k = e.key) == key || key.equals(k))) { v oldvalue = e.value; e.value = value; e.recordaccess(this); return oldvalue; } } modcount++; addentry(hash, key, value, i); return null; }
- 首先说一下
hash
值:对于相同的key
它们的hash
值是相同的。但是hash
值相同,它们的key
却不一定是相同的,这就是哈希碰撞。 -
key
不为null
的话它会根据key
算出这个key
对就的hash
值以及它的bucketindex
,然后拿到table
中下标为bucketindex
的这个entry
链表,然后遍历这个链表,判断当前节点的hash
其实也就是当前节点的key
的hash
是否等于我们传入的map-key
的hash
,然后判断当前节点的key
是否与我们传入的key
相同。
如果以上条件都满足了,那么就是key
相同了,就会跟key
为null
的分析中的第一条一样将新值覆盖旧值,并将旧值返回回去。
如果遍历完这个链表以上条件没有得到满足,那么就会跟key
为null
的分析中的第四条一样,获得table
下标为i
的链表的表头e
,然后将我们的map-key
,map-value
,hash
以及表头e
作为参数new
一个新的entry
对象并将它的next
指向原来的表头e
,它也就变成了新的表头了。
3、完结
最怕你的能力配不上你的野心。