欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

HashMap的put和get方法原理

程序员文章站 2022-05-25 11:47:47
...

概述


JAVA中的数组,在添加或者删除元素的时候,都会复制一个新数组,比较耗内存。但是数组的遍历则是非常高效的。链表则是相反,遍历慢(需要遍历数组,一直找到值相等的元素才算找到),而添加和删除元素代价低。

有没有办法结合两者的特点,做到寻找元素快,插入元素或者删除元素代价低呢?答案是利用哈利表


HashMap put操作


HashMap的put和get方法原理

当使用HashMapput方法的时候,有两个问题要解决:

1、长度为16的数组中,元素存储在哪个位置 
2、如果key出现hash冲突,如何解决

第一个问题,HashMap 是使用下面的算法来计算元素的存放位置的。

<span style="color:#000000"><code> int <span style="color:#4f4f4f">hash</span> = <span style="color:#4f4f4f">hash</span>(key);
 int i = indexFor(<span style="color:#4f4f4f">hash</span>, table.length);</code></span>

首先先hash,之后结合数组的长度进行一个&操作得到得到数组的下标。

第二个问题 则利用Entry类的next变量来实现链表,把最新的元素放到链表头,旧的数据则被最新的元素的next变量引用着。 
举个例子,假设元素Entry<"1","1">通过hash算法算出存到下标为0的位置上,后面又添加一个Entry<"2","2">
假设Entry<"2","2">通过hash算法算出也需要存到下标为0的数组中,那么此时链表是下面这个样子的:

Entry<”2”,”2”> –> Entry<”1”,”1”>

也即是说,当key出现hash冲突的时候,链表中的第一个元素都是后面最新添加进来的那个,之前的则被next变量引用着。虽然这里是插入的动作,但是由于使用了链表,所以无需像数组的插入那样,进行数组拷贝。


HashMap get操作


这个操作的原理就比较简单,只需要根据keyhashcode算出元素在数组中的下标,之后遍历Entry对象链表,直到找到元素为止。

<span style="color:#000000"><code>
int <span style="color:#4f4f4f">hash</span> = (key == null) ? <span style="color:#006666">0</span> : <span style="color:#4f4f4f">hash</span>(key);
<span style="color:#000088">for</span> (Entry<K,V> e = table[indexFor(<span style="color:#4f4f4f">hash</span>, table.length)];e != null;e = e.next) {
    Object k;
    <span style="color:#000088">if</span> (e.hash == <span style="color:#4f4f4f">hash</span> &&
        ((k = e.key) == key || (key != null && key.equals(k))))
        <span style="color:#000088">return</span> e;
}
</code></span>

这里有两个注意点: 
1、这里利用keyhashcode方法和equals方法,所以在使用HashMap的时候,如果使用对象作为key,最好覆写keyhashcodeequals方法 
不然可能出putHashMap的时候,成功了,但是get的时候却没有找到数据 
2、如果key hash冲突太多,会造成链表过长,在链表中查找元素的时候,会比较慢


hash冲突后优化方案


如果出现了大量hash冲突,那么遍历链表的时候,会比较慢。JDK 1.8里面,当链表的长度大于阀值(默认为8)的时候,会使用红黑树来存储数据,以便加快key的查询速度。


总结


HashMap使用了数组+链表的方案,做到了读取快,插入快的目的,但是HashMap还是一些使用上的问题的: 
1、线程不安全 
2、当容量不够时,会进行rehash的流程,非常耗资源