Java 集合类Hashmap
一.hashmap 简介
hashmap在程序员的开发过程中是一个十分常用的集合类,它是一个以键值对形式存在的集合类,
在开发中我们可以利用的它的一个key存在即替换的特性,实现一个更新的去重的操作。
在另一个方便我们可以利用map跟fastjson快速组成我们所需的json数据格式。
在jdk1.8之前,hashmap是以数组+链表的形式存在,put进来的key的hashcode进过扰动函数计算后得到hash值,然后该值通过(n-1)&hash计算后的到相应的位置(n代表的是数组长度),
如果发生了hash冲突,则先判断该key是否存在,如果存在那么就覆盖,否则以“拉链法”解决冲突,便组成了链表。
但在jdk1.8之后,hashmap就发生了改变,如果当前链表的长度大于阈值(默认是8)那么该链表就转换成红黑树,加快了搜索速度。
二.hashmap属性
//hashmap的默认初始容量 2^4=16
static final int default_initial_capacity = 1 << 4; // aka 16
//hashmap的最大容量
static final int maximum_capacity = 1 << 30;
//默认的装载因子当数组长度
static final float default_load_factor = 0.75f;
// 当桶(bucket)上的结点数大于这个值时会转成红黑树
static final int treeify_threshold = 8;
// 当桶(bucket)上的结点数小于这个值时树转链表
static final int untreeify_threshold = 6;
// 桶中结构转化为红黑树对应的table的最小大小
static final int min_treeify_capacity = 64;
// 存储元素的数组,总是2的幂次倍
transient node<k,v>[] table;
// 存放具体元素的集
transient set<map.entry<k,v>> entryset;
// 存放元素的个数,注意这个不等于数组的长度。
transient int size;
// 每次扩容和更改map结构的计数器
transient int modcount;
// 临界值 当实际大小(容量*填充因子)超过临界值时,会进行扩容(*当size
大于等于threshold
的时候,并不一定会触发扩容机制,但是会很可能就触发扩容机制,只要有一个新建的entry
出现哈希冲突,则立刻resize
)
int threshold;
// 填充因子 当size>=threshold的时候,那么就要考虑对数组的扩增了,也就是说,这个的意思就是 衡量数组是否需要扩增的一个标准
final float loadfactor;
三.hashmap的扩容机制
public hashmap(int initialcapacity, float loadfactor) {
if (initialcapacity < 0)
throw new illegalargumentexception("illegal initial capacity: " +
initialcapacity);
if (initialcapacity > maximum_capacity)
initialcapacity = maximum_capacity;
if (loadfactor <= 0 || float.isnan(loadfactor))
throw new illegalargumentexception("illegal load factor: " +
loadfactor);
this.loadfactor = loadfactor;
this.threshold = tablesizefor(initialcapacity);
}
其中tablesizefor这个代码是:
static final int tablesizefor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= maximum_capacity) ? maximum_capacity : n + 1;
}
>>>是一个无视符号位的位右移动符号 |= 是左右两个数进行&操作
这个方法会把你传进来的初始化容量变成一个是2的平方次幂的数 所以这里就固定死了hashmap的容量必须是2的平方次幂
至于为什么是2的平方次幂的数原因如下:
1.put方法源码:
final v putval(int hash, k key, v value, boolean onlyifabsent,
boolean evict) {
node<k,v>[] tab; node<k,v> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newnode(hash, key, value, null);
else {
node<k,v> e; k k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof treenode)
e = ((treenode<k,v>)p).puttreeval(this, tab, hash, key, value);
else {
for (int bincount = 0; ; ++bincount) {
if ((e = p.next) == null) {
p.next = newnode(hash, key, value, null);
if (bincount >= treeify_threshold - 1) // -1 for 1st
treeifybin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
v oldvalue = e.value;
if (!onlyifabsent || oldvalue == null)
e.value = value;
afternodeaccess(e);
return oldvalue;
}
}
++modcount;
if (++size > threshold)
resize();
afternodeinsertion(evict);
return null;
}
看到其中 p = tab[i = (n - 1) & hash]) == null 这一句 (n - 1) & hash是计算到一个位置,如果这个tab中的位置是空的那么直接做插入操作。
举个列子 假设有16个位置 有4个学生都有各自的学号
名称 | 学号 |
张三 | 1 |
李四 | 2 |
王五 | 3 |
老李 | 4 |
此时我们分配位置的时候可以采用 1%16 = 1;2%16=2;3%16 = 3;4%16=4;给他们分配位置,但是考虑到性能问题。由于%操作比&慢10倍左右,因此采用&运算会提高性能。
通过限制length
是一个2的幂
数, (n - 1) & hash和hash%n结果是一致的。这就是为什么要限制容量必须是一个2
的幂的原因。
比如2的hashcode是2 那么它对应的二进制是 (0000 0010)
假设n=16
那么n-1=15对应的二进制是 1111 1111 & 0000 0010 = 1111 1111 = 0010 = 2
2%16=2
得到(n - 1) & hash和hash%n结果是一致的,考虑到性能所以每次的扩容都是以2的幂次方扩容。
四.hashmap的简单应用
public static void mapmethod() {
hashmap<string, object> map = new hashmap<>();
map.put("zhangsan", 11);
map.put("lisi", 11);
//重复key会覆盖
map.put("zhangsan", 22);
//便利
for(string key:map.keyset()) {
//根据key获取value
system.out.println(key+"=======value:"+map.get(key));
}
//containskey方法判断当前map是否包含该方法
system.out.println(map.containskey("zhangsan"));
//size打印map的长度
system.out.println(map.size());
//移除key
map.remove("zhangsan");
//判断是否存在value
system.out.println(map.containsvalue("22"));
}
五.总结
以上是我结合工作跟一些blog的心得写的,如果有纰漏麻烦指出. *程序员要多运动啊....减肥去了