Java 集合基础知识 List/Set/Map
一、list set 区别
- list 有序,可重复;
- set 无序,不重复;
二、list set 实现类间区别及原理
- arraylist 底层实现使用object[],数组查询效率高
扩容机制
- linkedlist底层采用双向链表,只记录 first 和 last(linkedlist.node);
- node记录 e item; node<e> next; node<e> prev;
- 写入速度快,但是读取速度相对较慢;
- hashset 无序,不重复。
- 去重原理:所有值保存至hashmap的key中,利用hashmap的键不重复原理达到去重效果;
- arraylist去重可采用:new arraylist(new hastset(list));
- treeset 有序,不重复。
- 底层采用treemap;
三、map 实现原理及实现类对比
1. hashmap 线程不安全,无序
1) 内部保存以数组 hashmap.entry<k, v>[] 形式
1 static class entry<k, v> implements map.entry<k, v> { 2 final k key; 3 v value; 4 entry<k, v> next; 5 int hash; 6 7 entry(int h, k k, v v, entry<k, v> n) { 8 value = v; 9 next = n; 10 key = k; 11 hash = h; 12 } 13 }
2) 线程不安全原因:
a 在数据操作方法上未采用synchronized同步标识,当多线程发生hash碰撞时,针对hash相等的key只会有一个能成功;
b 如果上面情况涉及到resize扩容情况,每个线程内都会对内部数组进行重新创建,但只有一个会成功;
3) 扩容(默认大小为16,2的四次方):
capacity = (capacity * 2 * loadfactor)
loadfactor:系数因子,默认为0.75,时间与空间的权衡结果
4) 可通过linkedhashmap达到有序效果;
2. hashtable 内部原理及使用几乎等于hashmap,不同的是 所有操作数据方法都进行了 synchronized 修饰,即同步处理,线程安全,但这导致单线程访问情况下效率要低于hashmap;
jdk4将hashtable实现了map接口,在jdk5中创建了替代类:concurrenthashmap(同步的hashmap)
hashmap想要同步可以采用 java.util.collections.synchronizemap(hashmap)(jdk2出现);
同理 collections.synchronizecollection(collection<t> c)
collections.synchronizelist(list<t> list)
collections.synchronizeset(set<t> s)
collections.synchronizesortedmap(sortedmap<k, v> m)
collections.synchronizesortedset(sortedset<t> s)
迭代hashmap采用快速失败机制,而hashtable不是;
注:快速失败模式指设计用来即时报告可能会导致失败的任何故障情况,通常会用来停止正常的操作而不是尝试继续做可能有缺陷的工作。与iterator有关,如一个iterator在集合对象上创建了,其他线程欲“结构化”的修改此集合对象,会抛出修改异常(concurrentmodificationexception)
3. 建议优先考虑使用hashmap
a. 单线程下效率高;
b. 想排序可转换linkedhashmap使用;
c. 多线程下可采用 collections.synchronizemap(hashmap) 代替
待学习:
jdk8中的优化点
上一篇: while循环
下一篇: Git设置文件或目录忽略跟踪的三种方式