欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Java 集合基础知识 List/Set/Map

程序员文章站 2022-06-04 11:12:23
一、List Set 区别 List 有序,可重复; Set 无序,不重复; 二、List Set 实现类间区别及原理 Arraylist 底层实现使用Object[],数组查询效率高 扩容机制 一、List Set 区别 List 有序,可重复; Set 无序,不重复; 二、List Set 实现 ......

一、list set 区别

  • list 有序,可重复;
  • set 无序,不重复;

 

二、list set 实现类间区别及原理

  • arraylist 底层实现使用object[],数组查询效率高

    扩容机制

       1.6采用(capacity * 3)/ 2 + 1,默认容量为10
       1.7采用(capacity >> 2 + capacity)实现,位移动效率高于数学运算,右移一位等于乘以2倍
    读取速度快,写入会涉及到扩容,所以相对较慢
  • linkedlist底层采用双向链表,只记录 first 和 last(linkedlist.node);
    • node记录 e item; node<e> next; node<e> prev;
    • 写入速度快,但是读取速度相对较慢
  • hashset 无序,不重复。
    • 去重原理:所有值保存至hashmap的key中,利用hashmap的键不重复原理达到去重效果;
    • arraylist去重可采用:new arraylist(new hastset(list));
  • treeset 有序,不重复。
    • 底层采用treemap;

 

三、map 实现原理及实现类对比

Java 集合基础知识 List/Set/Map

  1. hashmap 线程不安全,无序

    1) 内部保存以数组 hashmap.entry<k, v>[] 形式

 1 static class entry<k, v> implements map.entry<k, v> {
 2     final k key;
 3     v value;
 4     entry<k, v> next;
 5     int hash;
 6 
 7     entry(int h, k k, v v, entry<k, v> n) {
 8         value = v;
 9         next = n;
10         key = k;
11         hash = h;
12     }
13 }

    2) 线程不安全原因:

      a 在数据操作方法上未采用synchronized同步标识,当多线程发生hash碰撞时,针对hash相等的key只会有一个能成功;

      b 如果上面情况涉及到resize扩容情况,每个线程内都会对内部数组进行重新创建,但只有一个会成功;

    3) 扩容(默认大小为16,2的四次方):

      capacity = (capacity * 2 * loadfactor)

      loadfactor:系数因子,默认为0.75,时间与空间的权衡结果

    4) 可通过linkedhashmap达到有序效果;

 

  2. hashtable 内部原理及使用几乎等于hashmap,不同的是 所有操作数据方法都进行了 synchronized 修饰,即同步处理,线程安全,但这导致单线程访问情况下效率要低于hashmap;

    jdk4将hashtable实现了map接口,在jdk5中创建了替代类:concurrenthashmap(同步的hashmap)

    hashmap想要同步可以采用 java.util.collections.synchronizemap(hashmap)(jdk2出现);

    同理 collections.synchronizecollection(collection<t> c)

      collections.synchronizelist(list<t> list)

      collections.synchronizeset(set<t> s)

      collections.synchronizesortedmap(sortedmap<k, v> m)

      collections.synchronizesortedset(sortedset<t> s)

     迭代hashmap采用快速失败机制,而hashtable不是;

    注:快速失败模式指设计用来即时报告可能会导致失败的任何故障情况,通常会用来停止正常的操作而不是尝试继续做可能有缺陷的工作。与iterator有关,如一个iterator在集合对象上创建了,其他线程欲“结构化”的修改此集合对象,会抛出修改异常(concurrentmodificationexception)

  

  3. 建议优先考虑使用hashmap

    a. 单线程下效率高;

    b. 想排序可转换linkedhashmap使用;

    c. 多线程下可采用 collections.synchronizemap(hashmap) 代替

 

待学习:

  jdk8中的优化点