Java集合框架详解（全）

程序员文章站 2022-05-07 14:16:50

一、Java集合框架概述集合可以看作是一种容器，用来存储对象信息。所有集合类都位于java.util包下，但支持多线程的集合类位于java.util.concurrent包下。数组与集合的区别如下： 1）数组长度不可变化而且无法保存具有映射关系的数据；集合类用于保存数量不确定的数据，以及保存具有 ......

一、java集合框架概述

Java集合框架详解（全）

　　集合可以看作是一种容器，用来存储对象信息。所有集合类都位于java.util包下，但支持多线程的集合类位于java.util.concurrent包下。

　　数组与集合的区别如下：

　　1）数组长度不可变化而且无法保存具有映射关系的数据；集合类用于保存数量不确定的数据，以及保存具有映射关系的数据。

　　2）数组元素既可以是基本类型的值，也可以是对象；集合只能保存对象。

　　java集合类主要由两个根接口collection和map派生出来的，collection派生出了三个子接口：list、set、queue（java5新增的队列），因此java集合大致也可分成list、set、queue、map四种接口体系，（注意：map不是collection的子接口）。

　　其中list代表了有序可重复集合，可直接根据元素的索引来访问；set代表无序不可重复集合，只能根据元素本身来访问；queue是队列集合；map代表的是存储key-value对的集合，可根据元素的key来访问value。

　　上图中淡绿色背景覆盖的是集合体系中常用的实现类，分别是arraylist、linkedlist、arrayqueue、hashset、treeset、hashmap、treemap等实现类。

二、java集合常见接口及实现类

1. collection接口常见方法（来源于java api）

Java集合框架详解（全）

2. set集合

　　set集合与collection的方法相同，由于set集合不允许存储相同的元素，所以如果把两个相同元素添加到同一个set集合，则添加操作失败，新元素不会被加入，add()方法返回false。为了帮助理解，请看下面代码示例：

public class test {

    public static void main(string[] args) {
        set<string> set = new hashset<string>();
        set.add("hello world");
        set.add("hello 冰湖一角");
        set.add("hello 冰湖一角");//添加不进去
        system.out.println("集合中元素个数："+set.size());
        system.out.println("集合中元素为："+set.tostring());
    }
}

运行结果如下：

集合中元素个数：2
集合中元素为：[hello world, hello 冰湖一角]

分析：由于string类中重写了hashcode()和equals()方法，用来比较指向的字符串对象所存储的字符串是否相等。所以这里的第二个"hello 冰湖一角"是加不进去的。

下面着重介绍set集合几个常用实现类：

1）hashset类

　　hashset是set集合最常用实现类，是其经典实现。hashset是按照hash算法来存储元素的，因此具有很好的存取和查找性能。

　　hashset具有如下特点：

　　♦ 不能保证元素的顺序。

　　♦ hashset不是线程同步的，如果多线程操作hashset集合，则应通过代码来保证其同步。

　　♦ 集合元素值可以是null。

　　hashset存储原理如下：

　　当向hashset集合存储一个元素时，hashset会调用该对象的hashcode()方法得到其hashcode值，然后根据hashcode值决定该对象的存储位置。hashset集合判断两个元素相等的标准是(1)两个对象通过equals()方法比较返回true；(2)两个对象的hashcode()方法返回值相等。因此，如果(1)和(2)有一个不满足条件，则认为这两个对象不相等，可以添加成功。如果两个对象的hashcode()方法返回值相等，但是两个对象通过equals()方法比较返回false，hashset会以链式结构将两个对象保存在同一位置，这将导致性能下降，因此在编码时应避免出现这种情况。

　　hashset查找原理如下：

　　基于hashset以上的存储原理，在查找元素时，hashset先计算元素的hashcode值（也就是调用对象的hashcode方法的返回值），然后直接到hashcode值对应的位置去取出元素即可，这就是hashset速度很快的原因。

　　重写hashcode()方法的基本原则如下：

　　♦ 在程序运行过程中，同一个对象的hashcode()方法返回值应相同。

　　♦ 当两个对象通过equals()方法比较返回true时，这两个对象的hashcode()方法返回值应该相等。

　　♦ 对象中用作equals()方法比较标准的实例变量，都应该用于计算hashcode值。

2）linkedhashset类

　　linkedhashset是hashset的一个子类，具有hashset的特性，也是根据元素的hashcode值来决定元素的存储位置。但它使用链表维护元素的次序，元素的顺序与添加顺序一致。由于linkedhashset需要维护元素的插入顺序，因此性能略低于hashset，但在迭代访问set里的全部元素时由很好的性能。

3）treeset类

　　treeset时sortedset接口的实现类，treeset可以保证元素处于排序状态，它采用红黑树的数据结构来存储集合元素。treeset支持两种排序方法：自然排序和定制排序，默认采用自然排序。

　　♦ 自然排序

　　treeset会调用集合元素的compareto(object obj)方法来比较元素的大小关系，然后将元素按照升序排列，这就是自然排序。如果试图将一个对象添加到treeset集合中，则该对象必须实现comparable接口，否则会抛出异常。当一个对象调用方法与另一个对象比较时，例如obj1.compareto(obj2)，如果该方法返回0，则两个对象相等；如果返回一个正数，则obj1大于obj2；如果返回一个负数，则obj1小于obj2。

　　java常用类中已经实现了comparable接口的类有以下几个：

　　♦ bigdecimal、bigdecimal以及所有数值型对应的包装类：按照它们对应的数值大小进行比较。

　　♦ charchter：按照字符的unicode值进行比较。

　　♦ boolean：true对应的包装类实例大于false对应的包装类实例。

　　♦ string：按照字符串中的字符的unicode值进行比较。

　　♦ date、time：后面的时间、日期比前面的时间、日期大。

　　对于treeset集合而言，它判断两个对象是否相等的标准是：两个对象通过compareto(object obj)方法比较是否返回0，如果返回0则相等。

　　♦ 定制排序

　　想要实现定制排序，需要在创建treeset集合对象时，提供一个comparator对象与该treeset集合关联，由comparator对象负责集合元素的排序逻辑。

　　综上：自然排序实现的是comparable接口，定制排序实现的是comparator接口。（具体代码实现会在后续章节中讲解）

4）enumset类

　　enumset是一个专为枚举类设计的集合类，不允许添加null值。enumset的集合元素也是有序的，它以枚举值在enum类内的定义顺序来决定集合元素的顺序。

5）各set实现类的性能分析

　　hashset的性能比treeset的性能好（特别是添加，查询元素时），因为treeset需要额外的红黑树算法维护元素的次序，如果需要一个保持排序的set时才用treeset，否则应该使用hashset。

　　linkedhashset是hashset的子类，由于需要链表维护元素的顺序，所以插入和删除操作比hashset要慢，但遍历比hashset快。

　　enumset是所有set实现类中性能最好的，但它只能保存同一个枚举类的枚举值作为集合元素。

　　以上几个set实现类都是线程不安全的，如果多线程访问，必须手动保证集合的同步性，这在后面的章节中会讲到。

3. list集合

　　list集合代表一个有序、可重复集合，集合中每个元素都有其对应的顺序索引。list集合默认按照元素的添加顺序设置元素的索引，可以通过索引（类似数组的下标）来访问指定位置的集合元素。

　　实现list接口的集合主要有：arraylist、linkedlist、vector、stack。

1）arraylist

arraylist是一个动态数组，也是我们最常用的集合，是list类的典型实现。它允许任何符合规则的元素插入甚至包括null。每一个arraylist都有一个初始容量（10），该容量代表了数组的大小。随着容器中的元素不断增加，容器的大小也会随着增加。在每次向容器中增加元素的同时都会进行容量检查，当快溢出时，就会进行扩容操作。所以如果我们明确所插入元素的多少，最好指定一个初始容量值，避免过多的进行扩容操作而浪费时间、效率。

arraylist擅长于随机访问。同时arraylist是非同步的。

2）linkedlist

linkedlist是list接口的另一个实现，除了可以根据索引访问集合元素外，linkedlist还实现了deque接口，可以当作双端队列来使用，也就是说，既可以当作“栈”使用，又可以当作队列使用。

　　linkedlist的实现机制与arraylist的实现机制完全不同，arrayliat内部以数组的形式保存集合的元素，所以随机访问集合元素有较好的性能；linkedlist内部以链表的形式保存集合中的元素，所以随机访问集合中的元素性能较差，但在插入删除元素时有较好的性能。

3）vector

与arraylist相似，但是vector是同步的。所以说vector是线程安全的动态数组。它的操作与arraylist几乎一样。

4）stack

stack继承自vector，实现一个后进先出的堆栈。stack提供5个额外的方法使得vector得以被当作堆栈使用。基本的push和pop 方法，还有peek方法得到栈顶的元素，empty方法测试堆栈是否为空，search方法检测一个元素在堆栈中的位置。stack刚创建后是空栈。

5）iterator接口和listiterator接口

　　iterator是一个接口，它是集合的迭代器。集合可以通过iterator去遍历集合中的元素。iterator提供的api接口如下：

　　♦ boolean hasnext()：判断集合里是否存在下一个元素。如果有，hasnext()方法返回 true。
　　♦ object next()：返回集合里下一个元素。
　　♦ void remove()：删除集合里上一次next方法返回的元素。

　　listiterator接口继承iterator接口，提供了专门操作list的方法。listiterator接口在iterator接口的基础上增加了以下几个方法：

　　♦ boolean hasprevious()：判断集合里是否存在上一个元素。如果有，该方法返回 true。
　　♦ object previous()：返回集合里上一个元素。
　　♦ void add(object o)：在指定位置插入一个元素。

　　以上两个接口相比较，不难发现，listiterator增加了向前迭代的功能（iterator只能向后迭代），listiterator还可以通过add()方法向list集合中添加元素（iterator只能删除元素）。

4. map集合

　　map接口采用键值对map<k,v>的存储方式，保存具有映射关系的数据，因此，map集合里保存两组值，一组值用于保存map里的key，另外一组值用于保存map里的value，key和value可以是任意引用类型的数据。key值不允许重复，可以为null。如果添加key-value对时map中已经有重复的key，则新添加的value会覆盖该key原来对应的value。常用实现类有hashmap、linkedhashmap、treemap等。

　　map常见方法（来源于api）如下：

Java集合框架详解（全）

1）hashmap与hashtable

　　hashmap与hashtable是map接口的两个典型实现，它们之间的关系完全类似于arraylist与vertor。hashtable是一个古老的map实现类，它提供的方法比较繁琐，目前基本不用了，hashmap与hashtable主要存在以下两个典型区别：

　　♦ hashmap是线程不安全，hashtable是线程安全的。

　　♦ hashmap可以使用null值最为key或value；hashtable不允许使用null值作为key和value，如果把null放进hashtable中，将会发生空指针异常。

　　为了成功的在hashmap和hashtable中存储和获取对象，用作key的对象必须实现hashcode()方法和equals()方法。

　　hashmap工作原理如下：

　　hashmap基于hashing原理，通过put()和get()方法存储和获取对象。当我们将键值对传递给put()方法时，它调用建对象的hashcode()方法来计算hashcode值，然后找到bucket位置来储存值对象。当获取对象时，通过建对象的equals()方法找到正确的键值对，然后返回对象。hashmap使用链表来解决碰撞问题，当发生碰撞了，对象将会存储在链表的下一个节点中。

2）linkedhashmap实现类

　　linkedhashmap使用双向链表来维护key-value对的次序（其实只需要考虑key的次序即可），该链表负责维护map的迭代顺序，与插入顺序一致，因此性能比hashmap低，但在迭代访问map里的全部元素时有较好的性能。

3）properties

　　properties类时hashtable类的子类，它相当于一个key、value都是string类型的map，主要用于读取配置文件。

4）treemap实现类

　　treemap是sortedmap的实现类，是一个红黑树的数据结构，每个key-value对作为红黑树的一个节点。treemap存储key-value对时，需要根据key对节点进行排序。treemap也有两种排序方式：

　　♦ 自然排序：treemap的所有key必须实现comparable接口，而且所有的key应该是同一个类的对象，否则会抛出classcastexception。

　　♦ 定制排序：创建treemap时，传入一个comparator对象，该对象负责对treemap中的所有key进行排序。

5）各map实现类的性能分析

　　♦ hashmap通常比hashtable（古老的线程安全的集合）要快

　　♦ treemap通常比hashmap、hashtable要慢，因为treemap底层采用红黑树来管理key-value。

　　♦ linkedhashmap比hashmap慢一点，因为它需要维护链表来爆出key-value的插入顺序。　

如需转载，请注明出处和链接！

欢迎关注微信公众号【java典籍】，收看更多java技术干货！

　　 ▼微信扫一扫下图↓↓↓二维码关注

　 Java集合框架详解（全）

上一篇： jquery1.7中通过trigger触发checkbox的click事件的一个小坑

下一篇： Spring Cloud实战之初级入门（四）— 利用Hystrix实现服务熔断与服务监控

Java集合框架详解（全）

Java自学-集合框架泛型Generic

Java自学-集合框架 HashMap和Hashtable的区别

第51节：Java当中的集合框架Map

Java自学-集合框架 Collections

Java集合框架面试题

Java面试题冲刺第十一天--集合框架篇(2)

java集合框架的体系结构详细说明

Java日志框架之logback使用详解