Java 集合概览(小结)

程序员文章站 2023-12-19 13:41:22

java collection api提供了一些列的类和接口来帮助我们存储和管理对象集合。其实java中的集合工作起来像是一个数组，不过集合的大小是可以动态改变的，而且集合...

java collection api提供了一些列的类和接口来帮助我们存储和管理对象集合。其实java中的集合工作起来像是一个数组，不过集合的大小是可以动态改变的，而且集合也提供了更多高级功能。有了javacollectionapi，我们就不需要自己编写集合类了，大部分java集合类都位于java.util包里面，还有一些和并发相关的集合类位于java.util.concurrent包中。下面就介绍一下java api 为我们提供的这些集合类。

一、java 集合概览

java中的集合有两大类，分别是：

1. collection
2. map

collection类的集合可以理解为主要存放的是单个对象，而map类的集合主要存储的是key-value类型的对象。这两大类即可理所当然的对应着两个接口，分别是collection接口和map接口，下面这幅图列出了这两个接口的继承树：

Java 集合概览(小结)

从上面这幅图可以看到，collection接口又衍生了出三个分支，分别是：

1. list
2. set
3. queue

而map则相对简单，只有一个分支。下面我们就详细介绍java collection的每一个实现类。

注意：要把collection、collections区分开，collection是集合的一个接口，而collections是一个工具类，它提供了一些静态方法来方便我们操作集合的实例，这两个都位于java.util包中。

二、先从collection接口介绍

下图是collection接口的源码截图，从接口中的抽象方法我们可以看出，它定义了一个通用集合常用的方法：

- 增加删除一个元素
- 判断元素是否存在
- 获得集合的大小
- 迭代一个集合

Java 集合概览(小结)

2.1 collection的list接口

list接口继承自collection接口，它的特点是其中的对象是有序的，并且每个对象都有一个唯一的index，我们可以通过这个index来搜索某个元素，并且list中的对象允许重复，这类似于一个数组。对于list接口，java api提供了如下实现：

- java.util.arraylist
- java.util.linkedlist
- java.util.vector
- java.util.stack

当然，在 java.util.concurrent包中也有一些实现，这些内容会在另一篇文章中详细介绍。

Java 集合概览(小结)

arraylist是最常用的集合，其内部实现是一个数组，arraylist的大小是可以动态扩充的。对于元素的随机访问效率高，其访问的时间复杂度为o(1)，对于数据的插入与删除，从尾部操作效率高，时间复杂度和随机访问一样是o(1)，若是从头部操作则效率会比较低，因为从头部插入或删除时需要移动后面所有元素，其时间复杂度为o(n-i)(n表示元素个数，i表示元素位置)。

Java 集合概览(小结)

linklist：从上图可以看出，不但继承了list接口，还继承了deque接口（后面会介绍）。linklist是一个基于链表的数据结构，每个节点都保存了上一个和下一个节点的指针。linklist对于随机访问效率是比较低的，因为它需要从头开始索引，所以其时间复杂度为o(i)。但是对于元素的增删，linklist效率高，因为只需要修改前后指针即可，其时间复杂度为o(1)。

Java 集合概览(小结)

vector：从vector和arraylist源码截图可以看出，它们继承的接口完全一致。所以，vector可以看做是一个线程安全的arraylist，它内部也是基于数组实现的，不过几乎所有的集合操作都加了synchronized关键字。

Java 集合概览(小结)

stack：上面是stack类源码截图，我们看到stack类其实继承自vector，stack只是在vector的基础上添加了几个方法以提供栈（last in first out lifo）的特性。stack的特点是添加时新元素会被添加到顶部，移除时顶部的元素最先被移除。这种数据结构主要用作一些特殊数据加工流程，如语言编译、xml解析等。

2.2 collection的set接口

set和list接口一样也是继承自collection接口，同样是对集合的一种实现，它们之间最大的区别是set中的对象不允许重复。对于set接口，java api提供了如下实现：

- java.util.enumset
- java.util.hashset
- java.util.linkedhashset
- java.util.treeset

这些类的功能稍有不同，区别主要体现在对象的迭代的顺序及插入、查找的效率上。

hashset的实现很简单，其内部就是一个hashmap，不过它对元素的顺序没有保证。

Java 集合概览(小结)

linkedhashset的实现也很简单，其内部用的是一个linkedhashmap。因为linkedhashmap内部维护了一个双向链表以保持顺序，所以linkedhashset的特点是它当中的元素是有序的，元素迭代的顺序就是其插入的顺序，元素的再次插入不会影响原有元素的顺序。

Java 集合概览(小结)

treeset：从上图的继承关系可以看出，想要了解treeset就要先了解navigableset和sortedset接口。

sortedset接口

public interface sortedset<e> extends set<e> {
   comparator<? super e> comparator();
   sortedset<e> subset(e fromelement, e toelement);
   sortedset<e> headset(e toelement);
   sortedset<e> tailset(e fromelement);
   e first();  
}

从上面接口定义看，sortedset接口是set的一个子接口，它除了有一般set的特性之外它元素在内部是有序的。它内部元素的顺序取决于元素的排序规则，即元素顺序取决于元素对comparable接口的实现或者一个comparator比较器，关于comparable和comparator的区别，可以参考：

navigableset接口

public interface navigableset<e> extends sortedset<e> {
  navigableset<e> descendingset();
  iterator<e> descendingiterator();
  sortedset<e> headset(e toelement);
  sortedset<e> tailset(e fromelement);
  sortedset<e> subset(e fromelement, e toelement);
  ceiling(), floor(), higher(), and lower()
  ...
}

从navigableset接口定义可以看到，它是sortedset的一个子接口，并且提供了一些导航方法，至于这些导航方法的含义大家可以查看java doc。

所以，treeset的特点就是内部元素有序，并且有很多导航方法的实现。从第一部分java集合类概览中我们知道，set有一个子接口sortedset，而sortedset又有一个子接口navigableset接口，java api对sortedset、navigableset接口的实现只有一个，就是treeset。

2.3 collection的queue接口

queue接口继承自collection接口，它也代表了一个有序的队列，不过这个队列最大的特点就是新插入的元素位于队列的尾部，移除的对象位于队列的头部，这类似于超市中结账的队列。

我们通过第一节的java集合概览已经知道，queue接口还有一个子接口deque，下面我们分别看一下javaapi对这两个接口的定义：

queue接口：

public interface queue<e> extends collection<e> {
  boolean add(e e);
  boolean offer(e e);
  e remove();
  e poll();
  e peek();
}

deque接口：

public interface deque<e> extends queue<e> {
  void addfirst(e e);
  void addlast(e e);
  e removefirst(); 
  e removefirst();
}

从这两个接口的定义我想大家已经看出些端倪，queue接口定义了一般队列的操作方式，而deque则是一个双端队列。

对于queue接口，java api提供了两个实现：

- java.util.linkedlist（也实现了deque接口）
- java.util.priorityqueue

linkedlist：前面的list章节已经提到，它是一个标准队列。
priorityqueue：队列中的顺序类似于treeset，取决于元素的排序规则，即元素对comparable接口的实现或者一个comparator比较器。

对于deque接口，出了linklist类之外还有一个实现：

- java.util.arraydeque

arraydeque：从名称可以看出，其内部实现是一个数组。

三、java 集合之 map

从第一部分java集合类概览中我们知道，map不是继承自collection接口，而是和collection接口出于并列的位置。所以，map的行为和上面介绍的collection的行为由很大不同。map的主要特点是它存放的元素为key-value对，我们看一下map接口的定义：

public interface map<k,v> {
  v put(k key, v value);
  boolean containskey(object key);
  set<map.entry<k, v>> entryset();
  int hashcode(); v get(object key);
  set<k> keyset();
  ... ...
}

对于map接口，java api提供了如下实现：

- java.util.hashmap
- java.util.hashtable
- java.util.enummap
- java.util.identityhashmap
- java.util.linkedhashmap
- java.util.properties
- java.util.treemap
- java.util.weakhashmap

其中，我们最常用到的是hashmap和treemap。

hashmap中的key、value都是无序的。hashmap的内部实现非常值得研究，具体请参考hashmap内部实现

hashtable可以看做是hashmap的重量级实现，其中的大部分方法都加了synchronized关键字，是线程安全的。hashtable与hashmap的另一个区别是hashmap的key-value都允许为null，而hashtable不可以。

linkedhashmap也是一个hashmap，只是内部维护了一个双向链表以保持顺序，linkedhashset内部实现就是用的linkedhashmap。

treemap中的key、value不但可以保持顺序，类似于treeset和priorityqueue，treemap中key、value的迭代顺序取决于它们各自的排序规则。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

Java 集合概览(小结)

Java 集合概览(小结)

Java实现过滤掉map集合中key或value为空的值示例

Java集合与数组区别简介及相互转换实例

删除JAVA集合中元素的实现代码

Java 集合系列（二）ArrayList详解

详解Java 集合系列（三）—— LinkedList

Java实现Map集合遍历的四种常见方式与用法分析

Java常用排序算法及性能测试集合

JAVA中STRING的常用方法小结

Python格式化字符串f-string概览(小结)