Java 集合概览(小结)
java collection api提供了一些列的类和接口来帮助我们存储和管理对象集合。其实java中的集合工作起来像是一个数组,不过集合的大小是可以动态改变的,而且集合也提供了更多高级功能。有了javacollectionapi,我们就不需要自己编写集合类了,大部分java集合类都位于java.util
包里面,还有一些和并发相关的集合类位于java.util.concurrent
包中。下面就介绍一下java api 为我们提供的这些集合类。
一、java 集合概览
java中的集合有两大类,分别是:
1. collection
2. map
collection类的集合可以理解为主要存放的是单个对象,而map类的集合主要存储的是key-value类型的对象。这两大类即可理所当然的对应着两个接口,分别是collection接口
和map接口
,下面这幅图列出了这两个接口的继承树:
从上面这幅图可以看到,collection接口又衍生了出三个分支,分别是:
1. list
2. set
3. queue
而map则相对简单,只有一个分支。下面我们就详细介绍java collection的每一个实现类。
注意:要把collection、collections区分开,collection是集合的一个接口,而collections是一个工具类,它提供了一些静态方法来方便我们操作集合的实例,这两个都位于java.util
包中。
二、先从collection接口介绍
下图是collection接口的源码截图,从接口中的抽象方法我们可以看出,它定义了一个通用集合常用的方法:
- 增加删除一个元素
- 判断元素是否存在
- 获得集合的大小
- 迭代一个集合
2.1 collection的list接口
list接口继承自collection接口,它的特点是其中的对象是有序的,并且每个对象都有一个唯一的index,我们可以通过这个index来搜索某个元素,并且list中的对象允许重复,这类似于一个数组。对于list接口,java api提供了如下实现:
- java.util.arraylist
- java.util.linkedlist
- java.util.vector
- java.util.stack
当然,在 java.util.concurrent
包中也有一些实现,这些内容会在另一篇文章中详细介绍。
arraylist是最常用的集合,其内部实现是一个数组,arraylist的大小是可以动态扩充的。对于元素的随机访问效率高,其访问的时间复杂度为o(1)
,对于数据的插入与删除,从尾部操作效率高,时间复杂度和随机访问一样是o(1)
,若是从头部操作则效率会比较低,因为从头部插入或删除时需要移动后面所有元素,其时间复杂度为o(n-i)
(n表示元素个数,i表示元素位置)。
linklist:从上图可以看出,不但继承了list
接口,还继承了deque
接口(后面会介绍)。linklist是一个基于链表的数据结构,每个节点都保存了上一个和下一个节点的指针。linklist对于随机访问效率是比较低的,因为它需要从头开始索引,所以其时间复杂度为o(i)
。但是对于元素的增删,linklist效率高,因为只需要修改前后指针即可,其时间复杂度为o(1)
。
vector:从vector和arraylist源码截图可以看出,它们继承的接口完全一致。所以,vector可以看做是一个线程安全的arraylist,它内部也是基于数组实现的,不过几乎所有的集合操作都加了synchronized
关键字。
stack:上面是stack类源码截图,我们看到stack类其实继承自vector,stack只是在vector的基础上添加了几个方法以提供栈(last in first out lifo)的特性。stack的特点是添加时新元素会被添加到顶部,移除时顶部的元素最先被移除。这种数据结构主要用作一些特殊数据加工流程,如语言编译、xml解析等。
2.2 collection的set接口
set和list接口一样也是继承自collection
接口,同样是对集合的一种实现,它们之间最大的区别是set中的对象不允许重复。对于set
接口,java api提供了如下实现:
- java.util.enumset
- java.util.hashset
- java.util.linkedhashset
- java.util.treeset
这些类的功能稍有不同,区别主要体现在对象的迭代的顺序及插入、查找的效率上。
hashset的实现很简单,其内部就是一个hashmap
,不过它对元素的顺序没有保证。
linkedhashset的实现也很简单,其内部用的是一个linkedhashmap
。因为linkedhashmap
内部维护了一个双向链表以保持顺序,所以linkedhashset
的特点是它当中的元素是有序的,元素迭代的顺序就是其插入的顺序,元素的再次插入不会影响原有元素的顺序。
treeset:从上图的继承关系可以看出,想要了解treeset
就要先了解navigableset
和sortedset
接口。
sortedset接口
public interface sortedset<e> extends set<e> { comparator<? super e> comparator(); sortedset<e> subset(e fromelement, e toelement); sortedset<e> headset(e toelement); sortedset<e> tailset(e fromelement); e first(); }
从上面接口定义看,sortedset接口是set的一个子接口,它除了有一般set的特性之外它元素在内部是有序的。它内部元素的顺序取决于元素的排序规则,即元素顺序取决于元素对comparable
接口的实现或者一个comparator
比较器,关于comparable和comparator的区别,可以参考:
navigableset接口
public interface navigableset<e> extends sortedset<e> { navigableset<e> descendingset(); iterator<e> descendingiterator(); sortedset<e> headset(e toelement); sortedset<e> tailset(e fromelement); sortedset<e> subset(e fromelement, e toelement); ceiling(), floor(), higher(), and lower() ... }
从navigableset接口定义可以看到,它是sortedset的一个子接口,并且提供了一些导航方法,至于这些导航方法的含义大家可以查看java doc。
所以,treeset的特点就是内部元素有序,并且有很多导航方法的实现。从第一部分java集合类概览中我们知道,set有一个子接口sortedset
,而sortedset又有一个子接口navigableset
接口,java api对sortedset、navigableset接口的实现只有一个,就是treeset
。
2.3 collection的queue接口
queue接口继承自collection
接口,它也代表了一个有序的队列,不过这个队列最大的特点就是新插入的元素位于队列的尾部,移除的对象位于队列的头部,这类似于超市中结账的队列。
我们通过第一节的java集合概览已经知道,queue接口还有一个子接口deque,下面我们分别看一下javaapi对这两个接口的定义:
queue接口:
public interface queue<e> extends collection<e> { boolean add(e e); boolean offer(e e); e remove(); e poll(); e peek(); }
deque接口:
public interface deque<e> extends queue<e> { void addfirst(e e); void addlast(e e); e removefirst(); e removefirst(); }
从这两个接口的定义我想大家已经看出些端倪,queue接口定义了一般队列的操作方式,而deque则是一个双端队列。
对于queue
接口,java api提供了两个实现:
- java.util.linkedlist(也实现了deque接口)
- java.util.priorityqueue
linkedlist:前面的list章节已经提到,它是一个标准队列。
priorityqueue:队列中的顺序类似于treeset,取决于元素的排序规则,即元素对comparable接口的实现或者一个comparator比较器。
对于deque接口,出了linklist类之外还有一个实现:
- java.util.arraydeque
arraydeque:从名称可以看出,其内部实现是一个数组。
三、java 集合之 map
从第一部分java集合类概览中我们知道,map不是继承自collection接口,而是和collection接口出于并列的位置。所以,map的行为和上面介绍的collection的行为由很大不同。map的主要特点是它存放的元素为key-value
对,我们看一下map接口的定义:
public interface map<k,v> { v put(k key, v value); boolean containskey(object key); set<map.entry<k, v>> entryset(); int hashcode(); v get(object key); set<k> keyset(); ... ... }
对于map接口,java api提供了如下实现:
- java.util.hashmap
- java.util.hashtable
- java.util.enummap
- java.util.identityhashmap
- java.util.linkedhashmap
- java.util.properties
- java.util.treemap
- java.util.weakhashmap
其中,我们最常用到的是hashmap和treemap。
hashmap中的key、value都是无序的。hashmap的内部实现非常值得研究,具体请参考hashmap内部实现
hashtable可以看做是hashmap的重量级实现,其中的大部分方法都加了synchronized关键字,是线程安全的。hashtable
与hashmap的另一个区别是hashmap的key-value
都允许为null,而hashtable不
可以。
linkedhashmap也是一个hashmap,只是内部维护了一个双向链表以保持顺序,linkedhashset
内部实现就是用的linkedhashmap。
treemap中的key、value不但可以保持顺序,类似于treeset
和priorityqueue
,treemap中key、value的迭代顺序取决于它们各自的排序规则。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。