List、Set、Map集合
1 list接口
我们掌握了collection接口的使用后,再来看看collection接口中的子类,他们都具备那些特性呢?
接下来,我们一起学习collection中的常用几个子类(list集合、set集合)。
1.1 list接口介绍
查阅api,看list的介绍。有序的 collection(也称为序列)。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引(在列表中的位置)访问元素,并搜索列表中的元素。与 set 不同,列表通常允许重复的元素。
看完api,我们总结一下:
list接口:
l 它是一个元素存取有序的集合。例如,存元素的顺序是11、22、33。那么集合中,元素的存储就是按照11、22、33的顺序完成的)。
l 它是一个带有索引的集合,通过索引就可以精确的操作集合中的元素(与数组的索引是一个道理)。
l 集合中可以有重复的元素,通过元素的equals方法,来比较是否为重复的元素。
list接口的常用子类有:
l arraylist集合
l linkedlist集合
1.2 list接口中常用的方法
l 增加元素方法
l add(object e):向集合末尾处,添加指定的元素
l add(int index, object e):向集合指定索引处,添加指定的元素,原有元素依次后移
l 删除元素删除
l remove(object e):将指定元素对象,从集合中删除,返回值为被删除的元素
l remove(int index):将指定索引处的元素,从集合中删除,返回值为被删除的元素
l 替换元素方法
l set(int index, object e):将指定索引处的元素,替换成指定的元素,返回值为替换前的元素
l 查询元素方法
l get(int index):获取指定索引处的元素,并返回该元素
方法演示:
list<string> list = new arraylist<string>();
//1,添加元素。
list.add("小红");
list.add("小梅");
list.add("小强");
//2,插入元素。插入元素前的集合["小红","小梅","小强"]
list.add(1, "老王"); //插入元素后的集合["小红","老王","小梅","小强"]
//3,删除元素。
list.remove(2);// 删除元素后的集合["小红","老王","小强"]
//4,修改元素。
list.set(1, "隔壁老王");// 修改元素后的集合["小红","隔壁老王","小强"]
iterator<string> it = list.iterator();
while (it.hasnext()) {
string str = it.next();
system.out.println(str);
}
由于list集合拥有索引,因此list集合迭代方式除了使用迭代器之外,还可以使用索引进行迭代。
for (int i = 0; i < list.size(); i++) {
string str = list.get(i);
system.out.println(str);
}
1.2.1 iterator的并发修改异常
在list集合迭代元素中,对元素进行判断,一旦条件满足就添加一个新元素。代码如下
public class iteratordemo {
//在list集合迭代元素中,对元素进行判断,一旦条件满足就添加一个新元素
public static void main(string[] args) {
//创建list集合
list<string> list = new arraylist<string>();
//给集合中添加元素
list.add("abc1");
list.add("abc2");
list.add("abc3");
list.add("abc4");
//迭代集合,当有元素为"abc2"时,集合加入新元素"itcast"
iterator<string> it = list.iterator();
while(it.hasnext()){
string str = it.next();
//判断取出的元素是否是"abc2",是就添加一个新元素
if("abc2".equals(str)){
list.add("itcast");// 该操作会导致程序出错
}
}
//打印容器中的元素
system.out.println(list);
}
}
运行上述代码发生了错误 java.util.concurrentmodificationexception这是什么原因呢?
在迭代过程中,使用了集合的方法对元素进行操作。导致迭代器并不知道集合中的变化,容易引发数据的不确定性。
并发修改异常解决办法:在迭代时,不要使用集合的方法操作元素。
那么想要在迭代时对元素操作咋办?通过listiterator迭代器操作元素是可以的,listiterator的出现,解决了使用iterator迭代过程中可能会发生的错误情况。
1.3 list集合存储数据的结构
list接口下有很多个集合,它们存储元素所采用的结构方式是不同的,这样就导致了这些集合有它们各自的特点,供给我们在不同的环境下进行使用。数据存储的常用结构有:堆栈、队列、数组、链表。我们分别来了解一下:
l 堆栈,采用该结构的集合,对元素的存取有如下的特点:
l 先进后出(即,存进去的元素,要在后它后面的元素依次取出后,才能取出该元素)。例如,子弹压进弹夹,先压进去的子弹在下面,后压进去的子弹在上面,当开枪时,先弹出上面的子弹,然后才能弹出下面的子弹。
l 栈的入口、出口的都是栈的顶端位置
l 压栈:就是存元素。即,把元素存储到栈的顶端位置,栈中已有元素依次向栈底方向移动一个位置。
l 弹栈:就是取元素。即,把栈的顶端位置元素取出,栈中已有元素依次向栈顶方向移动一个位置。
l 队列,采用该结构的集合,对元素的存取有如下的特点:
l 先进先出(即,存进去的元素,要在后它前面的元素依次取出后,才能取出该元素)。例如,安检。排成一列,每个人依次检查,只有前面的人全部检查完毕后,才能排到当前的人进行检查。
l 队列的入口、出口各占一侧。例如,下图中的左侧为入口,右侧为出口。
l 数组,采用该结构的集合,对元素的存取有如下的特点:
l 查找元素快:通过索引,可以快速访问指定位置的元素
l 增删元素慢:
l 指定索引位置增加元素:需要创建一个新数组,将指定新元素存储在指定索引位置,再把原数组元素根据索引,复制到新数组对应索引的位置。如下图
l 指定索引位置删除元素:需要创建一个新数组,把原数组元素根据索引,复制到新数组对应索引的位置,原数组中指定索引位置元素不复制到新数组中。如下图
l 链表,采用该结构的集合,对元素的存取有如下的特点:
l 多个节点之间,通过地址进行连接。例如,多个人手拉手,每个人使用自己的右手拉住下个人的左手,依次类推,这样多个人就连在一起了。
l 查找元素慢:想查找某个元素,需要通过连接的节点,依次向后查找指定元素
l 增删元素快:
l 增加元素:操作如左图,只需要修改连接下个元素的地址即可。
l 删除元素:操作如右图,只需要修改连接下个元素的地址即可。
1.4 arraylist集合
arraylist集合数据存储的结构是数组结构。元素增删慢,查找快,由于日常开发中使用最多的功能为查询数据、遍历数据,所以arraylist是最常用的集合。
许多程序员开发时非常随意地使用arraylist完成任何需求,并不严谨,这种用法是不提倡的。
1.5 linkedlist集合
linkedlist集合数据存储的结构是链表结构。方便元素添加、删除的集合。实际开发中对一个集合元素的添加与删除经常涉及到首尾操作,而linkedlist提供了大量首尾操作的方法。如下图
linkedlist是list的子类,list中的方法linkedlist都是可以使用,这里就不做详细介绍,我们只需要了解linkedlist的特有方法即可。在开发时,linkedlist集合也可以作为堆栈,队列的结构使用。
方法演示:
linkedlist<string> link = new linkedlist<string>();
//添加元素
link.addfirst("abc1");
link.addfirst("abc2");
link.addfirst("abc3");
//获取元素
system.out.println(link.getfirst());
system.out.println(link.getlast());
//删除元素
system.out.println(link.removefirst());
system.out.println(link.removelast());
while(!link.isempty()){ //判断集合是否为空
system.out.println(link.pop()); //弹出集合中的栈顶元素
}
1.6 vector集合
vector集合数据存储的结构是数组结构,为jdk中最早提供的集合。vector中提供了一个独特的取出方式,就是枚举enumeration,它其实就是早期的迭代器。此接口enumeration的功能与 iterator 接口的功能是类似的。vector集合已被arraylist替代。枚举enumeration已被迭代器iterator替代。
l vector常见的方法:
l enumeration枚举常见的方法:
l vector集合对arraylist集合使用的对比
2 set接口
学习collection接口时,记得collection中可以存放重复元素,也可以不存放重复元素,那么我们知道list中是可以存放重复元素的。那么不重复元素给哪里存放呢?那就是set接口,它里面的集合,所存储的元素就是不重复的。
2.1 set接口介绍
查阅set集合的api介绍,通过元素的equals方法,来判断是否为重复元素,
2.2 hashset集合介绍
查阅hashset集合的api介绍:此类实现set接口,由哈希表支持(实际上是一个 hashmap集合)。hashset集合不能保证的迭代顺序与元素存储顺序相同。
hashset集合,采用哈希表结构存储数据,保证元素唯一性的方式依赖于:hashcode()与equals()方法。
2.3 hashset集合存储数据的结构(哈希表)
什么是哈希表呢?
哈希表底层使用的也是数组机制,数组中也存放对象,而这些对象往数组中存放时的位置比较特殊,当需要把这些对象给数组中存放时,那么会根据这些对象的特有数据结合相应的算法,计算出这个对象在数组中的位置,然后把这个对象存放在数组中。而这样的数组就称为哈希数组,即就是哈希表。
当向哈希表中存放元素时,需要根据元素的特有数据结合相应的算法,这个算法其实就是object类中的hashcode方法。由于任何对象都是object类的子类,所以任何对象有拥有这个方法。即就是在给哈希表中存放对象时,会调用对象的hashcode方法,算出对象在表中的存放位置,这里需要注意,如果两个对象hashcode方法算出结果一样,这样现象称为哈希冲突,这时会调用对象的equals方法,比较这两个对象是不是同一个对象,如果equals方法返回的是true,那么就不会把第二个对象存放在哈希表中,如果返回的是false,就会把这个值存放在哈希表中。
总结:保证hashset集合元素的唯一,其实就是根据对象的hashcode和equals方法来决定的。如果我们往集合中存放自定义的对象,那么保证其唯一,就必须复写hashcode和equals方法建立属于当前对象的比较方式。
2.4 hashset存储javaapi中的类型元素
给hashset中存储javaapi中提供的类型元素时,不需要重写元素的hashcode和equals方法,因为这两个方法,在javaapi的每个类中已经重写完毕,如string类、integer类等。
l 创建hashset集合,存储string对象。
public class hashsetdemo {
public static void main(string[] args) {
//创建hashset对象
hashset<string> hs = new hashset<string>();
//给集合中添加自定义对象
hs.add("zhangsan");
hs.add("lisi");
hs.add("wangwu");
hs.add("zhangsan");
//取出集合中的每个元素
iterator<string> it = hs.iterator();
while(it.hasnext()){
string s = it.next();
system.out.println(s);
}
}
}
输出结果如下,说明集合中不能存储重复元素:
wangwu
lisi
zhangsan
2.5 hashset存储自定义类型元素
给hashset中存放自定义类型元素时,需要重写对象中的hashcode和equals方法,建立自己的比较方式,才能保证hashset集合中的对象唯一
l 创建自定义对象student
public class student {
private string name;
private int age;
public student(string name, int age) {
super();
this.name = name;
this.age = age;
}
public string getname() {
return name;
}
public void setname(string name) {
this.name = name;
}
public int getage() {
return age;
}
public void setage(int age) {
this.age = age;
}
@override
public string tostring() {
return "student [name=" + name + ", age=" + age + "]";
}
@override
public int hashcode() {
final int prime = 31;
int result = 1;
result = prime * result + age;
result = prime * result + ((name == null) ? 0 : name.hashcode());
return result;
}
@override
public boolean equals(object obj) {
if (this == obj)
return true;
if(!(obj instanceof student)){
system.out.println("类型错误");
return false;
}
student other = (student) obj;
return this.age == other.age && this.name.equals(other.name);
}
}
l 创建hashset集合,存储student对象。
public class hashsetdemo {
public static void main(string[] args) {
//创建hashset对象
hashset hs = new hashset();
//给集合中添加自定义对象
hs.add(new student("zhangsan",21));
hs.add(new student("lisi",22));
hs.add(new student("wangwu",23));
hs.add(new student("zhangsan",21));
//取出集合中的每个元素
iterator it = hs.iterator();
while(it.hasnext()){
student s = (student)it.next();
system.out.println(s);
}
}
}
输出结果如下,说明集合中不能存储重复元素:
student [name=lisi, age=22]
student [name=zhangsan, age=21]
student [name=wangwu, age=23]
2.6 linkedhashset介绍
我们知道hashset保证元素唯一,可是元素存放进去是没有顺序的,那么我们要保证有序,怎么办呢?
在hashset下面有一个子类linkedhashset,它是链表和哈希表组合的一个数据存储结构。
演示代码如下:
public class linkedhashsetdemo {
public static void main(string[] args) {
set<string> set = new linkedhashset<string>();
set.add("bbb");
set.add("aaa");
set.add("abc");
set.add("bbc");
iterator it = set.iterator();
while (it.hasnext()) {
system.out.println(it.next());
}
}
}
输出结果如下,linkedhashset集合保证元素的存入和取出的顺序:
bbb
aaa
abc
bbc
3 判断集合元素唯一的原理
3.1 arraylist的contains方法判断元素是否重复原理
arraylist的contains方法会使用调用方法时,传入的元素的equals方法依次与集合中的旧元素所比较,从而根据返回的布尔值判断是否有重复元素。此时,当arraylist存放自定义类型时,由于自定义类型在未重写equals方法前,判断是否重复的依据是地址值,所以如果想根据内容判断是否为重复元素,需要重写元素的equals方法。
3.2 hashset的add/contains等方法判断元素是否重复原理
set集合不能存放重复元素,其添加方法在添加时会判断是否有重复元素,有重复不添加,没重复则添加。
hashset集合由于是无序的,其判断唯一的依据是元素类型的hashcode与equals方法的返回结果。规则如下:
先判断新元素与集合内已经有的旧元素的hashcode值
l 如果不同,说明是不同元素,添加到集合。
l 如果相同,再判断equals比较结果。返回true则相同元素;返回false则不同元素,添加到集合。
所以,使用hashset存储自定义类型,如果没有重写该类的hashcode与equals方法,则判断重复时,使用的是地址值,如果想通过内容比较元素是否相同,需要重写该元素类的hashcode与equals方法。
4 map(键值对、键唯一、值不唯一)
map集合中存储的是键值对,键不能重复,值可以重复。根据键得到值,对map集合遍历时先得到键的set集合,对set集合进行遍历,得到相应的值。
hashmap
数组方式存储key/value,线程非安全,允许null作为key和value,key不可以重复,value允许重复,不保证元素迭代顺序是按照插入时的顺序,key的hash值是先计算key的hashcode值,然后再进行计算,每次容量扩容会重新计算所以key的hash值,会消耗资源,要求key必须重写equals和hashcode方法
默认初始容量16,加载因子0.75,扩容为旧容量乘2,查找元素快,如果key一样则比较value,如果value不一样,则按照链表结构存储value,就是一个key后面有多个value;
方法
1、添加:
v put(k key, v value) (可以相同的key值,但是添加的value值会覆盖前面的,返回值是前一个,如果没有就返回null)
putall(map<? extends k,? extends v> m) 从指定映射中将所有映射关系复制到此映射中(可选操作)。
2、删除
remove() 删除关联对象,指定key对象
clear() 清空集合对象
3、获取
value get(key) 可以用于判断键是否存在的情况。当指定的键不存在的时候,返回的是null。
4、判断:
boolean isempty() 长度为0返回true否则false
boolean containskey(object key) 判断集合中是否包含指定的key
boolean containsvalue(object value) 判断集合中是否包含指定的value
4、长度:
int size()
map的主要的方法就这几个
hashtable
hashtable与hashmap类似,是hashmap的线程安全版,它支持线程的同步,即任一时刻只有一个线程能写hashtable,因此也导致了hashtale在写入时会比较慢,它继承自dictionary类,不同的是它不允许记录的键或者值为null,同时效率较低。
linkedhashmap
linkedhashmap保存了记录的插入顺序,在用iteraor遍历linkedhashmap时,先得到的记录肯定是先插入的,在遍历的时候会比hashmap慢,有hashmap的全部特性。
treemap
基于红黑二叉树的navigablemap的实现,线程非安全,不允许null,key不可以重复,value允许重复,存入treemap的元素应当实现comparable接口或者实现comparator接口,会按照排序后的顺序迭代元素,两个相比较的key不得抛出classcastexception。主要用于存入元素的时候对元素进行自动排序,迭代输出的时候就按排序顺序输出
遍历
第一种:keyset()
将map中所有的键存入到set集合中。因为set具备迭代器。所有可以迭代方式取出所有的键,再根据get方法。获取每一个键对应的值。 keyset():迭代后只能通过get()取key 。
取到的结果会乱序,是因为取得数据行主键的时候,使用了hashmap.keyset()方法,而这个方法返回的set结果,里面的数据是乱序排放的。
map map = new hashmap(); map.put("key1","lisi1"); map.put("key2","lisi2"); map.put("key3","lisi3"); map.put("key4","lisi4"); //先获取map集合的所有键的set集合,keyset() iterator it = map.keyset().iterator(); //获取迭代器 while(it.hasnext()){ object key = it.next(); system.out.println(map.get(key)); }
第二种: values() 获取所有的值.
collection values()不能获取到key对象
collection<string> vs = map.values(); iterator<string> it = vs.iterator(); while (it.hasnext()) { string value = it.next(); system.out.println(" value=" + value); }
第三种:entryset()
set<map.entry<k,v>> entryset() //返回此映射中包含的映射关系的 set 视图。(一个关系就是一个键-值对),就是把(key-value)作为一个整体一对一对地存放到set集合当中的。map.entry表示映射关系。entryset():迭代后可以e.getkey(),e.getvalue()两种方法来取key和value。返回的是entry接口。
典型用法如下:
// 返回的map.entry对象的set集合 map.entry包含了key和value对象 set<map.entry<integer, string>> es = map.entryset(); iterator<map.entry<integer, string>> it = es.iterator(); while (it.hasnext()) { // 返回的是封装了key和value对象的map.entry对象 map.entry<integer, string> en = it.next(); // 获取map.entry对象中封装的key和value对象 integer key = en.getkey(); string value = en.getvalue(); system.out.println("key=" + key + " value=" + value); }
推荐使用第三种方式,即entryset()方法,效率较高。
对于keyset其实是遍历了2次,一次是转为iterator,一次就是从hashmap中取出key所对于的value。而entryset只是遍历了第一次,它把key和value都放到了entry中,所以快了。两种遍历的遍历时间相差还是很明显的。
5 总结
5.1 知识点总结
l list与set集合的区别?
list:
它是一个有序的集合(元素存与取的顺序相同)
它可以存储重复的元素
set:
它是一个无序的集合(元素存与取的顺序可能不同)
它不能存储重复的元素
l list集合中的特有方法
l void add(int index, object element) 将指定的元素,添加到该集合中的指定位置上
l object get(int index)返回集合中指定位置的元素。
l object remove(int index) 移除列表中指定位置的元素, 返回的是被移除的元素
l object set(int index, object element)用指定元素替换集合中指定位置的元素,返回值的更新前的元素
l arraylist:
底层数据结构是数组,查询快,增删慢
l linkedlist:
底层数据结构是链表,查询慢,增删快
l hashset:
元素唯一,不能重复
底层结构是 哈希表结构
元素的存与取的顺序不能保证一致
如何保证元素的唯一的?
重写hashcode() 与 equals()方法
l linkedhashset:
元素唯一不能重复
底层结构是 哈希表结构 + 链表结构
元素的存与取的顺序一致
map:
hashmap与treemap
1、 hashmap通过hashcode对其内容进行快速查找,而treemap中所有的元素都保持着某种固定的顺序,如果你需要得到一个有序的结果你就应该使用treemap(hashmap中元素的排列顺序是不固定的)。
2、在map 中插入、删除和定位元素,hashmap是最好的选择。但如果您要按自然顺序或自定义顺序遍历键,那么treemap会更好。使用hashmap要求添加的键类明确定义了hashcode()和 equals()的实现。
两个map中的元素一样,但顺序不一样,导致hashcode()不一样。
同样做测试:
在hashmap中,同样的值的map,顺序不同,equals时,false;
而在treemap中,同样的值的map,顺序不同,equals时,true,说明,treemap在equals()时是整理了顺序了的。
hashtable与hashmap
1、同步性:hashtable是线程安全的,也就是说是同步的,而hashmap是线程序不安全的,不是同步的。
2、hashmap允许存在一个为null的key,多个为null的value 。
3、hashtable的key和value都不允许为null。
推荐阅读
-
.NET Core 使用NPOI读取Excel返回泛型List集合
-
四种常见的数据结构、LinkedList、Set集合、Collection、Map总结
-
像使用SQL一样对List对象集合进行排序
-
详解ES6中的 Set Map 数据结构学习总结
-
python 集合 并集、交集 Series list set 转换的实例
-
【转载】C#中List集合使用RemoveRange方法移除指定索引开始的一段元素
-
List/Map 导出到表格(使用注解和反射)
-
20_集合_第20天(Map、可变参数、Collections)_讲义
-
Python—数据类型之集合(Set)
-
python笔记 list tuple dict set