欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

List、Set、Map集合

程序员文章站 2022-10-06 14:09:52
1 List接口 我们掌握了Collection接口的使用后,再来看看Collection接口中的子类,他们都具备那些特性呢? 接下来,我们一起学习Collection中的常用几个子类(List集合、Set集合)。 1.1 List接口介绍 查阅API,看List的介绍。有序的 collection ......

list接口

我们掌握了collection接口的使用后,再来看看collection接口中的子类,他们都具备那些特性呢?

接下来,我们一起学习collection中的常用几个子类(list集合、set集合)。

1.1 list接口介绍

查阅api,看list的介绍。有序的 collection(也称为序列)。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引(在列表中的位置)访问元素,并搜索列表中的元素。与 set 不同,列表通常允许重复的元素。

看完api,我们总结一下:

list接口:

l 它是一个元素存取有序的集合。例如,存元素的顺序是11、22、33。那么集合中,元素的存储就是按照11、22、33的顺序完成的)。

l 它是一个带有索引的集合,通过索引就可以精确的操作集合中的元素(与数组的索引是一个道理)。

l 集合中可以有重复的元素,通过元素的equals方法,来比较是否为重复的元素。

 

list接口的常用子类有:

l arraylist集合

l linkedlist集合

1.2 list接口中常用的方法

 List、Set、Map集合

 

l 增加元素方法

l add(object e):向集合末尾处,添加指定的元素

l add(int index, object e):向集合指定索引处,添加指定的元素,原有元素依次后移

l 删除元素删除

l remove(object e):将指定元素对象,从集合中删除,返回值为被删除的元素

l remove(int index):将指定索引处的元素,从集合中删除,返回值为被删除的元素

l 替换元素方法

l set(int index, object e):将指定索引处的元素,替换成指定的元素,返回值为替换前的元素

l 查询元素方法

l get(int index):获取指定索引处的元素,并返回该元素

 

方法演示:

list<string> list = new arraylist<string>();

//1,添加元素。

list.add("小红");

list.add("小梅");

list.add("小强");

//2,插入元素。插入元素前的集合["小红","小梅","小强"]

list.add(1, "老王"); //插入元素后的集合["小红","老王","小梅","小强"]

//3,删除元素。

list.remove(2);// 删除元素后的集合["小红","老王","小强"]

//4,修改元素。

list.set(1, "隔壁老王");// 修改元素后的集合["小红","隔壁老王","小强"]

 

iterator<string> it = list.iterator();

while (it.hasnext()) {

string str = it.next();

system.out.println(str);

}

由于list集合拥有索引,因此list集合迭代方式除了使用迭代器之外,还可以使用索引进行迭代。

for (int i = 0; i < list.size(); i++) {

string str = list.get(i);

system.out.println(str);

}

 

1.2.1 iterator的并发修改异常

在list集合迭代元素中,对元素进行判断,一旦条件满足就添加一个新元素。代码如下

public class iteratordemo {

//在list集合迭代元素中,对元素进行判断,一旦条件满足就添加一个新元素

public static void main(string[] args) {

//创建list集合

list<string> list = new arraylist<string>();

//给集合中添加元素

list.add("abc1");

list.add("abc2");

list.add("abc3");

list.add("abc4");

//迭代集合,当有元素为"abc2"时,集合加入新元素"itcast"

iterator<string> it = list.iterator();

while(it.hasnext()){

string str = it.next();

//判断取出的元素是否是"abc2",是就添加一个新元素

if("abc2".equals(str)){

list.add("itcast");// 该操作会导致程序出错

}

}

//打印容器中的元素

system.out.println(list);

}

}

运行上述代码发生了错误 java.util.concurrentmodificationexception这是什么原因呢?

在迭代过程中,使用了集合的方法对元素进行操作。导致迭代器并不知道集合中的变化,容易引发数据的不确定性。

并发修改异常解决办法:在迭代时,不要使用集合的方法操作元素。

那么想要在迭代时对元素操作咋办?通过listiterator迭代器操作元素是可以的,listiterator的出现,解决了使用iterator迭代过程中可能会发生的错误情况。

 

1.3 list集合存储数据的结构

list接口下有很多个集合,它们存储元素所采用的结构方式是不同的,这样就导致了这些集合有它们各自的特点,供给我们在不同的环境下进行使用。数据存储的常用结构有:堆栈、队列、数组、链表。我们分别来了解一下:

l 堆栈,采用该结构的集合,对元素的存取有如下的特点:

l 先进后出(即,存进去的元素,要在后它后面的元素依次取出后,才能取出该元素)。例如,子弹压进弹夹,先压进去的子弹在下面,后压进去的子弹在上面,当开枪时,先弹出上面的子弹,然后才能弹出下面的子弹。

l 栈的入口、出口的都是栈的顶端位置

l 压栈:就是存元素。即,把元素存储到栈的顶端位置,栈中已有元素依次向栈底方向移动一个位置。

l 弹栈:就是取元素。即,把栈的顶端位置元素取出,栈中已有元素依次向栈顶方向移动一个位置。

 List、Set、Map集合

 

 

l 队列,采用该结构的集合,对元素的存取有如下的特点:

l 先进先出(即,存进去的元素,要在后它前面的元素依次取出后,才能取出该元素)。例如,安检。排成一列,每个人依次检查,只有前面的人全部检查完毕后,才能排到当前的人进行检查。

l 队列的入口、出口各占一侧。例如,下图中的左侧为入口,右侧为出口。

 

 List、Set、Map集合

 

l 数组,采用该结构的集合,对元素的存取有如下的特点:

l 查找元素快:通过索引,可以快速访问指定位置的元素

l 增删元素慢:

指定索引位置增加元素:需要创建一个新数组,将指定新元素存储在指定索引位置,再把原数组元素根据索引,复制到新数组对应索引的位置。如下图

指定索引位置删除元素:需要创建一个新数组,把原数组元素根据索引,复制到新数组对应索引的位置,原数组中指定索引位置元素不复制到新数组中。如下图

 

 List、Set、Map集合

 

l 链表,采用该结构的集合,对元素的存取有如下的特点:

l 多个节点之间,通过地址进行连接。例如,多个人手拉手,每个人使用自己的右手拉住下个人的左手,依次类推,这样多个人就连在一起了。

l 查找元素慢:想查找某个元素,需要通过连接的节点,依次向后查找指定元素

l 增删元素快:

l 增加元素:操作如左图,只需要修改连接下个元素的地址即可。

l 删除元素:操作如右图,只需要修改连接下个元素的地址即可。

 

 List、Set、Map集合

 

1.4 arraylist集合

arraylist集合数据存储的结构是数组结构。元素增删慢,查找快,由于日常开发中使用最多的功能为查询数据、遍历数据,所以arraylist是最常用的集合。

许多程序员开发时非常随意地使用arraylist完成任何需求,并不严谨,这种用法是不提倡的。

1.5 linkedlist集合

linkedlist集合数据存储的结构是链表结构。方便元素添加、删除的集合。实际开发中对一个集合元素的添加与删除经常涉及到首尾操作,而linkedlist提供了大量首尾操作的方法。如下图

 

 List、Set、Map集合

 

linkedlist是list的子类,list中的方法linkedlist都是可以使用,这里就不做详细介绍,我们只需要了解linkedlist的特有方法即可。在开发时,linkedlist集合也可以作为堆栈,队列的结构使用。

方法演示:

linkedlist<string> link = new linkedlist<string>();

//添加元素

link.addfirst("abc1");

link.addfirst("abc2");

link.addfirst("abc3");

//获取元素

system.out.println(link.getfirst());

system.out.println(link.getlast());

//删除元素

system.out.println(link.removefirst());

system.out.println(link.removelast());

 

while(!link.isempty()){ //判断集合是否为空

system.out.println(link.pop()); //弹出集合中的栈顶元素

       }

 List、Set、Map集合

1.6 vector集合

vector集合数据存储的结构是数组结构,为jdk中最早提供的集合。vector中提供了一个独特的取出方式,就是枚举enumeration,它其实就是早期的迭代器。此接口enumeration的功能与 iterator 接口的功能是类似的。vector集合已被arraylist替代。枚举enumeration已被迭代器iterator替代。

l vector常见的方法:

 List、Set、Map集合

 

l enumeration枚举常见的方法:

 List、Set、Map集合

 

l vector集合对arraylist集合使用的对比

 List、Set、Map集合

 

set接口

学习collection接口时,记得collection中可以存放重复元素,也可以不存放重复元素,那么我们知道list中是可以存放重复元素的。那么不重复元素给哪里存放呢?那就是set接口,它里面的集合,所存储的元素就是不重复的。

2.1 set接口介绍

查阅set集合的api介绍,通过元素的equals方法,来判断是否为重复元素,

2.2 hashset集合介绍

查阅hashset集合的api介绍:此类实现set接口,由哈希表支持(实际上是一个 hashmap集合)。hashset集合不能保证的迭代顺序与元素存储顺序相同。

hashset集合,采用哈希表结构存储数据,保证元素唯一性的方式依赖于:hashcode()与equals()方法。

2.3 hashset集合存储数据的结构(哈希表)

什么是哈希表呢?

哈希表底层使用的也是数组机制,数组中也存放对象,而这些对象往数组中存放时的位置比较特殊,当需要把这些对象给数组中存放时,那么会根据这些对象的特有数据结合相应的算法,计算出这个对象在数组中的位置,然后把这个对象存放在数组中。而这样的数组就称为哈希数组,即就是哈希表。

当向哈希表中存放元素时,需要根据元素的特有数据结合相应的算法,这个算法其实就是object类中的hashcode方法。由于任何对象都是object类的子类,所以任何对象有拥有这个方法。即就是在给哈希表中存放对象时,会调用对象的hashcode方法,算出对象在表中的存放位置,这里需要注意,如果两个对象hashcode方法算出结果一样,这样现象称为哈希冲突,这时会调用对象的equals方法,比较这两个对象是不是同一个对象,如果equals方法返回的是true,那么就不会把第二个对象存放在哈希表中,如果返回的是false,就会把这个值存放在哈希表中。

总结:保证hashset集合元素的唯一,其实就是根据对象的hashcode和equals方法来决定的。如果我们往集合中存放自定义的对象,那么保证其唯一,就必须复写hashcode和equals方法建立属于当前对象的比较方式。

 List、Set、Map集合

 

2.4 hashset存储javaapi中的类型元素

给hashset中存储javaapi中提供的类型元素时,不需要重写元素的hashcode和equals方法,因为这两个方法,在javaapi的每个类中已经重写完毕,如string类、integer类等。

l 创建hashset集合,存储string对象。

public class hashsetdemo {

public static void main(string[] args) {

//创建hashset对象

hashset<string> hs = new hashset<string>();

//给集合中添加自定义对象

hs.add("zhangsan");

hs.add("lisi");

hs.add("wangwu");

hs.add("zhangsan");

//取出集合中的每个元素

iterator<string> it = hs.iterator();

while(it.hasnext()){

string s = it.next();

system.out.println(s);

}

}

}

输出结果如下,说明集合中不能存储重复元素:

wangwu

lisi

zhangsan

2.5 hashset存储自定义类型元素

给hashset中存放自定义类型元素时,需要重写对象中的hashcode和equals方法,建立自己的比较方式,才能保证hashset集合中的对象唯一

l 创建自定义对象student

public class student {

private string name;

private int age;

public student(string name, int age) {

super();

this.name = name;

this.age = age;

}

public string getname() {

return name;

}

public void setname(string name) {

this.name = name;

}

public int getage() {

return age;

}

public void setage(int age) {

this.age = age;

}

@override

public string tostring() {

return "student [name=" + name + ", age=" + age + "]";

}

@override

public int hashcode() {

final int prime = 31;

int result = 1;

result = prime * result + age;

result = prime * result + ((name == null) ? 0 : name.hashcode());

return result;

}

@override

public boolean equals(object obj) {

if (this == obj)

return true;

if(!(obj instanceof student)){

system.out.println("类型错误");

return false;

}

student other = (student) obj;

return this.age ==  other.age && this.name.equals(other.name);

}

}

 

l 创建hashset集合,存储student对象。

public class hashsetdemo {

public static void main(string[] args) {

//创建hashset对象

hashset hs = new hashset();

//给集合中添加自定义对象

hs.add(new student("zhangsan",21));

hs.add(new student("lisi",22));

hs.add(new student("wangwu",23));

hs.add(new student("zhangsan",21));

//取出集合中的每个元素

iterator it = hs.iterator();

while(it.hasnext()){

student s = (student)it.next();

system.out.println(s);

}

}

}

输出结果如下,说明集合中不能存储重复元素:

student [name=lisi, age=22]

student [name=zhangsan, age=21]

student [name=wangwu, age=23]

2.6 linkedhashset介绍

我们知道hashset保证元素唯一,可是元素存放进去是没有顺序的,那么我们要保证有序,怎么办呢?

在hashset下面有一个子类linkedhashset,它是链表和哈希表组合的一个数据存储结构。

演示代码如下:

public class linkedhashsetdemo {

public static void main(string[] args) {

set<string> set = new linkedhashset<string>();

set.add("bbb");

set.add("aaa");

set.add("abc");

set.add("bbc");

iterator it = set.iterator();

while (it.hasnext()) {

system.out.println(it.next());

}

}

}

输出结果如下,linkedhashset集合保证元素的存入和取出的顺序:

bbb

aaa

abc

bbc

 

判断集合元素唯一的原理

3.1 arraylist的contains方法判断元素是否重复原理

 List、Set、Map集合

 

arraylist的contains方法会使用调用方法时,传入的元素的equals方法依次与集合中的旧元素所比较,从而根据返回的布尔值判断是否有重复元素。此时,当arraylist存放自定义类型时,由于自定义类型在未重写equals方法前,判断是否重复的依据是地址值,所以如果想根据内容判断是否为重复元素,需要重写元素的equals方法。

3.2 hashset的add/contains等方法判断元素是否重复原理

 List、Set、Map集合

 

set集合不能存放重复元素,其添加方法在添加时会判断是否有重复元素,有重复不添加,没重复则添加。

hashset集合由于是无序的,其判断唯一的依据是元素类型的hashcode与equals方法的返回结果。规则如下:

先判断新元素与集合内已经有的旧元素的hashcode值

l 如果不同,说明是不同元素,添加到集合。

l 如果相同,再判断equals比较结果。返回true则相同元素;返回false则不同元素,添加到集合。

所以,使用hashset存储自定义类型,如果没有重写该类的hashcode与equals方法,则判断重复时,使用的是地址值,如果想通过内容比较元素是否相同,需要重写该元素类的hashcode与equals方法。

4 map(键值对、键唯一、值不唯一)

  map集合中存储的是键值对,键不能重复,值可以重复。根据键得到值,对map集合遍历时先得到键的set集合,对set集合进行遍历,得到相应的值。

hashmap

  数组方式存储key/value,线程非安全允许null作为key和value,key不可以重复,value允许重复,不保证元素迭代顺序是按照插入时的顺序,key的hash值是先计算key的hashcode值,然后再进行计算,每次容量扩容会重新计算所以key的hash值,会消耗资源,要求key必须重写equals和hashcode方法

  默认初始容量16,加载因子0.75,扩容为旧容量乘2,查找元素快,如果key一样则比较value,如果value不一样,则按照链表结构存储value,就是一个key后面有多个value;

方法

1、添加:

  v put(k key, v value) (可以相同的key值,但是添加的value值会覆盖前面的,返回值是前一个,如果没有就返回null)

  putall(map<? extends k,? extends v> m) 从指定映射中将所有映射关系复制到此映射中(可选操作)。

2、删除

  remove() 删除关联对象,指定key对象

  clear() 清空集合对象

3、获取

  value get(key) 可以用于判断键是否存在的情况。当指定的键不存在的时候,返回的是null。

4、判断:

  boolean isempty() 长度为0返回true否则false

  boolean containskey(object key) 判断集合中是否包含指定的key

  boolean containsvalue(object value) 判断集合中是否包含指定的value

4、长度:

 int size()

  map的主要的方法就这几个

hashtable

  hashtable与hashmap类似,是hashmap的线程安全版,它支持线程的同步,即任一时刻只有一个线程能写hashtable,因此也导致了hashtale在写入时会比较慢,它继承自dictionary类,不同的是它不允许记录的键或者值为null,同时效率较低。

linkedhashmap

linkedhashmap保存了记录的插入顺序,在用iteraor遍历linkedhashmap时,先得到的记录肯定是先插入的,在遍历的时候会比hashmap慢,有hashmap的全部特性。

treemap

  基于红黑二叉树的navigablemap的实现,线程非安全,不允许null,key不可以重复,value允许重复,存入treemap的元素应当实现comparable接口或者实现comparator接口,会按照排序后的顺序迭代元素,两个相比较的key不得抛出classcastexception。主要用于存入元素的时候对元素进行自动排序,迭代输出的时候就按排序顺序输出

遍历

第一种:keyset()
  将map中所有的键存入到set集合中。因为set具备迭代器。所有可以迭代方式取出所有的键,再根据get方法。获取每一个键对应的值。 keyset():迭代后只能通过get()取key 。
  取到的结果会乱序,是因为取得数据行主键的时候,使用了hashmap.keyset()方法,而这个方法返回的set结果,里面的数据是乱序排放的。

    map map = new hashmap();
    map.put("key1","lisi1");
    map.put("key2","lisi2");
    map.put("key3","lisi3");
    map.put("key4","lisi4");  
    //先获取map集合的所有键的set集合,keyset()
    iterator it = map.keyset().iterator();
    //获取迭代器
    while(it.hasnext()){
        object key = it.next();
        system.out.println(map.get(key));
    }

第二种: values() 获取所有的值.
collection values()不能获取到key对象

        collection<string> vs = map.values();
        iterator<string> it = vs.iterator();
        while (it.hasnext()) {
            string value = it.next();
            system.out.println(" value=" + value);
        }

第三种:entryset()
set<map.entry<k,v>> entryset() //返回此映射中包含的映射关系的 set 视图。(一个关系就是一个键-值对),就是把(key-value)作为一个整体一对一对地存放到set集合当中的。map.entry表示映射关系。entryset():迭代后可以e.getkey(),e.getvalue()两种方法来取key和value。返回的是entry接口。
典型用法如下:

// 返回的map.entry对象的set集合 map.entry包含了key和value对象
        set<map.entry<integer, string>> es = map.entryset();

        iterator<map.entry<integer, string>> it = es.iterator();

        while (it.hasnext()) {
            
            // 返回的是封装了key和value对象的map.entry对象
            map.entry<integer, string> en = it.next();

            // 获取map.entry对象中封装的key和value对象
            integer key = en.getkey();
            string value = en.getvalue();

            system.out.println("key=" + key + " value=" + value);
        }

  推荐使用第三种方式,即entryset()方法,效率较高。
  对于keyset其实是遍历了2次,一次是转为iterator,一次就是从hashmap中取出key所对于的value。而entryset只是遍历了第一次,它把key和value都放到了entry中,所以快了。两种遍历的遍历时间相差还是很明显的。

总结

5.1 知识点总结

l list与set集合的区别?

list:

  它是一个有序的集合(元素存与取的顺序相同)

  它可以存储重复的元素

  set:

  它是一个无序的集合(元素存与取的顺序可能不同)

  它不能存储重复的元素

l list集合中的特有方法

l void add(int index, object element) 将指定的元素,添加到该集合中的指定位置上

l object get(int index)返回集合中指定位置的元素。

l object remove(int index) 移除列表中指定位置的元素, 返回的是被移除的元素

l object set(int index, object element)用指定元素替换集合中指定位置的元素,返回值的更新前的元素

l arraylist:

底层数据结构是数组,查询快,增删慢

l linkedlist:

底层数据结构是链表,查询慢,增删快

l hashset:

元素唯一,不能重复

底层结构是 哈希表结构

元素的存与取的顺序不能保证一致

如何保证元素的唯一的?

重写hashcode() 与 equals()方法

l linkedhashset:

元素唯一不能重复

底层结构是 哈希表结构 + 链表结构

元素的存与取的顺序一致

map:

hashmap与treemap

  1、 hashmap通过hashcode对其内容进行快速查找,而treemap中所有的元素都保持着某种固定的顺序,如果你需要得到一个有序的结果你就应该使用treemap(hashmap中元素的排列顺序是不固定的)。

  2、在map 中插入、删除和定位元素,hashmap是最好的选择。但如果您要按自然顺序或自定义顺序遍历键,那么treemap会更好。使用hashmap要求添加的键类明确定义了hashcode()和 equals()的实现。

  两个map中的元素一样,但顺序不一样,导致hashcode()不一样。

  同样做测试:
    在hashmap中,同样的值的map,顺序不同,equals时,false;
    而在treemap中,同样的值的map,顺序不同,equals时,true,说明,treemap在equals()时是整理了顺序了的。

hashtable与hashmap

  1、同步性:hashtable是线程安全的,也就是说是同步的,而hashmap是线程序不安全的,不是同步的。

  2、hashmap允许存在一个为null的key,多个为null的value 。

  3、hashtable的key和value都不允许为null。