Java集合定义与用法实例总结【Set、List与Map】

程序员文章站 2024-02-23 11:29:46

本文实例讲述了java集合定义与用法。分享给大家供大家参考，具体如下： java集合大体可分为三类，分别是set、list和map，它们都继承了基类接口collectio...

本文实例讲述了java集合定义与用法。分享给大家供大家参考，具体如下：

java集合大体可分为三类，分别是set、list和map，它们都继承了基类接口collection,collection接口定义了众多操作集合的基本方法，如下：

为了访问collection集合，不得不去了解iterator接口。该接口很简单，主要用于定义访问集合的方法，如下：

Java集合定义与用法实例总结【Set、List与Map】

所以上述的三大类子集合必定都继承了上面2个接口。其中set集合要求元素不重复，且内部无序，所以访问时只能根据元素值来访问；list内部为动态数组，支持有序，元素也可重复，所以往往有index；map所代表的集合是具有key-value的映射关系的集合，如哈希表。

1. set

1.1 set不可添加相同元素

import java.util.collection;
import java.util.hashset;
public class testset {
  @suppresswarnings({ "rawtypes", "unchecked" })
  public static void main(string[] args) {
    collection c1 = new hashset();
    person p = new person();
    c1.add(p);
    c1.add(p);
    system.out.println(c1);
    collection c2 = new hashset();
    string str1 = new string("123");
    string str2 = new string("123");
    c2.add(str1);
    c2.add(str2);
    system.out.println(c2);
  }
}
class person {
  public person() {
  }
  public person(string name) {
    this.name = name;
  }
  public string name;
}

运行输出：

[demo.person@1db9742]
[123]

第一次添加了俩次p对象，集合不会重复添加，所以输出了[person@1db9742]，这很合理。但是第二次明明new了两个字符串，str1和str2的引用肯定是不同的，那为什么程序还是会认为是相同的元素呢。查找add(e e)的源码，找到了其中的关键部分，如下

public boolean add(e e) {
  return map.put(e, present)==null;
 }
 public v put(k key, v value) {
  if (key == null)
   return putfornullkey(value);
  int hash = hash(key.hashcode());
  int i = indexfor(hash, table.length);
  for (entry<k,v> e = table[i]; e != null; e = e.next) {
   object k;
   if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
    v oldvalue = e.value;
    e.value = value;
    e.recordaccess(this);
    return oldvalue;
   }
  }
  modcount++;
  addentry(hash, key, value, i);
  return null;
 }

这一句

if (e.hash == hash && ((k = e.key) == key || key.equals(k)))

表明，当两个对象的哈希值相等并且对象的equals方法返回真时，则认为两个对象是相同的，并不会进行后面的addentry操作，即不会添加至集合。

这也就难怪string str1=new string("123")和string str2=new string("123");被认为是同一个对象了，因为string在做equals的时候恰好很特殊，只要值相等，则euqals就返回真。

为了测试源码是否真的是这么执行的，改写程序如下：

import java.util.collection;
import java.util.hashset;
public class testset {
  @suppresswarnings({ "rawtypes", "unchecked" })
  public static void main(string[] args) {
    collection c1 = new hashset();
    c1.add(new a());
    c1.add(new a());
    c1.add(new b());
    c1.add(new b());
    c1.add(new c());
    c1.add(new c());
    system.out.println(c1);
  }
}
class a {
  @override
  public boolean equals(object obj) {
    return true;
  }
  @override
  public int hashcode() {
    return 1;
  }
}
class b {
  @override
  public int hashcode() {
    return 1;
  }
}
class c {
  @override
  public boolean equals(object obj) {
    return true;
  }
}

输出：

[demo.a@1, demo.b@1, demo.b@1, demo.c@1db9742, demo.c@106d69c]

可以看到，b和c的对象都没有被集合认为是同一个对象，而a类中重写的哈希值和equals永远相等，导致a类new出的匿名对象也是相等的，故只添加了一个。

1.2 set不可修改元素的值

import java.util.collection;
import java.util.iterator;
import java.util.hashset;
public class testset {
  @suppresswarnings({ "rawtypes", "unchecked" })
  public static void main(string[] args) {
    collection coll = new hashset();
    coll.add(new person("f"));
    coll.add(new person("l"));
    coll.add(new person("y"));
    system.out.println(coll);// a
    iterator it = coll.iterator();// b
    while (it.hasnext()) {
      person p = (person) it.next();
      if (p.name.equals("f")) {
        p = new person();// c
      }
    }
    iterator it1 = coll.iterator();// d
    while (it1.hasnext()) {
      person p = (person) it1.next();
      system.out.println(p.name);
    }
    system.out.println(coll);
  }
}
class person {
  public person() {
  }
  public person(string name) {
    this.name = name;
  }
  public string name;
}

运行输出：

[demo.person@52e922, demo.person@1db9742, demo.person@106d69c]
y
f
l
[demo.person@52e922, demo.person@1db9742, demo.person@106d69c]

代码输出表明，hashset集合的元素并不是有序的，另外在代码c处取出了元素后，为该元素重新赋值，而后输出发现集合并没有改变，这说明iterator迭代器在提供next的方法里应该是类似于copy的技术，目的就是防止在遍历set集合的时候元素被改变。

2. list

list作为collection的子接口，自然可以调用父接口的基本方法，但由于list集合元素是有序的，所以list接口在父接口的基础上又增加了些方法。这些方法的作用与类父接口类似，只是都会增加一个index参数做为索引。

list中最常用的就是arraylist，它在vector的基础上做了许多改进，下面代码将展示list的基本操作用法：

import java.util.list;
import java.util.arraylist;
import java.util.listiterator;
public class testlist {
  @suppresswarnings({ "rawtypes", "unchecked" })
  public static void main(string[] args) {
    // 向list中添加不同类型的元素，会自动装箱
    list list = new arraylist();
    list.add(1);
    list.add("123");
    list.add(3.14f);
    // 列表元素：[1, 123, 3.14]
    system.out.println("列表元素：" + list);
    // 清除列表
    list.clear();
    list.add("我");
    list.add("们");
    list.add("交");
    list.add("个");
    list.add("朋");
    list.add("友");
    list.add("吧");
    // 列表元素：[我, 们, 交, 个, 朋, 友, 吧]
    system.out.println("列表元素：" + list);
    list sub1 = list.sublist(0, list.size() / 2);
    // 子列表元素：[我, 们, 交]
    system.out.println("子列表元素：" + sub1);
    // 从list中删除sub
    sub1.removeall(list);
    // 列表元素：[个, 朋, 友, 吧]
    system.out.println("列表元素：" + list);
    // 添加至头
    list sub2 = new arraylist();
    sub2.add("我");
    sub2.add("们");
    sub2.add("交");
    system.out.println("子列表元素：" + sub2);
    // 在list中添加sub2
    list.addall(0, sub2);
    system.out.println("列表元素：" + list);
    // 遍历操作
    listiterator iter = list.listiterator();
    system.out.println("--正向遍历--");
    while (iter.hasnext()) {
      system.out.println(iter.next());
    }
    system.out.println("--反向遍历--");
    while (iter.hasprevious()) {
      system.out.println(iter.previous());
    }
  }
}

运行输出：

列表元素：[1, 123, 3.14]
列表元素：[我, 们, 交, 个, 朋, 友, 吧]
子列表元素：[我, 们, 交]
列表元素：[个, 朋, 友, 吧]
子列表元素：[我, 们, 交]
列表元素：[我, 们, 交, 个, 朋, 友, 吧]
--正向遍历--
我
们
交
个
朋
友
吧
--反向遍历--
吧
友
朋
个
交
们
我

list就像是一个动态且元素类型可不一的数组，它不仅具有iterator迭代器，而且还有listiterator，后者就像数组一样，支持正向和反向遍历。

3. map

map是具有映射关系的集合，key做为主键，可以索引到唯一的value，key和value都可以是对象。如果单独取出map里的所有值的话，map看起来就像是set，而又由于它较之set又具有索引功能，所以又似乎有些list的影子。实际上，map的key必须实现equals和hashcode方法，这也就解释了为什么可以将一个对象的引用做为key了(实际上是计算这个对象的hashcode做为主键)，因此不能将同一个对象的引用存入某一个map中。hashset实现了set接口，arraylist实现了list接口，那么单从命名上就能得知，hashmap肯定实现了map接口，map接口的功能如下，

Java集合定义与用法实例总结【Set、List与Map】

在hashset和arraylist都有一个访问迭代器的方法iterator(),在set接口中却没有，毕竟set是key-value组合，取而代之的是一个keyset()方法，用以返回一个实现了set接口的对象，从而又可以进行iterator的操作。

基本操作如下：

import java.util.hashmap;
import java.util.iterator;
public class testmap {
  @suppresswarnings({ "rawtypes", "unchecked" })
  public static void main(string[] args) {
    hashmap hash = new hashmap();
    hash.put("1", "我");
    hash.put("2", "们");
    // 主键可为null，但只能有一个null值的主键
    hash.put(null, null);
    // 值可以为null，可以有很多个值为null
    hash.put("3", null);
    hash.put("4", null);
    system.out.println("直接遍历:" + hash);
    system.out.println("----keysey遍历----:");
    for (object key : hash.keyset()) {
      system.out.println("key:" + key + " value:" + hash.get(key));
    }
    system.out.println("----iterator遍历----:");
    iterator iter = hash.keyset().iterator();
    while (iter.hasnext()) {
      string key = (string) iter.next();
      system.out.println("key:" + key + " value:" + hash.get(key));
    }
  }
}

输出：

直接遍历:{null=null, 1=我, 2=们, 3=null, 4=null}
----keysey遍历----:
key:null value:null
key:1 value:我
key:2 value:们
key:3 value:null
key:4 value:null
----iterator遍历----:
key:null value:null
key:1 value:我
key:2 value:们
key:3 value:null
key:4 value:null

hashmap可以有空key，但是只能有一个，，这符合唯一主键的原则，并且若主键重复了，则会覆盖之前的相同主键。而值却没有限制，有多少个null都可以。此外，在使用hashmap的时候还需要注意下面两点：

1.hashmap是非线程安全的，而hashtable是线程安全的。

对于各种集合的各种操作，其实可以依赖于collections类，该类提供了许多静态操作集合的方法，其中就可以将一个普通集合封装为线程安全的集合，如下

collection c=collections.synchronized(new arraylist());

2.了解hashmap的性能

hashmap利用每一个key的哈希值，去为value找寻存储位置。这个存储位置往往被称为“桶”，当哈希值唯一时，那么一个桶中就只有一个对象，这时情况最理想，然而若非正常情况下(比如重写hashcode强制返回相等)，那么一个桶能就有放多个对象，这时性能最差。

上面说道,hashmap与set、list在某方面都很相似，做为一个强大的集合，它的内部自然也有会动态开辟内存的操作。所有就有了下面几个参数，

capacity(容量)：在初始化hashmap时将会有一个默认值(好象是10吧)，随着集合的大小也会自身调整。
size(元素个数)：有多少个元素size就是多少。
load factor(负载因子)：load factor=size/capacity，取值0~1。

当负载因子很大时，如有90个元素，而集合的容量为100，因子就是0.9，这样情况非常不利于查询操作，因为put和get操作会遍历大量的元素，时间复杂度无形就会增加，但在内存开销上确实是比较节省的，因为集合不会反复的创建，因为每一次扩充集合的操作，就意味着要将原始元素重新插入到新的集合中去，性能开销是很大的。

而当负载因子很小时，查询效率将会非常高（因为遍历少），但是却在内部进行了许多次开辟内存的操作。

因此，在系统中，要根据实际需求正确把握hashmap的用法，如一开始建立集合的时候就知道这个集合非常大，那么就有必要在初始化的时候就指明capacity，不应该使用默认值，这样效率能高点；相反只有少量集合元素时，不应该在创建的时候指定很大的capacity，这明显是在浪费内存。

更多关于java算法相关内容感兴趣的读者可查看本站专题：《java数据结构与算法教程》、《java操作dom节点技巧总结》、《java文件与目录操作技巧汇总》和《java缓存操作技巧汇总》

希望本文所述对大家java程序设计有所帮助。

上一篇： Forms身份认证在IE11下无法保存Cookie的问题

下一篇：利用ascii码传输xml转义字符示例

Java集合定义与用法实例总结【Set、List与Map】

1. set

1.1 set不可添加相同元素

1.2 set不可修改元素的值

2. list

3. map