带你从零学大数据系列之Java篇---第十六章:集合基础
课程重点:
- 集合的概念理解
- 集合的基本方法使用
16.1. 集合是的简介
16.1.1. 集合的概念
集合与数组类似, 是一个数据容器, 用来存储引用数据类型的数据。 在Java中, 集合不是泛指某一个类, 而是若干个类组成的数据结构的实现。
Java的集合类是 java.util 包中的重要内容,它允许以各种方式将元素分组,并定义了各种使这些元素更容易操作的方法。
Java集合类是Java将一些基本的和使用频率极高的基础类进行封装和增强后再以一个类的形式提供。
Java集合类是可以往里面保存多个对象的类,存放的是对象,不同的集合类有不同的功能和特点,适合不同的场合,用以解决一些实际问题。
16.1.2. 集合的特点
- 集合类这种框架是高性能的。对基本类集(动态数组,链接表,树和散列表)的实现是高效率的。
- 集合类允许不同类型的集合以相同的方式和高度互操作方式工作
- 集合类容易扩展和修改,程序员可以很容易地稍加改造就能满足自己的数据结构需求
16.1.3. 集合和数组的区别
-
存储的数据类型
- 数组中可以存储基本数据类型的数据, 也可以存储引用数据类型的数据
- 集合中只能存储引用数据类型的数据, 基本数据类型的数据需要进行装箱, 才能存入集合中。
-
长度
- 数组是定长的容器, 一旦实例化完成, 数组的长度不能发生改变。 即数组不能动态添加、删除元素。
- 集合是变长的容器, 长度可以发生改变。 即集合中可以随时添加、删除元素。
-
元素操作
- 数组只能通过下标进行元素的访问, 如果需要其他的操作, 例如排序, 需要自己写算法实现。
- 集合中封装了若干对元素进行操作的方法, 直接使用集合, 比较方便。
16.3.4. 使用集合的好处
-
降低编程难度:
在编程中会经常需要链表、向量等集合类,如果自己动手写代码实现这些类,需要花费较多的时间和精力。调用Java中提供的这些接口和类,可以很容易的处理数据。 -
提升程序的运行速度和质量:
Java提供的集合类具有较高的质量,运行时速度也较快。使用这些集合类提供的数据结构,程序员可以从“重复造*”中解脱出来,将精力专注于提升程序的质量和性能。 -
无需再学习新的APl:
借助泛型,只要了解了这些类的使用方法,就可以将它们应用到很多数据类型中。如果知道了LinkedList<String>的使用方法,也会知道LinkedList<Double>怎么用,则无需为每一种数据类型学习不同的API。 -
增加代码重用性:
也是借助泛型,就算对集合类中的元素类型进行了修改,集合类相关的代码也几乎不用修改。
16.2. Java中的集合框架图
Java中的集合,大致分为两类。分别是 Collection 集合和 Map 集合。
其中,Collection是单列集合的*接口,Map接口是双列集合的*接口。
16.3. Collection集合
16.3.1. 存储特点
Collection接口是单列集合的*接口。 在这种集合中存储的数据, 只占一列。 所有的元素, 直接存储于各种数据结构中。
Collection集合中, 没有下标的概念。
16.3.2. Collection API
16.3.2.1. 接口方法
由于这个接口是单列集合的*接口, 在这里定义的所有的方法, 在所有的实现类中都是可以使用的。
16.3.2.2. 示例代码
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Collection;
/**
* @Description Collection集合的常用的方法
*/
public class Test {
public static void main(String[] args) {
// 1. 实例化一个Collection接口的实现类对象,并向上转型为接口类型
Collection<String> collection = new ArrayList<>();
Collection<String> temp = new ArrayList<>();
// 2. 添加一个元素到集合的末尾
// 返回值是boolean类型的
// 如果本次添加操作,对集合中的数据造成影响了。这个数据的确加到集合中了,会返回true。
// 如果本次添加操作,对集合中的数据没有造成影响,此时会返回false。(Set集合, 因为Set集合是排重的集合, 有时候添加会失败)
collection.add("lucy");
collection.add("lily");
collection.add("polly");
temp.add("Uncle wang");
temp.add("polly");
temp.add("lily");
temp.add("Li Lei");
// 3. 批量添加,将一个集合中的所有的元素,添加到当前集合的末尾
// 返回值boolean
// 如果本次添加操作,对集合中的数据造成影响了。这个数据的确加到集合中了,会返回true。
// 如果本次添加操作,对集合中的数据没有造成影响,此时会返回false。(Set集合, 因为Set集合是排重的集合, 有时候添加会失败)
collection.addAll(temp);
// 4. 删除集合中从前往后第一个匹配到的元素
// 返回值boolean
// 本次删除操作,是否真的删除掉了某些元素。
// 如果删除掉了,本次操作对集合中的数据造成影响了,返回true。
// 否则,返回false。(要删除的这个元素在集合中不存在)
// collection.remove("polly");
// 5. 批量删除。删除所有的在参数集合中存在的元素
// 依次判断当前集合中的每一个元素,是否在参数集合中。
// 如果存在,就删除;如果不存在,就不删除。
// 返回值boolean
// 本次操作,如果成功删除掉数据了,对集合中的数据造成影响了,返回true。
// 否则就返回false。
// collection.removeAll(temp);
// 6. 保留当前集合中,存在于参数集合中的数据,删除其他数据。
// 依次判断当前集合中的每一个元素,是否在参数集合中。
// 如果存在于参数集合中,就保留这个元素。
// 如果不存在于参数集合中,就删除这个元素。
// 返回值boolean
// 本次操作,如果成功删除掉数据了,对集合中的数据造成影响了,返回true。
// 否则就返回false。
// collection.retainAll(temp);
// 7. 清空集合中的所有的数据
// collection.clear();
// 8. 按照条件删除元素
// 依次将集合中的每一个元素,带入到参数Predicate接口的方法中,作为接口方法的参数
// 如果Predicate接口的方法返回值为true,就删除这个元素
// 如果Predicate接口的方法返回值为false,就保留这个元素
// 返回值boolean
// 本次操作,如果成功删除掉数据了,对集合中的数据造成影响了,返回true。
// 否则就返回false。
// collection.removeIf(ele -> ele.matches("[lL].*"));
// 9. 判断一个集合中是否包含指定的元素
boolean ret1 = collection.contains("lily");
System.out.println(ret1);
// 10. 判断是否参数集合中的所有元素都在当前集合中包含
// 只有当参数集合中的每一个元素都在当前集合中包含,才会返回true。
// 但凡参数集合中有任意的元素没有在当前的集合中包含,返回值都是false。
boolean ret2 = collection.containsAll(temp);
System.out.println(ret2);
// 11. 判断当前的集合中有多少元素,类似于数组的长度
int size = collection.size();
System.out.println(size);
// 12. 判断当前集合,是否是空集合
boolean ret3 = collection.isEmpty();
System.out.println(ret3);
// 13. 将集合中的元素转成Object数组
Object[] array = collection.toArray();
// 14. 将集合中的元素转成指定类型的数组
String[] ret4 = collection.toArray(new String[0]);
System.out.println(Arrays.toString(ret4));
System.out.println(collection);
}
}
16.3.3. Collection集合遍历
16.3.3.1. 增强for循环
// 遍历参数集合中的元素
public static void enumuration(Collection<String> collection) {
// 增强for循环
for (String element : collection) {
System.out.println(element);
}
}
注意事项
在使用增强for循环进行元素的遍历过程中, 不要修改集合中的内容 !!! 否则, 会出现 ConcurrentModificationException 。
16.3.3.2. 迭代器
迭代器(Iterator),才是真正用来遍历集合的。
工作原理
- 使用集合的 iterator() 方法,获取到一个迭代器对象。
- 这个迭代器对象, 内部维护了一个引用, 指向集合中的某一个元素。 默认指向-1位。
- 使用next()方法, 向后移动一位元素指向, 并返回新的指向的元素。
- 如果使用next()方法, 向后移动指向的时候, 已经超出了集合的范围, 指向了一个不存在的元素, 会抛出异常 NoSuchElenmentException。
- 一般情况下, 配合 hasNext() 方法一起使用的。
private static void enumunation2(Collection<String> collection) {
// 1. 获取到一个迭代器对象
Iterator<String> iterator = collection.iterator();
// 2. 通过hasNext判断是否还有下一个元素
while (iterator.hasNext()) {
// 3. 向后指向,并返回这个新的指向的元素
String ele = iterator.next();
System.out.println(ele);
}
}
注意事项
在使用迭代器进行元素的遍历过程中, 不要修改集合中的内容 !!! 否则, 会出现 ConcurrentModificationException 。
16.3.3.3. forEach
Java8之后,在Collection集合中添加了一个新的方法 forEach。
方法原型:
default void forEach(Consumer<? super T> action)
方法逻辑:
将集合中的每一个元素,带入到参数Consumer函数式接口的方法中,作为参数。在调用这个方法的时候,可以自定义实现的方式。
示例代码:
private static void enumunation3(Collection<String> collection) {
collection.forEach(System.out::println);
}
推荐阅读
-
带你从零学大数据系列之Java篇---第十九章:集合(Map+Collections)
-
带你从零学大数据系列之Java篇---第二十四章:JVM优化
-
带你从零学大数据系列之Java篇---第六章:面向对象基础
-
带你从零学大数据系列之Java篇---第十四章:正则表达式
-
带你从零学大数据系列之Java篇---第十三章:字符串
-
带你从零学大数据系列之Java篇---第七章:面向对象三大特性
-
凯哥带你从零学大数据系列之Java篇---第十章:包装类和常用类
-
凯哥带你从零学大数据系列之Java篇---第三章:流程控制
-
带你从零学大数据系列之Java篇---第十六章:集合基础
-
带你从零学大数据系列之数据库篇---第一章:MySQL基础