day18
Java集合框架概述
集合、数组都是对多个数据进行存储操作的结构,简称Java容器。
说明:此时的存储,主要指的是内存层面的存储,不涉及到持久化的存储(.txt,.jpg,.avi,数据库中)
数组在内存存储方面的特点:
- 数组初始化以后,长度就确定了。
- 数组声明的类型,就决定了进行元素初始化时的类型
数组在存储数据方面的弊端:
- 数组初始化以后,长度就不可变了,不便于扩展
- 数组中提供的属性和方法少,不便于进行添加、删除、插入等操作,且效率不高。同时无法直接获取存储元素的个数
- 数组存储的数据是有序的、可以重复的。---->存储数据的特点单一
Java 集合类可以用于存储数量不等的多个对象,还可用于保存具有映射关系的关联数组。
集合框架
Collection接口:单列集合,用来存储一个一个的对象
- List接口:存储有序的、可重复的数据。 -->“动态”数组
- ArrayList、LinkedList、Vector
- Set接口:存储无序的、不可重复的数据 -->高中讲的“集合”
- HashSet、LinkedHashSet、TreeSet
Map接口:双列集合,用来存储一对(key - value)一对的数据 -->高中函数:y = f(x)
- HashMap、LinkedHashMap、TreeMap、Hashtable、Properties
Collection接口中的方法的使用
涉及到泛型的,我们暂时不理会,等学到泛型会补充
添加:
boolean add(E e);
boolean addAll(Collection<? extends E> c);
package Collection;
import org.junit.Test;
import java.util.ArrayList;
public class Test1 {
@Test
public void run(){
ArrayList arrList = new ArrayList();
arrList.add(123);
arrList.add("abc");
arrList.add(new People("李四",20));
ArrayList arrList1 = new ArrayList();
arrList1.add(123);
arrList1.add("abc");
arrList1.add(new People("李四",20));
System.out.println(arrList);//[123, abc, aaa@qq.com]
arrList.addAll(arrList1);
System.out.println(arrList);//[123, abc, aaa@qq.com, 123, abc, aaa@qq.com]
}
}
class People{
private String name;
private int age;
public People(String name,int age){
this.name = name;
this.age = age;
}
}
获取有效元素的个数
int size()
@Test
public void run01(){
ArrayList arr = new ArrayList();
arr.add(111);
System.out.println(arr.size());//1
arr.add("1212");
System.out.println(arr.size());//2
}
清空集合
void clear()
@Test
public void run02(){
ArrayList list = new ArrayList();
list.add("qweqe");
list.add("fewfew");
System.out.println(list);//[qweqe, fewfew]
list.clear();
System.out.println(list);//[]
}
是否是空集合
boolean isEmpty()
@Test
public void run03(){
ArrayList list = new ArrayList();
System.out.println(list.isEmpty());//true
list.add("qweqe");
list.add("fewfew");
System.out.println(list.isEmpty());//false
}
是否包含某个元素
boolean contains(Object obj)//是通过元素的equals方法来判断是否是同一个对象
boolean containsAll(Collection c)//也是调用元素的equals方法来比较的。拿两个集合的元素挨个比较。
@Test
public void run04(){
ArrayList list = new ArrayList();
list.add(new People("张三",11));
System.out.println(list.contains(new People("张三",11)));//false
}
输出fasle是因为People没有重写equals方法
为什么需要equals方法
我们看下contains方法
contains—>indexOf(o)
public int indexOf(Object o) {
if (o == null) {
for (int i = 0; i < size; i++)
if (elementData[i]==null)
return i;
} else {
for (int i = 0; i < size; i++)
if (o.equals(elementData[i]))//这里是重点
return i;
}
return -1;
}
当我们重写之后就变成了true,更多的是比较实体内容
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (o == null || getClass() != o.getClass()) return false;
People people = (People) o;
return age == people.age &&
Objects.equals(name, people.name);
}
删除
boolean remove(Object obj)//通过元素的equals方法判断是否是要删除的那个元素。只会删除找到的第一个元素
boolean removeAll(Collection coll)//取当前集合的差集,移除所有相同的元素(equals)
@Test
public void run05(){
ArrayList list = new ArrayList();
list.add(new People("张三",11));
list.add(new People("张三",11));
list.add(new People("张三",11));
System.out.println(list.remove(new People("张三",11)));//true
System.out.println(list);//[People{name='张三', age=11}, People{name='张三', age=11}] 重写了toString方法
}
@Test
public void run05(){
ArrayList list = new ArrayList();
list.add(new People("张三",11));
list.add(new People("张三",11));
list.add(new People("张三",11));
ArrayList list1 = new ArrayList();
list1.add(new People("张三",11));
list1.add("111");
list.removeAll(list1);
System.out.println(list);//[]
}
取两个集合的交集
boolean retainAll(Collection c)//把交集的结果存在当前集合中,不影响c
@Test
public void run06(){
ArrayList list = new ArrayList();
list.add(new People("张三",11));
list.add(new People("张三",11));
ArrayList list1 = new ArrayList();
list1.add(new People("张三",11));
list1.add("111");
list.retainAll(list1);
System.out.println(list);//[People{name='张三', age=11}, People{name='张三', age=11}]
}
集合是否相等
boolean equals(Object obj)
@Test
public void run07(){
ArrayList list = new ArrayList();
list.add(new People("张三",11));
ArrayList list1 = new ArrayList();
list1.add(new People("张三",11));
System.out.println(list.equals(list1));//true,自定义类型也是要通过equals方法的,所以要重写
}
转成对象数组
Object[] toArray()
@Test
public void run08(){
ArrayList list = new ArrayList();
list.add(new People("张三",11));
list.add(new People("李四",12));
System.out.println(Arrays.toString(list.toArray()));//[People{name='张三', age=11}, People{name='李四', age=12}]
}
遍历
Iterator iterator()//返回迭代器对象,用于集合遍历
@Test
public void run09(){
ArrayList list = new ArrayList();
list.add(new People("张三",11));
list.add("qwer");
list.add(new People("李四",12));
list.add(111);
Iterator iterator = list.iterator();
while (iterator.hasNext()){
System.out.println(iterator.next());
}
/*
People{name='张三', age=11}
qwer
People{name='李四', age=12}
111
*/
}
Iterator 仅用于遍历集合,Iterator 本身并不提供承装对象的能力。如果需要创建Iterator 对象,则必须有一个被迭代的集合。
集合对象每次调用iterator()方法都得到一个全新的迭代器对象,默认游标都在集合的第一个元素之前。
Iterator可以删除集合的元素,但是是遍历过程中通过迭代器对象的remove方 法,不是集合对象的remove方法。
如果还未调用next()或在上一次调用 next 方法之后已经调用了 remove 方法,再调用remove都会报IllegalStateException。
@Test
public void run09(){
ArrayList list = new ArrayList();
list.add(new People("张三",11));
list.add("qwer");
list.add(new People("李四",12));
list.add(111);
Iterator iterator = list.iterator();
while (iterator.hasNext()){
// iterator.remove();//java.lang.IllegalStateException
Object next = iterator.next();
if ("qwer".equals(next)){
iterator.remove();
// iterator.remove();//java.lang.IllegalStateException
}
}
System.out.println(list);//[People{name='张三', age=11}, People{name='李四', age=12}, 111]
}
数组—>集合
调用Arrays类的静态方法asList()
@Test
public void run10(){
List<String> list = Arrays.asList(new String[]{"AA", "BB", "CC"});
System.out.println(list);
List arr1 = Arrays.asList(new int[]{123, 456});
System.out.println(arr1.size());//1 放的是这个数组
List arr2 = Arrays.asList(new Integer[]{123, 456});
System.out.println(arr2.size());//2 放的是这个数组中的元素,和基本数据类型构成的数组有区别
}
增强for循环
Java 5.0 提供了 foreach 循环迭代访问 Collection和数组。
遍历操作不需获取Collection或数组的长度,无需使用索引访问元素。
遍历集合的底层调用Iterator完成操作。
foreach还可以用来遍历数组。
for(要遍历的元素类型 遍历后自定义元素的名称 : 要遍历的结构名称){
}
@Test
public void run11(){
List<String> list = Arrays.asList(new String[]{"AA", "BB", "CC"});
for (String s : list){
System.out.println(s);
}
}
/*
AA
BB
CC
*/
list接口
鉴于Java中数组用来存储数据的局限性,我们通常使用List替代数组
List集合类中元素有序、且可重复,集合中的每个元素都有其对应的顺序索引。
List容器中的元素都对应一个整数型的序号记载其在容器中的位置,可以根据序号存取容器中的元素。
JDK API中List接口的实现类常用的有:ArrayList、LinkedList和Vector。
ArrayList:作为List接口的主要实现类;线程不安全的,效率高;底层使用Object[] elementData存储
LinkedList:对于频繁的插入、删除操作,使用此类效率比ArrayList高;底层使用双向链表存储
Vector:作为List接口的古老实现类;线程安全的,效率低;底层使用Object[] elementData存储
ArrayList的源码分析:
jdk 7情况下
- ArrayList list = new ArrayList();//底层创建了长度是10的Object[]数组elementData
- list.add(123);//elementData[0] = new Integer(123);
- …
- list.add(11);//如果此次的添加导致底层elementData数组容量不够,则扩容。
- 默认情况下,扩容为原来的容量的1.5倍,同时需要将原有数组中的数据复制到新的数组中。
- 结论:建议开发中使用带参的构造器:ArrayList list = new ArrayList(int capacity)
jdk 8中ArrayList的变化
- ArrayList list = new ArrayList();//底层Object[] elementData初始化为{}.并没有创建长度为10的数组
- list.add(123);//第一次调用add()时,底层才创建了长度10的数组,并将数据123添加到elementData[0]
- 后续的添加和扩容操作与jdk 7 无异。
小结:jdk7中的ArrayList的对象的创建类似于单例的饿汉式,而jdk8中的ArrayList的对象的创建类似于单例的懒汉式,延迟了数组的创建,节省内存。
LinkedList的源码分析:
LinkedList list = new LinkedList(); 内部声明了Node类型的first和last属性,默认值为null
list.add(123);//将123封装到Node中,创建了Node对象。
其中,Node定义为:体现了LinkedList的双向链表的说法
private static class Node<E> {
E item;
Node<E> next;
Node<E> prev;
Node(Node<E> prev, E element, Node<E> next) {
this.item = element;
this.next = next;
this.prev = prev;
}
}
Vector的源码分析:
jdk7和jdk8中通过Vector()构造器创建对象时,底层都创建了长度为10的数组。
在扩容方面,默认扩容为原来的数组长度的2倍。
面试题:ArrayList、LinkedList、Vector三者的异同?
同:三个类都是实现了List接口,存储数据的特点相同:存储有序的、可重复的数据
不同:见上
list接口中常用的方法
void add(int index, Object ele):在index位置插入ele元素
boolean addAll(int index, Collection eles):从index位置开始将eles中的所有元素添加进来
Object get(int index):获取指定index位置的元素
int indexOf(Object obj):返回obj在集合中首次出现的位置
int lastIndexOf(Object obj):返回obj在当前集合中末次出现的位置
Object remove(int index):移除指定index位置的元素,并返回此元素
Object set(int index, Object ele):设置指定index位置的元素为ele
List subList(int fromIndex, int toIndex):返回从fromIndex到toIndex位置的子集合
总结:常用方法
增:add(Object obj)
删:remove(int index) / remove(Object obj)
改:set(int index, Object ele)
查:get(int index)
插:add(int index, Object ele)
长度:size()
遍历: Iterator迭代器方式
增强for循环
普通的循环
@Test
public void run12(){
ArrayList list = new ArrayList();
list.add("12121");
list.add(2121);
System.out.println(list);//[12121, 2121]
list.add(0,"qwer");
System.out.println(list);//[qwer, 12121, 2121]
list.remove(1);
System.out.println(list);//[qwer, 2121]
list.set(1,"ooooo");
System.out.println(list);//[qwer, ooooo]
for (Object o : list) {
System.out.println(o);
/*
qwer
ooooo
*/
}
}
set接口
Set接口:存储无序的、不可重复的数据 -->高中讲的“集合”
HashSet:作为Set接口的主要实现类;线程不安全的;可以存储null值
LinkedHashSet:作为HashSet的子类;遍历其内部数据时,可以按照添加的顺序遍历
对于频繁的遍历操作,LinkedHashSet效率高于HashSet.
TreeSet:可以按照添加对象的指定属性,进行排序。
Set接口中没有额外定义新的方法,使用的都是Collection中声明过的方法。
要求:向Set(主要指:HashSet、LinkedHashSet)中添加的数据,其所在的类一定要重写hashCode()和equals()
要求:重写的hashCode()和equals()尽可能保持一致性:相等的对象必须具有相等的散列码
重写两个方法的小技巧:对象中用作 equals() 方法比较的 Field,都应该用来计算 hashCode 值。
@Test
public void run13(){
HashSet hashSet = new HashSet();
hashSet.add(new People("张三",14));
hashSet.add(new People("张三",14));
hashSet.add(11);
hashSet.add("qwer");
System.out.println(hashSet);
}
class People implements Comparable{
private String name;
private int age;
public People(String name,int age){
this.name = name;
this.age = age;
}
@Override
public int compareTo(Object o) {
if (o instanceof People){
People p = (People) o;
int res = p.name.compareTo(p.name);
if (res != 0){
return res;
}else {
return Integer.compare(this.age,p.age);
}
}
return 0;
}
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (o == null || getClass() != o.getClass()) return false;
People people = (People) o;
return age == people.age &&
name.equals(people.name);
}
@Override
public int hashCode() {
return Objects.hash(name, age);
}
@Override
public String toString() {
return "People{" +
"name='" + name + '\'' +
", age=" + age +
'}';
}
}
重写 hashCode() 方法的基本原则
- 在程序运行时,同一个对象多次调用 hashCode() 方法应该返回相同的值。
- 当两个对象的 equals() 方法比较返回 true 时,这两个对象的 hashCode() 方法的返回值也应相等。
- 对象中用作 equals() 方法比较的 Field,都应该用来计算 hashCode 值。
重写 equals() 方法的基本原则
当一个类有自己特有的“逻辑相等”概念,当改写equals()的时候,总是要改写hashCode(),根据一个类的equals方法(改写后),两个截然不同的实例有可能在逻辑上是相等的,但是,根据Object.hashCode()方法,它们仅仅是两个对象。
因此,违反了“相等的对象必须具有相等的散列码”。
结论:复写equals方法的时候一般都需要同时复写hashCode方法。通常参与计算hashCode的对象的属性也应该参与到equals()中进行计算。
一、Set:存储无序的、不可重复的数据
以HashSet为例说明:
1. 无序性:不等于随机性。存储的数据在底层数组中并非按照数组索引的顺序添加,而是根据数据的哈希值决定的。(针对的是存储位置,不是输出结果的顺序)
2. 不可重复性:保证添加的元素按照equals()判断时,不能返回true.即:相同的元素只能添加一个。
二、添加元素的过程:以HashSet为例:
我们向HashSet中添加元素a,首先调用元素a所在类的hashCode()方法,计算元素a的哈希值,
此哈希值接着通过某种算法计算出在HashSet底层数组中的存放位置(即为:索引位置),判断
数组此位置上是否已经有元素:
如果此位置上没有其他元素,则元素a添加成功。 --->情况1
如果此位置上有其他元素b(或以链表形式存在的多个元素),则比较元素a与元素b的hash值:
如果hash值不相同,则元素a添加成功。--->情况2
如果hash值相同,进而需要调用元素a所在类的equals()方法:
equals()返回true,元素a添加失败
equals()返回false,则元素a添加成功。--->情况2
对于添加成功的情况2和情况3而言:元素a 与已经存在指定索引位置上数据以链表的方式存储。
jdk 7 :元素a放到数组中,指向原来的元素。
jdk 8 :原来的元素在数组中,指向元素a
总结:七上八下
HashSet底层:数组+链表的结构。
LinkedHashSet
- LinkedHashSet 是 HashSet 的子类
- LinkedHashSet 根据元素的 hashCode 值来决定元素的存储位置,但它同时使用双向链表维护元素的次序,这使得元素看起来是以插入顺序保存的。
- LinkedHashSet插入性能略低于 HashSet,但在迭代访问 Set 里的全部元素时有很好的性能。
- LinkedHashSet 不允许集合元素重复。
TreeSet
自然排序
TreeSet 会调用集合元素的 compareTo(Object obj) 方法来比较元素之间的大小关系,然后将集合元素按升序(默认情况)排列
如果试图把一个对象添加到 TreeSet 时,则该对象的类必须实现 Comparable 接口。
@Test
public void run14(){
TreeSet treeSet = new TreeSet();
treeSet.add(new People("张三",11));
treeSet.add(new People("张三",12));
treeSet.add(new People("张三",13));
treeSet.add(new People("张三",14));
treeSet.add(new People("张三",11));
System.out.println(treeSet);
}
@Override
public int compareTo(Object o) {
if (o instanceof People){
People p = (People) o;
int res = p.name.compareTo(p.name);
if (res != 0){
return res;
}else {
return Integer.compare(this.age,p.age);
}
}
return 0;
}
定制排序
TreeSet的自然排序要求元素所属的类实现Comparable接口,如果元素所属的类没有实现Comparable接口,或不希望按照升序(默认情况)的方式排列元素或希望按照其它属性大小进行排序,则考虑使用定制排序。定制排序,通过Comparator接口来实现。需要重写compare(T o1,T o2)方法。
@Test
public void run14(){
Comparator comparator = new Comparator() {
@Override
public int compare(Object o1, Object o2) {
if(o1 instanceof People && o2 instanceof People){
People u1 = (People) o1;
People u2 = (People) o2;
return Integer.compare(u1.getAge(),u2.getAge());
}else{
throw new RuntimeException("输入的数据类型不匹配");
}
}
};
TreeSet treeSet = new TreeSet(comparator);
treeSet.add(new People("张三",11));
treeSet.add(new People("张三",12));
treeSet.add(new People("张三",13));
treeSet.add(new People("张三",14));
treeSet.add(new People("李四",11));
System.out.println(treeSet);//[People{name='张三', age=11}, People{name='张三', age=12}, People{name='张三', age=13}, People{name='张三', age=14}]
}