java 之集合体系（三 set）

程序员文章站 2022-04-15 14:37:48

...

1.set集合

set中的方法和collection中的方法是一样的，没有任何特有方法；主要学习set的子类：HashSet，TreeSet

2.HashSet

特点：无索引，元素不重复（唯一），无序（存取顺序不一致）

	public static void demo1() {
		HashSet<String> hs = new HashSet<>();					//创建HashSet对象
		boolean b1 = hs.add("a");
		boolean b2 = hs.add("a");								//当向set集合中存储重复元素的时候返回为false
		hs.add("b");
		hs.add("c");
		hs.add("d");
		System.out.println(hs);									//HashSet的继承体系中有重写toString方法
		System.out.println(b1);
		System.out.println(b2);
		
		for (String string : hs) {								//只要能用迭代器迭代的,就可以使用增强for循环遍历
			System.out.println(string);
		}
	}

对于基本数据类型的话是可以保证唯一性的，但是对象数据类型的话，存的是引用地址；都是不一样的；我们任务对象的某些属性一样的话就认为这是相同数据；

解决方案：重写复杂数据类型的equals方法和hastCode方法；

	/*@Override
	public boolean equals(Object obj) {
		System.out.println("执行了吗");
		Person p = (Person)obj;
		return this.name.equals(p.name) && this.age == p.age;
	}
	@Override
	public int hashCode() {
		final int NUM = 38;
		return name.hashCode() * NUM + age;
	}*/

这里和hash算法有关；会根据你存入数据的地址算出一个索引，索引就是存储的门牌号（所以是无序的，算出来的值是无序的）；只有当索引相同的时候才会调用equals方法进行比较；其实在开放工具软件中是可以自己生成类的equals和hashCode方法，所以这个两个方法很重要的；

	/*
	 * 为什么是31?
	 * 1,31是一个质数,质数是能被1和自己本身整除的数
	 * 2,31这个数既不大也不小
	 * 3,31这个数好算,2的五次方-1,2向左移动5位
	 */
	@Override
	public int hashCode() {
		final int prime = 31;
		int result = 1;
		result = prime * result + age;
		result = prime * result + ((name == null) ? 0 : name.hashCode());
		return result;
	}
	@Override
	public boolean equals(Object obj) {
		if (this == obj)						//调用的对象和传入的对象是同一个对象
			return true;						//直接返回true
		if (obj == null)						//传入的对象为null
			return false;						//返回false
		if (getClass() != obj.getClass())		//判断两个对象对应的字节码文件是否是同一个字节码
			return false;						//如果不是直接返回false
		Person other = (Person) obj;			//向下转型
		if (age != other.age)					//调用对象的年龄不等于传入对象的年龄
			return false;						//返回false
		if (name == null) {						//调用对象的姓名为null
			if (other.name != null)				//传入对象的姓名不为null
				return false;					//返回false
		} else if (!name.equals(other.name))	//调用对象的姓名不等于传入对象的姓名
			return false;						//返回false
		return true;							//返回true
	}

* 1.HashSet原理
	* 我们使用Set集合都是需要去掉重复元素的, 如果在存储的时候逐个equals()比较, 效率较低,哈希算法提高了去重复的效率, 降低了使用equals()方法的次数
	* 当HashSet调用add()方法存储对象的时候, 先调用对象的hashCode()方法得到一个哈希值, 然后在集合中查找是否有哈希值相同的对象
		* 如果没有哈希值相同的对象就直接存入集合
		* 如果有哈希值相同的对象, 就和哈希值相同的对象逐个进行equals()比较,比较结果为false就存入, true则不存
* 2.将自定义类的对象存入HashSet去重复
	* 类中必须重写hashCode()和equals()方法
	* hashCode(): 属性相同的对象返回值必须相同, 属性不同的返回值尽量不同(提高效率)
	* equals(): 属性相同返回true, 属性不同返回false,返回false的时候存储

LinkedHashSet是hashset的子类：底层使用链表实现的：

特点：链表，元素唯一不重复，存取有顺序（怎么存就怎么取，set集合中唯一一个）

做一个案例：编写一个程序，获取10个1至20的随机数，要求随机数不能重复;不重复所以这里hashset和linkedhashset都可以使用；

			HashSet<Integer> hs = new HashSet<>();		//创建集合对象
			Random r = new Random();					//创建随机数对象
			
			while(hs.size() < 10) {
				int num = r.nextInt(20) + 1;			//生成1到20的随机数
				hs.add(num);
			}
			
			for (Integer integer : hs) {				//遍历集合
				System.out.println(integer);			//打印每一个元素
			}

将集合中的重复元素去掉：

			public static void main(String[] args) {
				ArrayList<String> list = new ArrayList<>();
				list.add("a");
				list.add("a");
				list.add("a");
				list.add("b");
				list.add("b");
				list.add("b");
				list.add("b");
				list.add("c");
				list.add("c");
				list.add("c");
				list.add("c");
				
				System.out.println(list);
				System.out.println("去除重复后:");
				getSingle(list);
				System.out.println(list);
			}
			
			/*
			 * 将集合中的重复元素去掉
			 * 1,void
			 * 2,List<String> list
			 */
			
			public static void getSingle(List<String> list) {
				LinkedHashSet<String> lhs = new LinkedHashSet<>();
				lhs.addAll(list);									//将list集合中的所有元素添加到lhs
				list.clear();										//清空原集合
				list.addAll(lhs);									//将去除重复的元素添回到list中
			}

之前使用创建一个新的ArrayList，使用contain方法判断是否包含元素，来判断是否重复；然后存入的；上面直接使用了set集合，更方便；

3.TreeSet（底层是二叉树数据结构实现）

特点：set的共性元素唯一，元素排序

基本数据类型，treeset是可以自己实现排序的，但是你如果放入复杂数据类型的话就需要程序员自己制定排序的方式；就和元素唯一性去重复是一样的，基本数据类型系统是可以的，当复杂的时候系统根据对象的地址值去判断是否唯一，显然都是不重复的，所以需要重写相应的方法；

这里要让存入对象实现一个接口comparable接口实现compareTo方法；数据的存储方式和compareto的返回结果有关；

compareTo方法中返回一个0时：集合中已经有一个相同的元素；返回0表示每次存入的数据是一样的

返回一个正数的时候：不排序，但是怎么存就怎么取；返回正数表示存在二叉树的右边；

返回一个负数的时候：不排序，但是是倒序的取出；返回负数表示存在二叉树的左边；

ps：字符串中的compareTo比较的是对应码表中的值；

	/*@Override
	//按照年龄排序
	public int compareTo(Person o) {
		int num = this.age - o.age;				//年龄是比较的主要条件
		return num == 0 ? this.name.compareTo(o.name) : num;//姓名是比较的次要条件
	}*/
	/*@Override
	//按照姓名排序
	public int compareTo(Person o) {
		int num = this.name.compareTo(o.name);		//姓名是主要条件
		return num == 0 ? this.age - o.age : num;	//年龄是次要条件
	}*/

通过比较器来排序：

实现compartor接口；

class CompareByLen /*extends Object*/ implements Comparator<String> {

	@Override
	public int compare(String s1, String s2) {		//按照字符串的长度比较
		int num = s1.length() - s2.length();		//长度为主要条件
		return num == 0 ? s1.compareTo(s2) : num;	//内容为次要条件
	}
	
}

		//需求:将字符串按照长度排序
		TreeSet<String> ts = new TreeSet<>(new CompareByLen());		//Comparator c = new CompareByLen();
		ts.add("aaaaaaaa");
		ts.add("z");
		ts.add("wc");
		ts.add("nba");
		ts.add("cba");
		
		System.out.println(ts);

Treeset总结：

* 1.特点
    * TreeSet是用来排序的, 可以指定一个顺序, 对象存入之后会按照指定的顺序排列
* 2.使用方式
    * a.自然顺序(Comparable)
        * TreeSet类的add()方法中会把存入的对象提升为Comparable类型
        * 调用对象的compareTo()方法和集合中的对象比较
        * 根据compareTo()方法返回的结果进行存储
    * b.比较器顺序(Comparator)
        * 创建TreeSet的时候可以制定一个Comparator
        * 如果传入了Comparator的子类对象, 那么TreeSet就会按照比较器中的顺序排序
        * add()方法内部会自动调用Comparator接口中compare()方法排序
        * 调用的对象是compare方法的第一个参数,集合中的对象是compare方法的第二个参数
    * c.两种方式的区别
        * TreeSet构造函数什么都不传, 默认按照类中Comparable的顺序(没有就报错ClassCastException)
        * TreeSet如果传入Comparator, 就优先按照Comparator

案例：

* 在一个集合中存储了无序并且重复的字符串,定义一个方法,让其有序(字典顺序),而且还不能去除重复

			public static void main(String[] args) {
				ArrayList<String> list = new ArrayList<>();
				list.add("ccc");
				list.add("ccc");
				list.add("aaa");
				list.add("aaa");
				list.add("bbb");
				list.add("ddd");
				list.add("ddd");
				
				sort(list);
				System.out.println(list);
			}
			
			/*
			 * 对集合中的元素排序,并保留重复
			 * 1,void
			 * 2,List<String> list
			 */
			public static void sort(List<String> list) {
				TreeSet<String> ts = new TreeSet<>(new Comparator<String>() {//定义比较器(new Comparator(){}是Comparator的子类对象)
		
					@Override
					public int compare(String s1, String s2) {	//重写compare方法
						int num = s1.compareTo(s2);		
						return num == 0 ? 1 : num;		//比较内容如果内容一样返回一个不为0的数字即可	
					}
				});
				
				ts.addAll(list);	//将list集合中的所有元素添加到ts中
				list.clear();		//清空list
				list.addAll(ts);	//将ts中排序并保留重复的结果在添加到list中
			}

总结

* 1.List
    * a.普通for循环, 使用get()逐个获取
    * b.调用iterator()方法得到Iterator, 使用hasNext()和next()方法
    * c.增强for循环, 只要可以使用Iterator的类都可以用
    * d.Vector集合可以使用Enumeration的hasMoreElements()和nextElement()方法

* 普通for循环,迭代器,增强for循环是否可以在遍历的过程中删除
* 2.Set（没有索引，不能获取指定 i 的元素）
* a.调用iterator()方法得到Iterator, 使用hasNext()和next()方法
* b.增强for循环, 只要可以使用Iterator的类都可以用

java 之集合体系（三 set）

1.set集合

2.HashSet

3.TreeSet（底层是二叉树数据结构实现）

通过比较器来排序：

Treeset总结：

总结

JavaScript数据结构与算法之集合(Set)

Java之List和Set

跟老齐学Python之集合(set)

List、Set集合系列之剖析HashSet存储原理（HashMap底层）

Java8新特性（三）集合之 Stream 流式操作

java基础(一)-----java的三大特性之封装

深入探索Java设计模式（三）之装饰器模式

Java中的容器（集合）之ArrayList源码解析

Python—数据类型之集合(Set)

JavaScript之Map和Set_动力节点Java学院整理