欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Java内功心法,Set集合的详解

程序员文章站 2022-10-25 19:47:46
Set:注重独一无二的性质,该体系集合可以知道某物是否已近存在于集合中,不会存储重复的元素 用于存储无序(存入和取出的顺序不一定相同)元素,值不能重复。 对象的相等性 引用到堆上同一个对象的两个引用是相等的。如果对两个引用调用hashCode方法,会得到相同的结果,如果对象所属的类... ......

本人免费整理了java高级资料,涵盖了java、redis、mongodb、mysql、zookeeper、spring cloud、dubbo高并发分布式等教程,一共30g,需要自己领取。
传送门https://mp.weixin.qq.com/s/jzddfh-7ynudmkjt0irl8q

一,set

set:注重独一无二的性质,该体系集合可以知道某物是否已近存在于集合中,不会存储重复的元素

用于存储无序(存入和取出的顺序不一定相同)元素,值不能重复。

对象的相等性

引用到堆上同一个对象的两个引用是相等的。如果对两个引用调用hashcode方法,会得到相同的结果,如果对象所属的类没有覆盖object的hashcode方法的话,hashcode会返回每个对象特有的序号(java是依据对象的内存地址计算出的此序号),所以两个不同的对象的hashcode值是不可能相等的。

如果想要让两个不同的person对象视为相等的,就必须覆盖object继下来的hashcode方法和equals方法,因为object hashcode方法返回的是该对象的内存地址,所以必须重写hashcode方法,才能保证两个不同的对象具有相同的hashcode,同时也需要两个不同对象比较equals方法会返回true

该集合中没有特有的方法,直接继承自collection。

---| itreable      接口 实现该接口可以使用增强for循环
                ---| collection        描述所有集合共性的接口
                    ---| list接口        可以有重复元素的集合
                            ---| arraylist   
                            ---|  linkedlist
                    ---| set接口        不可以有重复元素的集合
 

 

案例:set集合添加元素并使用迭代器迭代元素。

public class demo4 {
    public static void main(string[] args) {
        //set 集合存和取的顺序不一致。
        set hs = new hashset();
        hs.add("世界军事");
        hs.add("兵器知识");
        hs.add("舰船知识");
        hs.add("汉和防务");
        system.out.println(hs);
        // [舰船知识, 世界军事, 兵器知识, 汉和防务]
        iterator it = hs.iterator();
        while (it.hasnext()) {
            system.out.println(it.next());
        }
    }
}

 

 

二,hashset

---| itreable      接口 实现该接口可以使用增强for循环
                ---| collection        描述所有集合共性的接口
                    ---| list接口        可以有重复元素的集合
                            ---| arraylist   
                            ---|  linkedlist
                    ---| set接口        不可以有重复元素的集合
                            ---| hashset  线程不安全,存取速度快。底层是以哈希表实现的。

 

hashset

哈希表边存放的是哈希值。hashset存储元素的顺序并不是按照存入时的顺序(和list显然不同) 是按照哈希值来存的所以取数据也是按照哈希值取得。

hashset不存入重复元素的规则.使用hashcode和equals

由于set集合是不能存入重复元素的集合。那么hashset也是具备这一特性的。hashset如何检查重复?hashset会通过元素的hashcode()和equals方法进行判断元素师否重复。

当你试图把对象加入hashset时,hashset会使用对象的hashcode来判断对象加入的位置。同时也会与其他已经加入的对象的hashcode进行比较,如果没有相等的hashcode,hashset就会假设对象没有重复出现。

简单一句话,如果对象的hashcode值是不同的,那么hashset会认为对象是不可能相等的。

因此我们自定义类的时候需要重写hashcode,来确保对象具有相同的hashcode值。

如果元素(对象)的hashcode值相同,是不是就无法存入hashset中了? 当然不是,会继续使用equals 进行比较.如果 equals为true 那么hashset认为新加入的对象重复了,所以加入失败。如果equals 为false那么hashset 认为新加入的对象没有重复.新元素可以存入.

 

总结:

元素的哈希值是通过元素的hashcode方法 来获取的, hashset首先判断两个元素的哈希值,如果哈希值一样,接着会比较equals方法 如果 equls结果为true ,hashset就视为同一个元素。如果equals 为false就不是同一个元素。

哈希值相同equals为false的元素是怎么存储呢,就是在同样的哈希值下顺延(可以认为哈希值相同的元素放在一个哈希桶中)。也就是哈希一样的存一列。

hashtable

Java内功心法,Set集合的详解

图1:hashcode值不相同的情况

图2:hashcode值相同,但equals不相同的情况。

hashset:通过hashcode值来确定元素在内存中的位置。一个hashcode位置上可以存放多个元素。

当hashcode() 值相同equals() 返回为true 时,hashset 集合认为这两个元素是相同的元素.只存储一个(重复元素无法放入)。调用原理:先判断hashcode 方法的值,如果相同才会去判断equals 如果不相同,是不会调用equals方法的。

hashset到底是如何判断两个元素重复。

通过hashcode方法和equals方法来保证元素的唯一性,add()返回的是boolean类型

判断两个元素是否相同,先要判断元素的hashcode值是否一致,只有在该值一致的情况下,才会判断equals方法,如果存储在hashset中的两个对象hashcode方法的值相同equals方法返回的结果是true,那么hashset认为这两个元素是相同元素,只存储一个(重复元素无法存入)。

注意:hashset集合在判断元素是否相同先判断hashcode方法,如果相同才会判断equals。如果不相同,是不会调用equals方法的。

hashset 和arraylist集合都有判断元素是否相同的方法,

boolean contains(object o)

hashset使用hashcode和equals方法,arraylist使用了equals方法

 

案例:

使用hashset存储字符串,并尝试添加重复字符串

回顾string类的equals()、hashcode()两个方法。

public class demo4 {
    public static void main(string[] args) {
        // set 集合存和取的顺序不一致。
        set hs = new hashset();
        hs.add("世界军事");
        hs.add("兵器知识");
        hs.add("舰船知识");
        hs.add("汉和防务");
        // 返回此 set 中的元素的数量
        system.out.println(hs.size()); // 4
        // 如果此 set 尚未包含指定元素,则返回 true
        boolean add = hs.add("世界军事"); // false
        system.out.println(add);
        // 返回此 set 中的元素的数量
        system.out.println(hs.size());// 4
        iterator it = hs.iterator();
        while (it.hasnext()) {
            system.out.println(it.next());
        }
    }
}

 

 

使用hashset存储自定义对象,并尝试添加重复对象(对象的重复的判定)

public class demo4 {
    public static void main(string[] args) {
        hashset hs = new hashset();
        hs.add(new person("jack", 20));
        hs.add(new person("rose", 20));
        hs.add(new person("hmm", 20));
        hs.add(new person("lilei", 20));
        hs.add(new person("jack", 20));
        iterator it = hs.iterator();
        while (it.hasnext()) {
            object next = it.next();
            system.out.println(next);
        }
    }
}
class person {
    private string name;
    private int age;
    person() {
    }
    public person(string name, int age) {
this.name = name;
        this.age = age;
    }
    public string getname() {
        return name;
    }
    public void setname(string name) {
this.name = name;
    }
    public int getage() {
        return age;
    }
    public void setage(int age) {
        this.age = age;
    }
    @override
    public int hashcode() {
        system.out.println("hashcode:" + this.name);
        return this.name.hashcode() + age * 37;
    }
    @override
    public boolean equals(object obj) {
        system.out.println(this + "---equals---" + obj);
        if (obj instanceof person) {
            person p = (person) obj;
            return this.name.equals(p.name) && this.age == p.age;
        } else {
            return false;
        }
    }
    @override
    public string tostring() {
        return "person@name:" + this.name + " age:" + this.age;
    }
}

 

 

问题:现在有一批数据,要求不能重复存储元素,而且要排序。arraylist 、 linkedlist不能去除重复数据。hashset可以去除重复,但是是无序。

所以这时候就要使用treeset了

 

三,treeset

案例:使用treeset集合存储字符串元素,并遍历

public class demo5 {
    public static void main(string[] args) {
        treeset ts = new treeset();
        ts.add("ccc");
        ts.add("aaa");
        ts.add("ddd");
        ts.add("bbb");
        system.out.println(ts); // [aaa, bbb, ccc, ddd]
    }
}

 

 

---| itreable      接口 实现该接口可以使用增强for循环
                ---| collection        描述所有集合共性的接口
                    ---| list接口        有序,可以重复,有角标的集合
                            ---| arraylist   
                            ---|  linkedlist
                    ---| set接口        无序,不可以重复的集合
                            ---| hashset  线程不安全,存取速度快。底层是以hash表实现的。
                            ---| treeset  红-黑树的数据结构,默认对元素进行自然排序(string)。

 

如果在比较的时候两个对象返回值为0,那么元素重复。

红-黑树

红黑树是一种特定类型的二叉树

Java内功心法,Set集合的详解

红黑树算法的规则: 左小右大。

既然treeset可以自然排序,那么treeset必定是有排序规则的。

1:让存入的元素自定义比较规则。

2:给treeset指定排序规则。

方式一:元素自身具备比较性

元素自身具备比较性,需要元素实现comparable接口,重写compareto方法,也就是让元素自身具备比较性,这种方式叫做元素的自然排序也叫做默认排序。

方式二:容器具备比较性

当元素自身不具备比较性,或者自身具备的比较性不是所需要的。那么此时可以让容器自身具备。需要定义一个类实现接口comparator,重写compare方法,并将该接口的子类实例对象作为参数传递给treemap集合的构造方法。

注意:当comparable比较方式和comparator比较方式同时存在时,以comparator的比较方式为主;

注意:在重写compareto或者compare方法时,必须要明确比较的主要条件相等时要比较次要条件。(假设姓名和年龄一直的人为相同的人,如果想要对人按照年龄的大小来排序,如果年龄相同的人,需要如何处理?不能直接return 0,因为可能姓名不同(年龄相同姓名不同的人是不同的人)。此时就需要进行次要条件判断(需要判断姓名),只有姓名和年龄同时相等的才可以返回0.)

通过return 0来判断唯一性。

 

问题:为什么使用treeset存入字符串,字符串默认输出是按升序排列的?因为字符串实现了一个接口,叫做comparable 接口.字符串重写了该接口的compareto 方法,所以string对象具备了比较性.那么同样道理,我的自定义元素(例如person类,book类)想要存入treeset集合,就需要实现该接口,也就是要让自定义对象具备比较性.

存入treeset集合中的元素要具备比较性.

比较性要实现comparable接口,重写该接口的compareto方法

treeset属于set集合,该集合的元素是不能重复的,treeset如何保证元素的唯一性

通过compareto或者compare方法中的来保证元素的唯一性。

添加的元素必须要实现comparable接口。当compareto()函数返回值为0时,说明两个对象相等,此时该对象不会添加进来。

比较器接口

----| comparable
               compareto(object o)     元素自身具备比较性
----| comparator
               compare( object o1, object o2 )    给容器传入比较器
 

 

treeset集合排序的两种方式:

一,让元素自身具备比较性。

也就是元素需要实现comparable接口,覆盖compareto 方法。

这种方式也作为元素的自然排序,也可称为默认排序。

年龄按照搜要条件,年龄相同再比姓名。

public class demo4 {
    public static void main(string[] args) {
        treeset ts = new treeset();
        ts.add(new person("aa", 20, "男"));
        ts.add(new person("bb", 18, "女"));
        ts.add(new person("cc", 17, "男"));
        ts.add(new person("dd", 17, "女"));
        ts.add(new person("dd", 15, "女"));
        ts.add(new person("dd", 15, "女"));
        system.out.println(ts);
        system.out.println(ts.size()); // 5
    }
}
class person implements comparable {
    private string name;
    private int age;
    private string gender;
    public person() {
    }
    public person(string name, int age, string gender) {
this.name = name;
        this.age = age;
        this.gender = gender;
    }
    public string getname() {
        return name;
    }
    public void setname(string name) {
this.name = name;
    }
    public int getage() {
        return age;
    }
    public void setage(int age) {
        this.age = age;
    }
    public string getgender() {
        return gender;
    }
    public void setgender(string gender) {
        this.gender = gender;
    }
    @override
    public int hashcode() {
        return name.hashcode() + age * 37;
    }
    public boolean equals(object obj) {
        system.err.println(this + "equals :" + obj);
        if (!(obj instanceof person)) {
            return false;
        }
        person p = (person) obj;
        return this.name.equals(p.name) && this.age == p.age;
    }
    public string tostring() {
        return "person [name=" + name + ", age=" + age + ", gender=" + gender
                + "]";
    }
    @override
    public int compareto(object obj) {
        person p = (person) obj;
        system.out.println(this+" compareto:"+p);
        if (this.age > p.age) {
            return 1;
        }
        if (this.age < p.age) {
            return -1;
        }
        return this.name.compareto(p.name);
    }
}

 

二,让容器自身具备比较性,自定义比较器。

需求:当元素自身不具备比较性,或者元素自身具备的比较性不是所需的。

那么这时只能让容器自身具备。

定义一个类实现comparator 接口,覆盖compare方法。

并将该接口的子类对象作为参数传递给treeset集合的构造函数。

当comparable比较方式,及comparator比较方式同时存在,以comparator

比较方式为主。

public class demo5 {
    public static void main(string[] args) {
        treeset ts = new treeset(new mycomparator());
        ts.add(new book("think in java", 100));
        ts.add(new book("java 核心技术", 75));
        ts.add(new book("现代操作系统", 50));
        ts.add(new book("java就业教程", 35));
        ts.add(new book("think in java", 100));
        ts.add(new book("ccc in java", 100));
        system.out.println(ts); 
    }
}
class mycomparator implements comparator {
    public int compare(object o1, object o2) {
        book b1 = (book) o1;
        book b2 = (book) o2;
        system.out.println(b1+" comparator "+b2);
        if (b1.getprice() > b2.getprice()) {
            return 1;
        }
        if (b1.getprice() < b2.getprice()) {
            return -1;
        }
        return b1.getname().compareto(b2.getname());
    }
}
class book {
    private string name;
    private double price;
    public book() {
    }
    public string getname() {
        return name;
    }
    public void setname(string name) {
this.name = name;
    }
    public double getprice() {
        return price;
    }
    public void setprice(double price) {
        this.price = price;
    }
    public book(string name, double price) {
this.name = name;
        this.price = price;
    }
    @override
    public string tostring() {
        return "book [name=" + name + ", price=" + price + "]";
    }
}

 

 

四,linkedhashset

会保存插入的顺序。

看到array,就要想到角标。

看到link,就要想到first,last。

看到hash,就要想到hashcode,equals.

看到tree,就要想到两个接口。comparable,comparator。