Java集合系列-HashMap 1.8(二)
3.5 红黑树
3.5.1 树形化操作
3.5.1.1 操作描述
参照源码
3.5.1.2 源码解析
public class hashmap<k,v> extends abstractmap<k,v> implements map<k,v>, cloneable, serializable { //... // 树形化准备 final void treeifybin(node<k,v>[] tab, int hash) { int n, index; node<k,v> e; if (tab == null || (n = tab.length) < min_treeify_capacity) // 对于触发了树形化操作,但是桶容量还没达到64的情况下优先去做扩容处理,扩容也会分拆链表 resize(); // 定位要做树形下的桶位置,获取桶位元素e else if ((e = tab[index = (n - 1) & hash]) != null) { treenode<k,v> hd = null, tl = null; // 循环遍历链表中的元素,将其改造成为双向链表结构,表头元素为hd do { // 将e元素封装成为树节点treenode treenode<k,v> p = replacementtreenode(e, null); if (tl == null) hd = p; else { p.prev = tl; tl.next = p; } tl = p; } while ((e = e.next) != null); if ((tab[index] = hd) != null) // 执行树形化 hd.treeify(tab); } } // 将node节点封装成树节点 treenode<k,v> replacementtreenode(node<k,v> p, node<k,v> next) { return new treenode<>(p.hash, p.key, p.value, next); } static final class treenode<k,v> extends linkedhashmap.entry<k,v> { //... // 树形化操作 final void treeify(node<k,v>[] tab) { treenode<k,v> root = null;//代表根节点 // 此处循环将this赋值给x,this代表的是当前树节点,这个类是hashmap的内部类用于标识树节点, // this就是当前类的实例,也就是一个树节点,但是是哪个树节点,就要依靠之间的代码上下文来判 // 断了,看看调用该方法的地方有这样的代码:hd.treeify(tab);这就表示当前节点就是那额hd节 // 点,而这个hd节点就是之前改造好的双向链表的表头结点 // 这里循环的是双向链表中的元素 for (treenode<k,v> x = this, next; x != null; x = next) { next = (treenode<k,v>)x.next; x.left = x.right = null; if (root == null) { // root == null的情况是链表头结点的时候才会出现,这时候将这个头结点作为树根节点 x.parent = null;//根节点无父节点 x.red = false;//黑色 root = x;//赋值 } else { // 这里只有非链表头节点才能进来 k k = x.key; int h = x.hash; class<?> kc = null; // 此处循环的是已构建的红黑树的节点,从根节点开始,遍历比较当前链表节点与当前红黑树节点的 // hash值,dir用于保存比较结果,如果当前链表节点小,则dir为-1,否则为1,实际情况却是,能 // 拨到同一个桶位的所有元素的hash值那是一样的呀,所以dir的值是无法依靠hash值比较得出结果 // 的,那么重点就靠最后一个条件判断来得出结果了, for (treenode<k,v> p = root;;) { int dir, ph; k pk = p.key; if ((ph = p.hash) > h) dir = -1; else if (ph < h) dir = 1; else if ((kc == null && (kc = comparableclassfor(k)) == null) || (dir = comparecomparables(kc, k, pk)) == 0) dir = tiebreakorder(k, pk);// 最后需要依靠这个方法来决定dir的值 treenode<k,v> xp = p; // 根据dir的值来决定将当前链表节点保存到当前树节点的左边还是右边, // 或者当前链表节点需要与当前树节点的左节点还是右节点接着比较 // 主要寻找子节点为null的情况,将节点保存到null位置 if ((p = (dir <= 0) ? p.left : p.right) == null) { x.parent = xp; if (dir <= 0) // dir<=0,将链表节点保存到当前树节点的左边子节点位置 xp.left = x; else // dir<=0,将链表节点保存到当前树节点的右边子节点位置 xp.right = x; // 一旦添加的一个新节点,就要进行树平衡操作,以此保证红黑树结构 // 树的平衡操作依靠的就是其左右旋转操作 root = balanceinsertion(root, x); break; } } } } // 最后将组装好的树的根节点保存到桶下标位 moveroottofront(tab, root); } static <k,v> void moveroottofront(node<k,v>[] tab, treenode<k,v> root) { int n; if (root != null && tab != null && (n = tab.length) > 0) { // 首先定位桶下标位 int index = (n - 1) & root.hash; treenode<k,v> first = (treenode<k,v>)tab[index]; // 校验当前桶下标位的值是否为根节点的值,可能会存在不同的原因是树的平衡操作将原本的根节点挪移了 // 如果相同,那么不作任何处理,如果不同,就需要替换桶位元素为树根节点元素,然后改变双向链表结构 // 将root根节点作为双向链表表头元素,为何要替换呢,因为在判断桶位元素类型时会对链表进行遍历,如 // 果桶位置放的不是链表头或者尾元素,遍历将变得非常麻烦 if (root != first) { node<k,v> rn; tab[index] = root; treenode<k,v> rp = root.prev; if ((rn = root.next) != null) ((treenode<k,v>)rn).prev = rp; if (rp != null) rp.next = rn; if (first != null) first.prev = root; root.next = first; root.prev = null; } // 校验链表和树的结构 assert checkinvariants(root); } } //... } //... }
3.5.2 红黑树分拆操作
3.5.2.1 操作描述
很简单,看源码
3.5.2.2 源码解析
public class hashmap<k,v> extends abstractmap<k,v> implements map<k,v>, cloneable, serializable { //... static final class treenode<k,v> extends linkedhashmap.entry<k,v> { //... // 将一颗大树分拆为两颗小树,如果树太小,退化为单向链表 final void split(hashmap<k,v> map, node<k,v>[] tab, int index, int bit) { // this代表当前节点,也就是树的根节点,桶位节点 // map代表当前集合 // tab代表新桶数组 // index代表当前节点的桶位下标 // bit为旧桶容量 treenode<k,v> b = this; // relink into lo and hi lists, preserving order treenode<k,v> lohead = null, lotail = null; treenode<k,v> hihead = null, hitail = null; int lc = 0, hc = 0;// lc表示低位树容量,hc表示高位树容量 for (treenode<k,v> e = b, next; e != null; e = next) { next = (treenode<k,v>)e.next; e.next = null; // 分拆树节点的依据,结果为0的一组(低位组),结果不为0的一组(高位组) if ((e.hash & bit) == 0) { // 组装低位组双向链表 if ((e.prev = lotail) == null) lohead = e; else lotail.next = e; lotail = e; ++lc; } else { // 组装高位组双向链表 if ((e.prev = hitail) == null) hihead = e; else hitail.next = e; hitail = e; ++hc; } } // 针对低位组进行树形化处理,如果该组元素数量少于6个则退化为单向链表 if (lohead != null) { if (lc <= untreeify_threshold) tab[index] = lohead.untreeify(map); else { tab[index] = lohead; if (hihead != null) // (else is already treeified) lohead.treeify(tab); } } // 针对高位组进行树形化处理,如果该组元素少于6个则退化为单向链表 if (hihead != null) { if (hc <= untreeify_threshold) tab[index + bit] = hihead.untreeify(map); else { tab[index + bit] = hihead; if (lohead != null) hihead.treeify(tab); } } } //... } //... }
3.5.3 红黑树添加元素操作
3.5.3.1 操作描述
参照源码
3.5.3.2 源码解析
public class hashmap<k,v> extends abstractmap<k,v> implements map<k,v>, cloneable, serializable { //... static final class treenode<k,v> extends linkedhashmap.entry<k,v> { //... // 红黑树的添加元素,map为当前hashmap,tab为当前桶数组,h为新增元素的key的hash值,k为新增元素的key,v为新增元素的value final treenode<k,v> puttreeval(hashmap<k,v> map, node<k,v>[] tab, int h, k k, v v) { class<?> kc = null; boolean searched = false; // 当前节点是已定位的桶位元素,其实就是树结构的根节点元素 treenode<k,v> root = (parent != null) ? root() : this; for (treenode<k,v> p = root;;) { // dir代表当前树节点与待添加节点的hash比较结果 // ph代表当前树节点的hash值 // pk代表当前树节点的key // 由于一个桶位的所有元素hash值相等,所以最后得出结果需要依靠 int dir, ph; k pk; if ((ph = p.hash) > h) // 如果当前节点的hash值大,dir为-1 dir = -1; else if (ph < h) // 如果当前节点的hash值小,dir为1 dir = 1; else if ((pk = p.key) == k || (k != null && k.equals(pk))) // hash值相等的情况下,如果key也一样直接返回当前节点,返回去之后会执行value的替换操作 return p; else if ((kc == null && (kc = comparableclassfor(k)) == null) || (dir = comparecomparables(kc, k, pk)) == 0) { if (!searched) { treenode<k,v> q, ch; searched = true; if (((ch = p.left) != null && (q = ch.find(h, k, kc)) != null) || ((ch = p.right) != null && (q = ch.find(h, k, kc)) != null)) // 这个找到的q也是与待添加元素key相同的元素,执行替换 return q; } // 最终需要依靠这个方法来得出dir值的结果 dir = tiebreakorder(k, pk); } treenode<k,v> xp = p; // 根据dir的值来决定是当前节点的左侧还是右侧,如果该侧右子节点则继续循环寻找位置,否则直接将新元素添加到该侧子节点位置 if ((p = (dir <= 0) ? p.left : p.right) == null) { node<k,v> xpn = xp.next; treenode<k,v> x = map.newtreenode(h, k, v, xpn);//封装树节点 if (dir <= 0) // dir<=0,将新节点添加到当前节点左侧 xp.left = x; else // 否则将新节点添加到当前节点右侧 xp.right = x; // 设置新节点的链表位置,将其作为xp的下级节点 xp.next = x; x.parent = x.prev = xp; if (xpn != null) // 如果xp节点原本有下级节点xpn,则要将新节点插入到xp和xpn之间(指双向链表中) ((treenode<k,v>)xpn).prev = x; // 插入了新节点之后,要进行树平衡操作,平衡操作完成,将根节点设置为桶位节点 moveroottofront(tab, balanceinsertion(root, x)); return null; } } } final treenode<k,v> root() { for (treenode<k,v> r = this, p;;) { if ((p = r.parent) == null) return r; r = p; } } // 一般我们在hashmap中保存的键值对的类型都是不变的,这一般用泛型控制, // 那么就意味着,两个元素的key的类型时一样的,所以才需要靠其hashcode来决定大小 // system.identityhashcode(parameter)是本地方法,用于获取和hashcode一样的结果, // 这里的hashcode指的是默认的hashcode方法,与某些类重写的无关 static int tiebreakorder(object a, object b) { int d; if (a == null || b == null || (d = a.getclass().getname(). compareto(b.getclass().getname())) == 0) d = (system.identityhashcode(a) <= system.identityhashcode(b) ? -1 : 1); return d; } //... } //... }
3.5.4 红黑树添加元素平衡操作
3.5.4.1 操作描述
3.5.4.1.1 左旋操作描述
绕a节点左旋,等于将a的右子节点b甩上来替换自己的位置,而自己顺势下沉成为其左子节点,这时你会发现,b有三个子节点,明显结构不对,将b的原来的左子节点c转移到下沉的a上,成为其右子节点,旋转结束
其实,要保证左子树节点值小于其根节点,右子树节点值大于其根节点,那么在替换ab节点之后,c节点的值就出现了问题,只有将其挪到a节点右边才能继续保证上面的结构。
首先我们知道b节点为a的右节点,那么b>a,而c为b的左节点,则c<b,而c又位于a的右子树,则c>a,因此:a<c<b。要保证这个式子永远成立,就必须依靠挪移节点来完成。
现在b为最顶部节点且为最大值,那么a和c必须位于其左子树,而c>a则,c必须位于a的右子树,再看看之前的情况,如果a为顶点节点,那么bc均应位于其右子树,而b>c,那么要么b为c的右节点,要么c为b的左节点
3.5.4.1.2 右旋操作描述
绕a几点右旋,等于将a的左子节点b甩上来替换自己的位置,而自己顺势下沉成为其右子节点,这是你会发现,b有三个子节点,明显结构不对,将b的原来的右子节点c转移到下沉的a上,成为其左子节点,旋转结束
首先我们知道b为a的左子节点,所以b<a,再者c为b的右子节点,那么c>b,而c又位于a的左子树,则c<a,最后:a>c>b。要保证这个结果成立,那么再b替换a的位置之后,a下沉为b的右子节点,因为a>b,所以往右走,
这时c和a均位于b的右侧,比较二者发现c<a,那么将c放到a的左侧成为其左子节点
3.5.4.1.3 添加平衡操作描述
新增节点全部初始化为红色节点,然后分以下几种情况:
- 新增节点为根节点:颜色置黑;
- 新增节点父节点为黑色节点或者父节点是根节点(原本为黑色):不操作;
- 新增节点x的父节点为其父节点(x祖节点)的左子节点:
- x祖父节点的右子节点存在并为红色(那么x祖父节点一定是黑色节点):将x的祖父节点置为红色,x的父节点和其兄弟节点置为黑色,然后以x的祖父节点为新的x执行循环;
- x祖父节点无右子节点或为黑色节点:
- 如果x是其父节点的右子节点:执行以x父节点xp为基准的左旋操作,x被甩上来替换xp的位置,并置黑,原x祖父节点(现x节点父节点)置红,然后以该祖父节点右旋,之后x节点再次被甩上来替换了祖父节点xpp的位置,然后以xp为新的x执行循环
- 新增节点x的父节点为其父节点的右子节点:
- x祖父节点的左子节点存在并为红色(那么x祖父节点一定为黑色节点):将x的祖父节点置为红色,x的父节点和其兄弟节点置为黑色,然后以x的祖父节点为新的x执行循环;
- x祖父节点无左子节点或为黑色节点:
- 如果x是其父节点的左子节点:执行以x父节点xp为基准的右旋操作,x被甩上来替换xp的位置,并置黑,原x祖父节点(现x节点父节点)置红,然后以该祖父节点右旋,之后x节点再次被甩上来替换了祖父节点xpp的位置,然后以xp为新的x执行循环
3.5.4.2 源码解析
public class hashmap<k,v> extends abstractmap<k,v> implements map<k,v>, cloneable, serializable { //... static final class treenode<k,v> extends linkedhashmap.entry<k,v> { //... // 左旋操作,其中root为根节点,p为当前节点,r为p的右节点,rl为r的左节点,pp为p的父节点 // 左旋之后,r替换p的位置,rl挪到p的右节点 // 节点位置变换之后,既要改变其父节点的left/right值,也要改变当前节点中parent的值, // 改变是双向的,父子均有指向,改变之后均要修改 static <k,v> treenode<k,v> rotateleft(treenode<k,v> root, treenode<k,v> p) { treenode<k,v> r, pp, rl; if (p != null && (r = p.right) != null) { // 首先将r节点的左子节点(rl)送给p当其右子节点 if ((rl = p.right = r.left) != null) rl.parent = p;//变换rl的父节点为p,原来为r if ((pp = r.parent = p.parent) == null) // 原p节点为根节点的情况,r替换之后,需要重新着色为黑色,保证根节点为黑色 (root = r).red = false; else if (pp.left == p) // 原p节点为其父节点pp的左子节点的情况,r替换后,需要修改pp节点的left指向r节点 pp.left = r; else // 原p节点为其父节点pp的右子节点的情况,r替换后,需要修改pp节点的right指向r节点 pp.right = r; //然后将p节点作为r节点的左子节点,即为p节点顺势下沉为r的左子节点 r.left = p; p.parent = r;//变换p的父节点为r } return root; } // 右旋操作,嘿,那就是左旋的反向操作罢了 // root为根节点,p为当前节点,l为其左子节点,lr为l的右子节点,pp为p的父节点 static <k,v> treenode<k,v> rotateright(treenode<k,v> root, treenode<k,v> p) { treenode<k,v> l, pp, lr; if (p != null && (l = p.left) != null) { // 首先将l的右子节点lr挪给p if ((lr = p.left = l.right) != null) lr.parent = p;//变换lr的父节点为p,原来为l if ((pp = l.parent = p.parent) == null) // 如果p节点是根节点,替换为l之后,l便成为新的根节点,需要重新着色为黑色,保证红黑树结构 (root = l).red = false; else if (pp.right == p) // 如果原p节点是其父节点pp的右子节点,那么需要将其右子节点改成l pp.right = l; else // 如果原p节点是其父节点pp的左子节点,那么需要将其左子节点改成l pp.left = l; // 最后将原p节点置为l节点的右子节点,并修改p的父节点为l l.right = p; p.parent = l; } return root; } // 平衡操作,x为新增节点,root为根节点 static <k,v> treenode<k,v> balanceinsertion(treenode<k,v> root, treenode<k,v> x) { x.red = true;// 新增节点全部为红色节点 for (treenode<k,v> xp, xpp, xppl, xppr;;) { if ((xp = x.parent) == null) { // 1 x为根节点的情况,将其重新着色为黑色 x.red = false; return x; } else if (!xp.red || (xpp = xp.parent) == null) // 2 如果x节点的父节点为黑色,又或者x的父节点是根节点,没有影响,不操作 return root; if (xp == (xppl = xpp.left)) { // 3 如果x节点的父节点是其父节点(x的祖父节点)的左子节点 if ((xppr = xpp.right) != null && xppr.red) { // 3-1 再如果x的祖父节点的右子节点存在且为红色,则将这个节点和x的父节点统统改成黑色, // 再把x的祖父节点改成红色,将x祖父节点作为新的x节点执行循环 xppr.red = false; xp.red = false; xpp.red = true; x = xpp; } else { // 3-2 否则的情况 if (x == xp.right) { // 3-2-1 如果x节点是其父节点的右子节点,则执行以x父节点为基准的左旋操作, // 左旋之后新增节点x替了其原父节点xp,将原xp节点当做现在的x节点,原来的x // 节点是现在x节点的父节点xp,原来的x节点的祖父节还是现在x的祖父节点 root = rotateleft(root, x = xp); xpp = (xp = x.parent) == null ? null : xp.parent; } if (xp != null) {// xp为原来的x节点 // 将xp节点置为黑色 xp.red = false; if (xpp != null) {// xpp还是之前的xpp // 将xpp节点置为红色,然后执行右旋,右旋可以将xpp节点用xp节点替换,红黑交换 xpp.red = true; root = rotateright(root, xpp); } } } } else { // 4 如果x节点的父节点是其父节点(x的祖父节点)的右子节点 if (xppl != null && xppl.red) { // 4-1 再如果x的祖父节点的左子节点存在并且为红色,则将该节点置为黑色, // 将x的父节点置为黑色,祖父节点置为红色,然后把xpp祖父节点作为新的x节点 xppl.red = false; xp.red = false; xpp.red = true; x = xpp; } else { // 4-2 否则的情况 if (x == xp.left) { // 4-2-1 如果x节点是其父节点的左子节点的情况,先以x父节点进行右旋, // 右旋之后原来的xp节点被新的x节点替换,原来的xp节点作为新xp节点的右子节点, // 现在看作为x,然后重新定义xpp,其实xpp位置不变 root = rotateright(root, x = xp); xpp = (xp = x.parent) == null ? null : xp.parent; } if (xp != null) { // 将现在的xp节点置为黑色 xp.red = false; if (xpp != null) { // 将祖父节点置为红色。然后执行左旋,左旋之后,原来的xp节点接替了xpp节点的位置,xpp变成原来xp的左子节点 xpp.red = true; root = rotateleft(root, xpp); } } } } } } //... } //... }
3.5.5 红黑树删除元素操作
3.5.5.1 操作描述
红黑树的节点删除操作主要分为这么三种:
- 待删节点没有子节点
- 待删节点有一个子节点
- 待删节点有两个子节点
针对第一种情况,真的好简单,待删节点即为叶子节点,直接删除即可;
针对第二种情况,也不难,将那个子节点替换待删节点即可;
至于第三种情况,那就麻烦了,但通过变换,可以将其转化为第一种或者第二种情况:处理方式是,找到待删节点的右子树中的最左节点(或者左子树中的最右节点),将其与待删节点互换位置,然后就将情况转换为第一种或者第二种了。
针对第三种情况转换方法的解析:为什么要找到待删节点的右子树最左节点呢,因为红黑树是二叉搜索树,这个二叉搜索树中满足"左子节点<其父节点<其父节点的右子节点"的规则,那么找到的右子树的最左节点,就是整颗树中大于待删节点值的最小值节点了,为了保证二叉搜索树的搜索结构(也就是刚刚那个公式),我们只能找最接近待删节点值的节点值来接替它的位置,如此能保证二叉搜索的结构,但是可能会破坏红黑树的结构,因为如果待删节点为红色,而替换节点为黑色的话,那岂不是在待删节点分支多加了一个黑色节点嘛,还有其他各种情况,种种,需要进行删除节点后的树平衡操作来保证红黑树的结构完整。
下面重点说说删除后的平衡问题:
其实只要待删节点是黑色节点,一旦删除必然会导致分支中黑色节点缺一(红黑树不再平衡),具体情况又分为以下几种:(基础条件:待删节点p为黑色,其只有一个子节点x,操作在待删节点被删除之后,子节点替换其位置之后)
- 如果子节点x为红色节点,那么只需要将其置黑即可;
- 如果子节点x为黑色节点,为保证本分支黑色节点不会再变少,那么只能求助于其兄弟节点分支了:
- x为左子节点:
- x无兄弟节点xpr:以x的父节点xp为基准进行循环;
- x有兄弟节点xpr:
- xpr为红色节点(那么xp必然为黑色节点):将xp置红,xpr置黑,以xp为基准左旋;
解析:开始情况是x分支删除了一个黑色节点,即x分支缺少一个黑色几点,而x的兄弟节点xpr为红色节点,xp为黑色节点,我们将xp和xpr颜色互换,那么在xpr分支黑色节点数量是不变的(只是位置变了),然后我么以红色的xp为基准执行左旋,将黑色的xpr甩上去替换xp的位置,xp作为xpr的左子节点,那么x端分支便多出了xpr这个黑色节点来补足不够的数量,而兄弟分支黑色节点数量还是不变的。 - xpr为黑色节点(那么xp颜色不明):
- 兄弟节点的左子节点和右子节点全null或全黑或一黑一null:将兄弟节点置红,然后以xp为基准进行循环;
- 兄弟节点的左子节点和右子节点全红或一红一null或一红一黑:
- 兄弟节点的右子节点为黑色或null,即兄弟节点的左子节点为红色:将兄弟节点与其做自己节点交换颜色,兄弟节点置红,左子节点置黑,然后以兄弟节点为基准执行右旋操作,将其黑色的左子节点甩上去做自己的父节点,自己做其右子节点,然后将新的兄弟节点xpr(原来的xprl)的颜色置为与xp一致(不明,非黑即白),新的sr(即原来的xpr)置黑(这个置黑的原因是因为右旋操作之前执行了颜色替换,兄弟节点右侧分支少了一个黑色节点,右旋之后变为黑色的sl补充了这个黑色节点,但是现在我们要用sl[新xpr]来替换xp节点[置为xp节点的颜色],那么右侧分支原本用来补充之前缺少的黑色节点又消失了,所以将已知的红色节点sr置为黑色来进行补充),xp置黑,以xp左旋,xpr被甩上来替换xp的位置,xp则是补充给x分支的黑色节点,xpr与以前的xp颜色一致,所以兄弟分支黑色节点不变。
解析:新的sr(即原来的xpr)的原因是因为右旋操作之前执行了颜色替换,兄弟节点右侧分支少了一个黑色节点,右旋之后变为黑色的sl补充了这个黑色节点,但是现在我们要用sl[新xpr]来替换xp节点[置为xp节点的颜色],那么右侧分支原本用来补充之前缺少的黑色节点又消失了,所以将已知的红色节点sr置为黑色来进行补充)
- 兄弟节点的右子节点为黑色或null,即兄弟节点的左子节点为红色:将兄弟节点与其做自己节点交换颜色,兄弟节点置红,左子节点置黑,然后以兄弟节点为基准执行右旋操作,将其黑色的左子节点甩上去做自己的父节点,自己做其右子节点,然后将新的兄弟节点xpr(原来的xprl)的颜色置为与xp一致(不明,非黑即白),新的sr(即原来的xpr)置黑(这个置黑的原因是因为右旋操作之前执行了颜色替换,兄弟节点右侧分支少了一个黑色节点,右旋之后变为黑色的sl补充了这个黑色节点,但是现在我们要用sl[新xpr]来替换xp节点[置为xp节点的颜色],那么右侧分支原本用来补充之前缺少的黑色节点又消失了,所以将已知的红色节点sr置为黑色来进行补充),xp置黑,以xp左旋,xpr被甩上来替换xp的位置,xp则是补充给x分支的黑色节点,xpr与以前的xp颜色一致,所以兄弟分支黑色节点不变。
- xpr为红色节点(那么xp必然为黑色节点):将xp置红,xpr置黑,以xp为基准左旋;
- x为右子节点:与上面的情况正好对称(不再介绍)
- x为左子节点:
貌似有点难...大家要看进去思考才能理解,光看没用!
3.5.5.2 源码解析
public class hashmap<k,v> extends abstractmap<k,v> implements map<k,v>, cloneable, serializable { //... static final class treenode<k,v> extends linkedhashmap.entry<k,v> { //... // 当前节点即为要删除的节点,map为当前集合,tab为当前桶数组 final void removetreenode(hashmap<k,v> map, node<k,v>[] tab, boolean movable) { int n; if (tab == null || (n = tab.length) == 0) return; // 定位待删节点的桶位下标index int index = (n - 1) & hash; treenode<k,v> first = (treenode<k,v>)tab[index], root = first, rl; treenode<k,v> succ = (treenode<k,v>)next, pred = prev; if (pred == null) // 如果当前节点是双向链表头节点/树根节点,则将链表第二元素置为桶位元素,即删除该节点 tab[index] = first = succ; else // 如果当前节点不是双向链表头节点,则将其后置节点赋给其前置节点作为后置节点,即删除该节点 pred.next = succ; if (succ != null) // 修改后置节点中prev指向新的前置元素节点 succ.prev = pred; if (first == null) return; if (root.parent != null) root = root.root(); if (root == null || root.right == null || (rl = root.left) == null || rl.left == null) { // 退化为链表机构 tab[index] = first.untreeify(map); // too small return; } //// 之前的操作是在双向链表中删除当前节点的痕迹,下面是在树结构中删除的操作 // p为待删节点(即当前节点),pl为p的左子节点,pr为p的右子节点, treenode<k,v> p = this, pl = left, pr = right, replacement; if (pl != null && pr != null) { // 当前节点同时拥有左右子节点的情况,sl表示当前节点的右子树的最左节点 // 要删除当前节点,需要找到与当前节点值最靠近的左右两侧的节点之一,这 // 里找的是右侧的,即找的是整个树中大于当前节点值的最小值节点,将找到 // 的节点与待删节点互换,互换之后再删除节点,如果原来的那个最左节点还 // 有右子节点,则将该右子节点替换其父节点(待删节点) treenode<k,v> s = pr, sl; while ((sl = s.left) != null) // find successor s = sl;// 找到右子树的最左节点 boolean c = s.red; s.red = p.red; p.red = c; // swap colors 首先互换颜色 treenode<k,v> sr = s.right;// s为最左节点,那么它不可能有左子节点,最多有右子节点 treenode<k,v> pp = p.parent; if (s == pr) { // p was s's direct parent // 如果找到的s即为待删节点的直接右子节点(说明s无左子节点),那么直接替换这两个节点 p.parent = s; s.right = p; } else { // 否则的情况,先找到s的父节点sp,将其设置为p的父节点, treenode<k,v> sp = s.parent; if ((p.parent = sp) != null) { if (s == sp.left) // 将p作为原来s的父节点的左子节点(即替换p和s的位置) sp.left = p; else // todo 这里是什么意思呢?找的就是sp的最左节点,这里怎么跑到右节点上去了呢,虽然p是要删除的节点 sp.right = p; } // 把p的右子节点pr置为s的右子节点 if ((s.right = pr) != null) // 把s置为pr的父节点 pr.parent = s; } // 替换之后p是无左子节点的,(即原来的s是最左节点,无左子节点) p.left = null; // 把s的右子节点sr置为p的右子节点 if ((p.right = sr) != null) // 把sr的父节点设置为p sr.parent = p; if ((s.left = pl) != null) // 将p的左子节点置为s的左子节点 pl.parent = s; // 把p的父节点设置为s的父节点 if ((s.parent = pp) == null) // 如果p没有父节点,将s节点设置为根节点 root = s; // 否则如果p是其父节点pp的左子节点 else if (p == pp.left) // 现在将s设置为pp的左子节点 pp.left = s; else // 否则如果p是其父节点的右子节点,则将s设置为pp的右子节点 pp.right = s; if (sr != null) // 如果s存在右子节点,则将其置为replacement,现在和待删节点只有右子节点的情况一样 replacement = sr; else // 否则将p置为replacement,至此第一种情况替换结束,现在和待删节点没子节点的情况一样 replacement = p; } else if (pl != null) // 待删节点只有左子节点的情况,将其左子节点置为replacement replacement = pl; else if (pr != null) // 当前节点只有右子节点的情况,将其右子节点置为replacement replacement = pr; else // 待删节点没有子节点的情况,直接将其设置为replacement replacement = p; if (replacement != p) {// 如果待删节点有子节点replacement的情况 // 准备替换replacement节点和p节点 treenode<k,v> pp = replacement.parent = p.parent; if (pp == null) // 待删节点p为根节点的情况,将replacement设置为根节点即可 root = replacement; else if (p == pp.left) // p是作为其父节点pp的左子节点,则将replacement设置为pp的左子节点 pp.left = replacement; else // 否则p是作为其父节点pp的右子节点,则将replacement设置为pp的右子节点 pp.right = replacement; // 最后将p节点的所有关系置空 p.left = p.right = p.parent = null; } // 如果待删节点是红色节点则不影响平衡,无需执行树平衡操作,否则需要进行树平衡操作 treenode<k,v> r = p.red ? root : balancedeletion(root, replacement); // 如果p节点没有任何子节点的情况 if (replacement == p) { // detach // 根据实际情况置空p节点的各属性 treenode<k,v> pp = p.parent; p.parent = null; if (pp != null) { if (p == pp.left) pp.left = null; else if (p == pp.right) pp.right = null; } } if (movable) // 如果可移动,那么将根节点设置为桶位节点 moveroottofront(tab, r); } // 删除节点后的平衡操作,root为根节点,x为上面提到的replacement节点,该节点其实为替换p节点,为其子节点 static <k,v> treenode<k,v> balancedeletion(treenode<k,v> root, treenode<k,v> x) { for (treenode<k,v> xp, xpl, xpr;;) { if (x == null || x == root) // 如果x不存在或者其本来就是根节点,字节返回根节点 return root; else if ((xp = x.parent) == null) { // 如果x节点不存在父节点,那么则其为根节点,但是还未设置为root节点,那么直接置黑色,并将其设置为root节点 x.red = false; return x; } else if (x.red) { // 如果x是红色节点,则将其置黑,因为如果x为红色,那么其父节点p必然为黑色, // 删掉之后,会导致黑色节点减少,正好x为红色拿来补充黑色节点,使黑色节点数不变, // 如果x是黑色,那么就会导致当前分支黑色节点减少,需要使用其他方法进行平衡 x.red = false; return root; } // 如果x为其父节点左子节点(删除后的结果) else if ((xpl = xp.left) == x) { // 如果x存在兄弟节点(其父节点的右子节点),且为红色,那么xp必定为黑色 // 那么就表明x节点分支的黑色节点少了一个,也就是其兄弟节点多一个(其他所有分支都多一个), if ((xpr = xp.right) != null && xpr.red) { // 那么将兄弟节点置黑,父节点置红,这是x分支还是少一个黑节点,兄弟分支黑节点不变 xpr.red = false; xp.red = true; // 再然后执行xp节点的左旋,将其右子节点(即x的兄弟节点)甩上去, // xp作为其左子节点,如此一来将兄弟节点这一黑色几点变成两份之共享, // 无形之中使得x分支黑色节点加1,从而达到平衡 root = rotateleft(root, xp); xpr = (xp = x.parent) == null ? null : xp.right; } if (xpr == null) x = xp;// 如果x没有兄弟节点,那么循环以x的父节点为基准再次进行平衡 else { // 否则,那就是x存在兄弟节点,且为黑色的情况,则其父节点颜色不明,x颜色不明 // sl为兄弟节点的左子节点,sr为兄弟节点右子节点 treenode<k,v> sl = xpr.left, sr = xpr.right; // 如果sr和sl中,全部为null,或者全部为黑色节点,或者有一个为黑色节点,另一个是null if ((sr == null || !sr.red) && (sl == null || !sl.red)) { // 将兄弟节点置为红色 xpr.red = true; x = xp;// 为了循环 } // 否则,就是sl和sr全为红色或者一红一null,或者一红一黑 else { // 如果sr为null(则sl必为红色),或者sr为黑色(则sl必为红色) if (sr == null || !sr.red) { if (sl != null) // 将sl置为黑色 sl.red = false; // 兄弟节点置红 xpr.red = true; // 然后右旋兄弟节点,将其左子节点甩上去做自己的父节点,这时兄弟分支黑节点数量不变 root = rotateright(root, xpr); xpr = (xp = x.parent) == null ? null : xp.right;// 更新xpr的指向,将其指向旋转之后新的兄弟节点,即原来的sl(黑色) } if (xpr != null) { // 将xp和xpr颜色弄一致,因为如果xp是黑色,左旋之后兄弟分支会少一个黑节点, // 这样xpr就会补充这个黑色,如果xp是红色,那么xpr也是红色,左旋之后xpr落座 // xp的位置,还是原来的颜色,而左侧确多出了xp这个黑色节点。 xpr.red = (xp == null) ? false : xp.red; if ((sr = xpr.right) != null) // 将sr置黑即把原来的xpr置黑 sr.red = false; } if (xp != null) { // 将xp置黑 xp.red = false; // 然后在执行xp左旋,等于将sl甩到了xp的位置, // 而且这个sl必然为黑色,是为了补充x分支缺少的那一个黑节点 root = rotateleft(root, xp); } x = root; } } } // 否则如果x是其父节点的右子节点的话 else { // symmetric (对称的) if (xpl != null && xpl.red) { xpl.red = false; xp.red = true; root = rotateright(root, xp); xpl = (xp = x.parent) == null ? null : xp.left; } if (xpl == null) x = xp; else { treenode<k,v> sl = xpl.left, sr = xpl.right; if ((sl == null || !sl.red) && (sr == null || !sr.red)) { xpl.red = true; x = xp; } else { if (sl == null || !sl.red) { if (sr != null) sr.red = false; xpl.red = true; root = rotateleft(root, xpl); xpl = (xp = x.parent) == null ? null : xp.left; } if (xpl != null) { xpl.red = (xp == null) ? false : xp.red; if ((sl = xpl.left) != null) sl.red = false; } if (xp != null) { xp.red = false; root = rotateright(root, xp); } x = root; } } } } } //... } //... }
四、总结
hashmap中涉及到了数组操作,单向链表操作,双向链表操作,红黑树操作:
数组操作:
- hashmap中的数组指的就是桶数组,用于承载链表(的头结点)和红黑树(根节点)
- 数组的创建在第一次往集合中添加元素的时候进行,默认的数组长度为16,也可以手动指定,系统会自动计算一个大于等于给定容量的最小的2的次幂的容量值作为数组初始容量,数组的最大容量为不超过两倍的integer的最大限值。数组还有一个负载因子,默认为0.75,这个值可算是一个时间空间的折中了,一般不会手动修改,但也能手动指定,如果设置过大,查询消耗增加,如果设置过小,空间消耗增加。
- 当向集合中添加一个新元素的时候,通过元素的key的hash算法结果来定位其在数组中的位置,这个hash算法要选择的足够好来使得元素能够尽量平均的散布在数组的各个位置,而不是堆积在几处。
- 数组的容量是不可变的,所以一旦原数组容量受限,一般是创建新的数组来替代,这叫数组的扩容,扩容需要满足一定的条件,hashmap中有一个阈值用于作为扩容的条件,这个值是当前容量和负载因子的乘积,只要当前的集合的元素数量达到了阈值,就要执行扩容操作,当然还有一种情况也要扩容,那就是在单个数组位上的元素数量达到8个时,但数组容量未达到64个时,优先执行数组扩容。数组扩容后新数组为原数组的2倍容量。
单向链表操作:
- hashmap是依靠hash来存储元素的,hash存储总是难以避免碰撞的出现,hashmap使用单向链表来保存发生碰撞的元素。新元素会保存到链表的尾部,如果新元素的key已经存在,那么将会是一个更新操作,不会有新元素增加。
- 数组扩容的时候需要进行元素的迁移,这里就是链表的迁移,链表迁移的时候会触发链表分拆,将一个完整链表分拆成为两个链表,我们成为低位链表和高位链表,低位链表的数组位置同旧数组,而高位链表的数组位置为低位链表数组位+旧数组容量。可见通过链表分拆也是可以降低链表中元素数量的。
- 在jdk1.8以前的版本中在高并发的情况下,hashmap数组扩容的时候可能会出现死循环,这是因为两个线程同时进行扩容和元素迁移时,由于再次对链表元素进行循环头插法存储元素,极可能就会导致出现了循环引用,jdk1.8中已经修复这一bug,采用的是将头插法改为尾插法,而且迁移元素的方式也发生了变化,但是hashmap仍然是线程不安全的集合,多线程环境中最好使用concurrenthashmap。
双向链表操作:
- hashmap中存在双向链表,他是在单向链表元素达到8个,且数组容量达到64位之后执行树形化时转换的,也就是说,hashmap中的红黑树同时也是一个双向链表。这个双向链表的作用是在某些特殊情况下(树太小的时候),在将红黑树退化为单向链表结构时使用的。正因为如此,在红黑树的增删节点、平衡节点的时候还需要保证双向链表的结构。
红黑树操作:
- 这一部分可以算是hashmap中最最复杂难懂的东西了
- 红黑树的树形化操作
- 红黑树的增加元素操作
- 红黑树的增加元素平衡操作
- 红黑树的树分拆操作
- 红黑树的删除元素操作
- 红黑树的删除元素平衡操作
- 红黑树的退化单项链表操作,有两处退化,一处是在扩容时,树分拆之后,子树内元素容量少于6个时,执行退化操作,还有就是在移除树中元素之后,如果树结构满足某些条件则执行退化操作
- 其实平衡的目的就是为了恢复被添加和移除元素操作破坏的红黑树结构罢了,使用的手段无非变色和旋转。
上一篇: iOS 常用的宏定义
推荐阅读
-
List、Set集合系列之剖析HashSet存储原理(HashMap底层)
-
Java自学-集合框架 二叉树
-
java中集合(LinkedList、HashSet、HashMap、HashTable、Collection、Collections)
-
Java自学-集合框架 HashMap和Hashtable的区别
-
Java中的容器(集合)之HashMap源码解析
-
Java基础系列--08_集合1
-
java教程系列二:Java JDK,JRE和JVM分别是什么?
-
Java集合系列(二):ArrayList、LinkedList、Vector的使用方法及区别
-
【集合系列】- 深入浅出分析HashMap
-
JAVA/JSP学习系列之二