红⿊树实现
一.红⿊树的概念
1.1 概念
红⿊树是⼀棵⼆叉搜索树,他的每个结点增加⼀个存储位来表⽰结点的颜⾊,可以是红⾊或者⿊⾊。通过对任何⼀条从根到叶⼦的路径上各个结点的颜⾊进⾏约束,红⿊树确保没有⼀条路径会⽐其他路径⻓出2倍,因⽽是接近平衡的。
1.2 红⿊树的规则:
1. 每个结点不是红⾊就是⿊⾊
2. 根结点是⿊⾊的
3. 如果⼀个结点是红⾊的,则它的两个孩⼦结点必须是⿊⾊的,也就是说任意⼀条路径不会有连续的红⾊结点。
4. 对于任意⼀个结点,从该结点到其所有NULL结点的简单路径上,均包含相同数量的⿊⾊结点
说明:《算法导论》等书籍上补充了⼀条每个叶⼦结点(NIL)都是⿊⾊的规则。他这⾥所指的叶⼦结点不是传统的意义上的叶⼦结点,⽽是我们说的空结点,有些书籍上也把NIL叫做外部结点。NIL是为了 ⽅便准确的标识出所有路径,《算法导论》在后续讲解实现的细节中也忽略了NIL结点,所以我们知道⼀下这个概念即可。
下面我们来画几棵红黑树我们来理解一下。





上面这些图全部都是红黑树。
1.3 思考⼀下,红⿊树如何确保最⻓路径不超过最短路径的2倍的?
由规则4可知,从根到NULL结点的每条路径都有相同数量的⿊⾊结点,所以极端场景下,最短路径就就是全是⿊⾊结点的路径,假设最短路径⻓度为bh(black height)。
由规则2和规则3可知,任意⼀条路径不会有连续的红⾊结点,所以极端场景下,最⻓的路径就是⼀⿊⼀红间隔组成,那么最⻓路径的⻓度为2*bh。
综合红⿊树的4点规则⽽⾔,理论上的全⿊最短路径和⼀⿊⼀红的最⻓路径并不是在每棵红⿊树都存在的。假设任意⼀条从根到NULL结点路径的⻓度为x,那么bh <= h <= 2*bh。
1.3 红⿊树的效率:
假设N是红⿊树树中结点数量,h最短路径的⻓度,那么 , 由此推出,也就是意味着红⿊树增删查改最坏也就是⾛最⻓路径 ,那么时间复杂度还是。
2 h − 1 <= N < 2 *2∗h − 1
h ≈ logN 2 ∗ logN
O(logN)
红⿊树的表达相对AVL树要抽象⼀些,AVL树通过⾼度差直观的控制了平衡。红⿊树通过4条规则的颜⾊约束,间接的实现了近似平衡,他们效率都是同⼀档次,但是相对⽽⾔,插⼊相同数量的结点,红⿊树的旋转次数是更少的,因为他对平衡的控制没那么严格。

这是最好的情况下。
这是最坏的情况下。
二.代码实现
下面我们从代码的角度来了解一下红黑树。
2.1 红⿊树的结构

这是我们完成的红黑树的结构。
有人可能会问,这里为什么要使用一个结构体一个类,而不是直接使用两个类呢?
2.2 红⿊树的插⼊
2.2.1 红⿊树树插⼊⼀个值的⼤概过程
1. 插⼊⼀个值按⼆叉搜索树规则进⾏插⼊,插⼊后我们只需要观察是否符合红⿊树的4条规则。
2. 如果是空树插⼊,新增结点是⿊⾊结点。如果是⾮空树插⼊,新增结点必须红⾊结点,因为⾮空树插⼊,新增⿊⾊结点就破坏了规则4,规则4是很难维护的。
3. ⾮空树插⼊后,新增结点必须红⾊结点,如果⽗亲结点是⿊⾊的,则没有违反任何规则,插⼊结束。
4. ⾮空树插⼊后,新增结点必须红⾊结点,如果⽗亲结点是红⾊的,则违反规则3。进⼀步分析,c是 红⾊,p为红,g必为⿊,这三个颜⾊都固定了,关键的变化看u的情况,需要根据u分为以下⼏种情况分别处理。
说明:下图中假设我们把新增结点标识为c (cur),c的⽗亲标识为p(parent),p的⽗亲标识为
g(grandfather),p的兄弟标识为u(uncle)。
以上简单来说就是插入根的时候是黑色,插入新增节点(不是根节点)为红色。
2.2.2 情况1:变⾊
c为红,p为红,g为⿊,u存在且为红,则将p和u变⿊,g变红。在把g当做新的c,继续往上更新。
分析:因为p和u都是红⾊,g是⿊⾊,把p和u变⿊,左边⼦树路径各增加⼀个⿊⾊结点,g再变红,相当于保持g所在⼦树的⿊⾊结点的数量不变,同时解决了c和p连续红⾊结点的问题,需要继续往上更新是因为,g是红⾊,如果g的⽗亲还是红⾊,那么就还需要继续处理;如果g的⽗亲是⿊⾊,则处理结束 了;如果g就是整棵树的根,再把g变回⿊⾊。
情况1只变⾊,不旋转。所以⽆论c是p的左还是右,p是g的左还是右,都是上⾯的变⾊处理⽅式。

就是如图的样子了。
跟AVL树类似,图中我们展⽰了⼀种具体情况,但是实际中需要这样处理的有很多种情况。
•
下面的图将以上类似的处理进⾏了抽象表达,d/e/f代表每条路径拥有hb个⿊⾊结点的⼦树,a/b代表每
条路径拥有hb-1个⿊⾊结点的根为红的⼦树,hb>=0。
下图分别展⽰了hb == 0/hb == 1/hb == 2的具体情况组合分析,当hb等于2时,这⾥组合
情况上百亿种,这些样例是帮助我们理解,不论情况多少种,多么复杂,处理⽅式⼀样的,变⾊再
继续往上处理即可,所以我们只需要看抽象图即可。




2.2.3 情况2:单旋+变⾊
情况 1:u 不存在(p 是 g 的唯一子节点)→ c 一定是新增节点
为什么?因为插入前,红黑树是平衡的(满足所有 5 条规则):
- 因为你可以想u不存在,g是根为黑色。那么根据平衡规则,p一定为红色,如果c不是新增,说明c是由原来的g->c的,p为红色,c不是新增的话原来只能是黑色,此时就违反规则了,所以u不存在时,c只能时新增结点。
情况 2:u 存在且为黑色 → c 一定不是新增节点
为什么?同样基于 “插入前树平衡” 的前提:
这个也是比较好理解的,我们可以来理解一下,u为黑色结点,但是p为红色结点,说明p的左右孩子子树上都是存在黑色结点的,所以此时的c不可能是新增的。

2.2.4 情况2:双旋+变⾊

2.3 红⿊树的插⼊代码实现

这里我们没有实现旋转函数,下个博客在实现和AVL树的旋转差不多。
大家可以根据概念理解着就能把代码写出来了,也不算特别难。
2.4 红⿊树的查找

这个就更简单了和AVL树的查找是一样的。
2.5 红⿊树的验证
这⾥获取最⻓路径和最短路径,检查最⻓路径不超过最短路径的2倍是不可⾏的,因为就算满⾜这个条件,红⿊树也可能颜⾊不满⾜规则,当前暂时没出问题,后续继续插⼊还是会出问题的。所以我们还是去检查4点规则,满⾜这4点规则,⼀定能保证最⻓路径不超过最短路径的2倍。
1. 规则1枚举颜⾊类型,天然实现保证了颜⾊不是⿊⾊就是红⾊。
2. 规则2直接检查根即可
3. 规则3前序遍历检查,遇到红⾊结点查孩⼦不太⽅便,因为孩⼦有两个,且不⼀定存在,反过来检查⽗亲的颜⾊就⽅便多了。
4. 规则4前序遍历,遍历过程中⽤形参记录跟到当前结点的blackNum(⿊⾊结点数量),前序遍历遇到⿊⾊结点就++blackNum,⾛到空就计算出了⼀条路径的⿊⾊结点数量。再任意⼀条路径⿊⾊结点数量作为参考值,依次⽐较即可。


这就是我们的检验函数,大家可以理解着看看。
红黑树的删除有点麻烦,这里就不细讲了,有兴趣的话大家可以自己找材料学一下。
三.结束语
感谢大家的查看,希望可以帮助到大家,做的不是太好还请见谅,其中有什么不懂的可以留言询问,我都会一一回答。 感谢大家的一键三连。

