C++笔记-封装红黑树实现set和map
1.源码及框架分析
上面就是在stl库中set和map的部分源代码。
通过上图对框架的分析,我们可以看到源码中rb_tree⽤了⼀个巧妙的泛型思想实现,rb_tree是实
现key的搜索场景,还是key/value的搜索场景不是直接写死的,⽽是由第⼆个模板参数Value决定
_rb_tree_node中存储的数据类型。
set实例化rb_tree时第⼆个模板参数给的是key,map实例化rb_tree时第⼆个模板参数给的是 pair<const key, T>,这样⼀颗红⿊树既可以实现key搜索场景的set,也可以实现key/value搜索场
景的map。
要注意⼀下,源码⾥⾯模板参数是⽤T代表value,⽽内部写的value_type不是我们我们⽇常
key/value场景中说的value,源码中的value_type反⽽是红⿊树结点中存储的真实的数据的类型。
这里可能有人会疑惑: rb_tree第⼆个模板参数Value已经控制了红⿊树结点中存储的数据类型,为什么还要传第⼀个模板 参数Key呢?尤其是set,两个模板参数是⼀样的。
这是因为红黑树中的find和erase函数只用到key,set就不用说了,map中也是只用key,所以说传第一个模板参数就是为这两个函数服务的,如果key,value两个参数类型不同也可以区分开来。
2.模拟实现map和set
要实现map和set我们要想实现以下操作:
1.实现红黑树
1.实现红黑树
2.封装map和set框架,解决keyOfTree
3.iterator
4.const_iterator
5.key不支持修改的问题
6.operator[]
以上步骤中第一步我们已经完成了,下面完成剩下的步骤即可:
2.1 封装map和set框架,解决keyOfTree


这里有人不理解keyOfTree是什么,我们来设想一下:我们现在要实现泛型的红黑树,那么在insert函数中我们要比较key值该如何比较?
如果以我们上一篇实现的红黑树是没有办法解决这个问题的,毕竟set和map不一样,一个直接比较key,一个需要比较pair中的key,所以这里我们就要实现keyOfTree来返回key值。
从上图我们也可以看出来实现的是仿函数,不过这里的仿函数和之前我们讲的不太一样,之前我们讲的是仿函数来控制比较规则,这里就直接返回key值即可,并将其传给红黑树。
所以红黑树也要做出一些改变:



这里面insert中的比较方式就变为上图这种,这里根据map和set传入的类型来返回相应的值,这样就完美解决上面的问题,还有find中也需要更改,不过和insert中的一样,这里就不过多赘述了。
2.2实现iterator


这里实现iterator的思路和之前我们讲的list迭代器是一样的,毕竟我们在实现红黑树时和链表很像。
所以这里初始化中的解引用等操作就不过多赘述了,而实现iterator的关键就是如何++和--,大家设想一下:这里++操作该如何实现呢,迭代器++后应该到哪个结点呢?
不好操作是吧,所以我们着重来讲解这两个。
2.2.1++重载实现

以上图为例,此时迭代器在15的位置,我们都知道++后要访问的结点是18,那么该如何找到18呢?这个问题我们先放一放,我们接着往下看。

现在迭代器在25的位置,++后要找的结点是30,两种情况找的方式并不相同。
这里我直接就说结论:我们判断该怎么去找是看当前结点的右子树是否为为空,这里有人又要问:为什么要看右子树是否为空呢?
因为我们访问到当前的结点是以当前结点为根结点的子树,根结点访问完,根据中序遍历我们知道下面就该访问右子树了,所以这里我们要判断右子树是否为空。
右子树不为空,我们就要的访问右子树的最左结点,也就是右子树最小的结点。而如果右子树为空,我们就知道此时这颗子树已经访问完了,就要向上面找祖先访问了,而我们找祖先也是要找孩子是父亲左的那个祖先,也就是我们上面第一幅图中15下来要找18那种情况。
大家思考一下是不是这个理,孩子是父亲的左子树,那么按照中序遍历下面就是该访问当前子树的根结点了。
这时候有人要问:那要是一直孩子是父亲右的祖先呢?
那就一直找下去,直到找到nullptr,就如下面这种情况:

50下来我该去找谁呢?
按照我们上面的思路,从图中可以看出50上面没有孩子是父亲左的祖先,当前子树没有我要找的祖先,那么就要一直想上找,直到最后cur走到根结点,parent走到nullptr就停止了,那么此时50下面要访问的就是nullptr。
从图中我们也可以看出来50已经是这棵树最后一个结点了,下面要访问的肯定是nullptr。
其实这也是end()迭代器的返回值,因为end就是组后一个数据的下一个位置,正好对应上面50的下一个位置。
而begin就不用多说了,直接通过循环找整棵树最左的那个结点即可,整棵树最小的节点起始元素。
下面是代码演示:

2.2.2--重载实现
--和++逻辑就直接反过来即可,下面是代码演示:

但是只写成这样是有bug的,我们来看一个例子:

看起来没有什么问题,但是我们仔细想一下end是nullptr,直接对--it肯定会出问题的对吧。
那如何解决这种问题呢?
我们先看set和map底层是如何解决这种问题的:

底层为了解决这个问题也弄了和list一样的哨兵位header,并且它和根结点的_parent为对方,而在处理我们上面的代码时,会先判断是否在header这个位置,如果在的话就通过header的right直接找到整棵树的最右结点,它的left就是最左结点,可能与人觉得这样挺方便的。
其实不然,因为如果你要插入或者删除数据,header的laft和right还得去维护,加了header后其实也并没有多么方便,所以这里我就没有采用源代码的那种方式。
而是采用这种方式:



这里我通过再定义一个_root来解决这个问题,我们把根结点传过去,利用根结点来找到最右结点,这样也不需要再定义一个header。
这样写的缺点就是我们每次给迭代器传参都要传两个参数,不过也还好,每次都默认传_root即可。
当然这只是一个小问题,如果你不想解决这个问题也可以不这样写,迭代器还是只传一个参数即可。
2.2.3begin和end迭代器
上面我们已经说了begin和end该取什么,这里就直接演示代码:




完成红黑树的begin和end后在set和map中我们就直接引用即可。
2.3实现const_iterator
我们上面实现了iterator,再实现const_iterator就简单许多,和之前实现list的一样:





只需要写一部分代码即可,这样也就完成了const_iterator迭代器,const_iterator迭代器的实现这里就不过多赘述了。
2.4key不支持修改的问题
我们在AVL树那一章节就已经讲过像这种二叉平衡搜索树里面的数值是不能修改的,如果被修改,就不满足搜索树的规则,那么实现就没有意义了。
大家上面也看到了我在set和map中的参数中加了const,这就是这个问题的解决方法:


se就不用多说了,就key一个值,直接在前面加上const即可,map要注意一下,key不能修改,但是value是可以修改的,所以pair中只把第一个参数加上const即可。
注意我上面写的,typedef中也要在相应位置加上const,不然会报错。
2.5operator[]的实现
这个[]符号我们在map的使用那一章节已经讲过,这里就不过多赘述了。
因为实现要用到insert函数,并且参数也和我们之前实现的不一样,所以我们要对insert做出一些修改:




这里要注意在最后插入节点时要用一个临时变量来记录此时新插入的位置,因为后面我们要进行变色或者旋转等一些列操作,cur的位置可能会改变。

map中的实现和我们之前讲的时候一样,通过借助insert函数来返回pair中的second值。


我们可以通过自己写一些例子来验证[]是否可以完成我们想要的效果。
以上就是封装红黑树实现set和map的内容。