当前位置: 首页 > news >正文

c++进阶--AVL树

休息了一周之后,我们继续来学习c++进阶的部分,今天我们要学习的内容是AVL树。

目录

1. AVL的概念

2. AVL树的实现 

2.1 AVL树的结构

2.2 AVL树的插⼊

2.2.1 AVL树插⼊⼀个值的⼤概过程

 2.2.2 平衡因⼦更新

2.3 旋转 

2.3.1 旋转的原则

2.3.2 右单旋 

2.3.3 右单旋代码实现

2.3.4 左单旋

2.3.5 左单旋代码实现 

2.3.6 左右双旋

 2.3.7 左右双旋代码实现

2.3.8 右左双旋

2.3.9 右左双旋代码实现 

2.4 AVL树的查找

2.5 AVL树平衡检测


1. AVL的概念

1. AVL树是最先发明的⾃平衡⼆叉查找树,AVL是⼀颗空树,或者具备下列性质的⼆叉搜索树:它的左右⼦树都是AVL树,且左右⼦树的⾼度差的绝对值不超过1。AVL树是⼀颗⾼度平衡搜索⼆叉树,通过控制⾼度差去控制平衡。
2. AVL树得名于它的发明者G. M. Adelson-Velsky和E. M. Landis是两个前苏联的科学家,他们在1962年的论⽂《An algorithm for the organization of information》中发表了它。
3. AVL树实现这⾥我们引⼊⼀个平衡因⼦(balance factor)的概念,每个结点都有⼀个平衡因⼦,任何结点的平衡因⼦等于右⼦树的⾼度减去左⼦树的⾼度,也就是说任何结点的平衡因⼦等于0/1/-1,AVL树并不是必须要平衡因⼦,但是有了平衡因⼦可以更⽅便我们去进⾏观察和控制树是否平衡,就像⼀个⻛向标⼀样。
4. 思考⼀下为什么AVL树是⾼度平衡搜索⼆叉树,要求⾼度差不超过1,⽽不是⾼度差是0呢?0不是更好的平衡吗?画画图分析我们发现,不是不想这样设计,⽽是有些情况是做不到⾼度差是0的。⽐如⼀棵树是2个结点,4个结点等情况下,⾼度差最好就是1,⽆法做到⾼度差是0
5.  AVL树整体结点数量和分布和完全⼆叉树类似,⾼度可以控制在 log N,那么增删查改的效率也可以控制在O(log N) ,相⽐⼆叉搜索树有了本质的提升。

这就是一棵AVL树,对于叶子结点来说,它的左右子树都为空,所以它的平衡因子为0,而对于其他结点来说 ,平衡因子为右子树高度减去左子树的高度。

 当平衡因子为2或-2时,意为该AVL树不平衡,需要进行调整。

2. AVL树的实现 

2.1 AVL树的结构
template<class K,class V>
struct AVLNode {
	pair<K, V> _kv;
	AVLNode<K, V>* _left;
	AVLNode<K, V>* _right;
	AVLNode<K, V>* _parent;
	int _bf;
	AVLNode(const pair<K,V>& kv)
		:_kv(kv)
		,_left(nullptr)
		,_right(nullptr)
		,_parent(nullptr)
		,_bf(0)
	{}
};


template<class K, class V>
class AVLTree
{
	typedef AVLTreeNode<K, V> Node;
public:
	//.......
private:
	Node * _root = nullptr;
};
2.2 AVL树的插⼊

对于AVL树的插入,和普通的二叉搜索树差不多,但多出了一个调整平衡因子的步骤,同时若平衡因子为2或-2,还需要进行调整。

2.2.1 AVL树插⼊⼀个值的⼤概过程
1. 插⼊⼀个值按⼆叉搜索树规则进⾏插⼊。
2. 新增结点以后,只会影响祖先结点的⾼度,也就是可能会影响部分祖先结点的平衡因⼦,所以更新从新增结点->根结点路径上的平衡因⼦,实际中最坏情况下要更新到根,有些情况更新到中间就可以停⽌了,具体情况我们下⾯再详细分析。
3. 更新平衡因⼦过程中没有出现问题,则插⼊结束。
4. 更新平衡因⼦过程中出现不平衡,对不平衡⼦树旋转,旋转后本质调平衡的同时,本质降低了⼦树的⾼度,不会再影响上⼀层,所以插⼊结束。
 2.2.2 平衡因⼦更新
更新原则:
1. 平衡因⼦ = 右⼦树⾼度-左⼦树⾼度
2. 只有⼦树⾼度变化才会影响当前结点平衡因⼦。
3. 插⼊结点,会增加⾼度,所以新增结点在parent的右⼦树,parent的平衡因⼦++,新增结点在parent的左⼦树,parent平衡因⼦--
4. parent所在⼦树的⾼度是否变化决定了是否会继续往上更新
更新停⽌条件:
1. 更新后parent的平衡因⼦等于0,更新中parent的平衡因⼦变化为-1->0 或者 1->0,说明更新前parent⼦树⼀边⾼⼀边低,新增的结点插⼊在低的那边,插⼊后parent所在的⼦树⾼度不变,不会影响parent的⽗亲结点的平衡因⼦,更新结束。
2. 更新后parent的平衡因⼦等于1 或 -1,更新前更新中parent的平衡因⼦变化为0->1 或者 0->-1,说明更新前parent⼦树两边⼀样⾼,新增的插⼊结点后,parent所在的⼦树⼀边⾼⼀边低,parent所在的⼦树符合平衡要求,但是⾼度增加了1,会影响parent的⽗亲结点的平衡因⼦,所以要继续向上更新。
3. 更新后parent的平衡因⼦等于2 或 -2,更新前更新中parent的平衡因⼦变化为1->2 或者 -1->-2,说明更新前parent⼦树⼀边⾼⼀边低,新增的插⼊结点在⾼的那边,parent所在的⼦树⾼的那边更⾼了,破坏了平衡,parent所在的⼦树不符合平衡要求,需要旋转处理,旋转的⽬标有两个:1、把parent⼦树旋转平衡。2、降低parent⼦树的⾼度,恢复到插⼊结点以前的⾼度。所以旋转后也不需要继续往上更新,插⼊结束。
4. 不断更新,更新到根,根的平衡因⼦是1或-1也停⽌了。
2.3 旋转 
2.3.1 旋转的原则
1. 保持搜索树的规则
2. 让旋转的树从不满⾜变平衡,其次降低旋转树的⾼度
旋转总共分为四种,左单旋/右单旋/左右双旋/右左双旋。
说明:下⾯的图中,有些结点我们给的是具体值,如10和5等结点,这⾥是为了⽅便讲解,实际中是什么值都可以,只要⼤⼩关系符合搜索树的性质即可。
2.3.2 右单旋 
1. 本图1展⽰的是10为根的树,有a/b/c抽象为三棵⾼度为h的⼦树(h>=0),a/b/c均符合AVL树的要求。10可能是整棵树的根,也可能是⼀个整棵树中局部的⼦树的根。这⾥a/b/c是⾼度为h的⼦树,是⼀种概括抽象表⽰,他代表了所有右单旋的场景,实际右单旋形态有很多种,具体图2/图3/图4/图5进⾏了详细描述。
2. 在a⼦树中插⼊⼀个新结点,导致a⼦树的⾼度从h变成h+1,不断向上更新平衡因⼦,导致10的平衡因⼦从-1变成-2,10为根的树左右⾼度差超过1,违反平衡规则。10为根的树左边太⾼了,需要往右边旋转,控制两棵树的平衡。
3. 旋转核⼼步骤,因为5 < b⼦树的值 < 10,将b变成10的左⼦树,10变成5的右⼦树,5变成这棵树新的根,符合搜索树的规则,控制了平衡,同时这棵的⾼度恢复到了插⼊之前的h+2,符合旋转原则。如果插⼊之前10整棵树的⼀个局部⼦树,旋转后不会再影响上⼀层,插⼊结束了。

这是一个抽象的整体图,a b c 分别代表高度为h的子树,我们在a的位置再插入一个结点,此时根结点的平衡因子为-2,需要进行调整,因为根结点的左子树更高,应该向右旋转。令subL为新的根节点,原来的根节点变成新的根节点的右孩子,subL的右子树变成原来根节点的左子树,旋转之后,新的根节点的平衡因子为0。 

 

这是第一种情况,a b c 都是空树,此时在a上插入一个新节点,根节点的平衡因子为-2,向右旋转。 

 这是第二种情况,a b c 为单节点,在a上插入结点后,根节点平衡因子为-2,向右旋转。

这是第三种情况,a b c 为高度为2的AVL树,高度为2的AVL树有又有三种情况,对于b和c来说,这三种情况都可以,而对于a来说,只有第一种可以,因为当a为其他两种情况时,插入节点后自身就会因为平衡因子等于-2或2需要旋转。 而a为第一种情况的时候有4个位置可以插入结点,所以共有3*3*4=36种情况。

这是第四种情况,a b c 为高度为3的AVL树,高度为3的AVL树有15种情况, 对于b和c来说,这15种情况都可以,而对于a来说,为满二叉树的时候可以,第三层有三个结点的时候也可以,所以a有4种情况,对于满二叉树在插入时有8个位置可以插入,为另一种树时有4个位置可以插入,所以a有8+4*4=24种情况,所以共有15*15*24=5400种情况。

高度为更多的AVL树的情况我们就不再进行讨论了,我们可以发现它们都有共同点,就是我们一开始说的需要向右旋转,所以所有在最左子树插入的结点都满足这种规律。

2.3.3 右单旋代码实现
void RotateR(Node* parent)
{
	Node* subL = parent->_left;
	Node* subLR = subL->_right;

	parent->_left = subLR;
	if(subLR)
	{
		subLR->_parent = parent;
	}
	Node* Pparent = parent->_parent;
	subL->_parent = Pparent;
	parent->_parent = subL;
	subL->_right = parent;
	if (Pparent == nullptr)
	{
		_root = subL;
	}
	else{
		if (Pparent->_left == parent)
		{
			Pparent->_left = subL;
		}
		else
		{
			Pparent->_right = subL;
		}
	}
	parent->_bf = subL->_bf = 0;
}

我们定义根节点的左孩子为subL,subL的右孩子为subLR,则subLR就是我们在图中的b,当在最左边插入结点时,根节点的平衡因子为-2,subL的平衡因子为-1,由于b可以为空,所以需要对subLR进行判断,同时,根节点可以为AVL树的根,也可以为AVL树中的一个子树,所以还要对根节点的parent进行判断。在旋转完成后,要将根节点和subL的平衡因子进行修改,由上图可知,它们的平衡因子都为0。

2.3.4 左单旋
1. 本图6展⽰的是10为根的树,有a/b/c抽象为三棵⾼度为h的⼦树(h>=0),a/b/c均符合AVL树的要求。10可能是整棵树的根,也可能是⼀个整棵树中局部的⼦树的根。这⾥a/b/c是⾼度为h的⼦树,是⼀种概括抽象表⽰,他代表了所有右单旋的场景,实际右单旋形态有很多种,具体跟上⾯左旋类似。
2. 在a⼦树中插⼊⼀个新结点,导致a⼦树的⾼度从h变成h+1,不断向上更新平衡因⼦,导致10的平衡因⼦从1变成2,10为根的树左右⾼度差超过1,违反平衡规则。10为根的树右边太⾼了,需要往左边旋转,控制两棵树的平衡。
3. 旋转核⼼步骤,因为10 < b⼦树的值 < 15,将b变成10的右⼦树,10变成15的左⼦树,15变成这棵树新的根,符合搜索树的规则,控制了平衡,同时这棵的⾼度恢复到了插⼊之前的h+2,符合旋转原则。如果插⼊之前10整棵树的⼀个局部⼦树,旋转后不会再影响上⼀层,插⼊结束了。

 

总体而言,在最右子树进行插入的时候,需要向左旋转,其余部分和右单旋相同。

2.3.5 左单旋代码实现 
void RotateL(Node* parent)
{
	Node* subR = parent->_right;
	Node* subRL = subR->_left;

	parent->_right = subRL;
	if (subRL)
	{
		subRL->_parent = parent;
	}
	Node* Pparent = parent->_parent;
	subR->_parent = Pparent;
	subR->_left = parent;
	parent->_parent = subR;
	if (Pparent == nullptr)
	{
		_root = subR;
	}
	else{
		if (Pparent->_left == parent)
		{
			Pparent->_left = subR;
		}
		else {
			Pparent->_right = subR;
		}
	}
	parent->_bf = subR->_bf = 0;
}

此时,我们需要的是subR和subRL两个指针,subRL为图中的b。

2.3.6 左右双旋
通过图7和图8可以看到,左边⾼时,如果插⼊位置不是在a⼦树,⽽是插⼊在b⼦树,b⼦树⾼度从h变成h+1,引发旋转,右单旋⽆法解决问题,右单旋后,我们的树依旧不平衡。右单旋解决的纯粹的左边⾼,但是插⼊在b⼦树中,10为跟的⼦树不再是单纯的左边⾼,对于10是左边⾼,但是对于5是右边⾼,需要⽤两次旋转才能解决,以5为旋转点进⾏⼀个左单旋,以10为旋转点进⾏⼀个右单旋,这棵树这棵树就平衡了。

图7和图8分别为左右双旋中h==0和h==1具体场景分析,下⾯我们将a/b/c⼦树抽象为⾼度h的AVL⼦树进⾏分析,另外我们需要把b⼦树的细节进⼀步展开为8和左⼦树⾼度为h-1的e和f⼦树,因为我们要对b的⽗亲5为旋转点进⾏左单旋,左单旋需要动b树中的左⼦树。b⼦树中新增结点的位置不同,平衡因⼦更新的细节也不同,通过观察8的平衡因⼦不同,这⾥我们要分三个场景讨论。
场景1:h >= 1时,新增结点插⼊在e⼦树,e⼦树⾼度从h-1并为h并不断更新8->5->10平衡因⼦,引发旋转,其中8的平衡因⼦为-1,旋转后8和5平衡因⼦为0,10平衡因⼦为1。
场景2:h >= 1时,新增结点插⼊在f⼦树,f⼦树⾼度从h-1变为h并不断更新8->5->10平衡因⼦,引发旋转,其中8的平衡因⼦为1,旋转后8和10平衡因⼦为0,5平衡因⼦为-1。
场景3:h == 0时,a/b/c都是空树,b⾃⼰就是⼀个新增结点,不断更新5->10平衡因⼦,引发旋转,其中8的平衡因⼦为0,旋转后8和10和5平衡因⼦均为0。

当在中间插入也就是对b进行插入的时候,进行一次旋转似乎不能解决问题,还会变成同样的结构,那么此时就需要进行两次不同方向的旋转。

此时,对于b的左右子树也需要考虑进来,由图可见,b的左右子树会被分到左右两个部分。 

 2.3.7 左右双旋代码实现
void RotateLR(Node* parent)
{
	Node* subL = parent->_left;
	Node* subLR = subL->_right;
	int bf = subLR->_bf;
	RotateL(parent->_left);
	RotateR(parent);
	if (bf == 0)
	{
		parent->_bf = 0;
		subL->_bf = 0;
		subLR->_bf = 0;
	}
	else if (bf == -1)
	{
		parent->_bf = 1;
		subL->_bf = 0;
		subLR->_bf = 0;
	}
	else if (bf == 1)
	{
		parent->_bf = 0;
		subL->_bf = -1;
		subLR->_bf = 0;
	}
	else {
		assert(false);
	}
}
2.3.8 右左双旋

跟左右双旋类似,下⾯我们将a/b/c⼦树抽象为⾼度h的AVL⼦树进⾏分析,另外我们需要把b⼦树的
细节进⼀步展开为12和左⼦树⾼度为h-1的e和f⼦树,因为我们要对b的⽗亲15为旋转点进⾏右单
旋,右单旋需要动b树中的右⼦树。b⼦树中新增结点的位置不同,平衡因⼦更新的细节也不同,通
过观察12的平衡因⼦不同,这⾥我们要分三个场景讨论。
场景1:h >= 1时,新增结点插⼊在e⼦树,e⼦树⾼度从h-1变为h并不断更新12->15->10平衡因⼦,引发旋转,其中12的平衡因⼦为-1,旋转后10和12平衡因⼦为0,15平衡因⼦为1。
场景2:h >= 1时,新增结点插⼊在f⼦树,f⼦树⾼度从h-1变为h并不断更新12->15->10平衡因⼦,引发旋转,其中12的平衡因⼦为1,旋转后15和12平衡因⼦为0,10平衡因⼦为-1。
场景3:h == 0时,a/b/c都是空树,b⾃⼰就是⼀个新增结点,不断更新15->10平衡因⼦,引发旋转,其中12的平衡因⼦为0,旋转后10和12和15平衡因⼦均为0。

2.3.9 右左双旋代码实现 
void RotateRL(Node* parent)
{
	Node* subR = parent->_right;
	Node* subRL = subR->_left;
	int bf = subRL->_bf;
	RotateR(parent->_right);
	RotateL(parent);
	if (bf == 0)
	{
		parent->_bf = 0;
		subR->_bf = 0;
		subRL->_bf = 0;
	}
	else if (bf == 1)
	{
		parent->_bf = -1;
		subR->_bf = 0;
		subRL->_bf = 0;
	}
	else if (bf == -1)
	{
		parent->_bf = 0;
		subR->_bf = 1;
		subRL->_bf = 0;
	}
	else {
		assert(false);
	}
}
2.4 AVL树的查找

AVL树的查找和二叉搜索树的查找相同,搜索效率为 O(logN)

Node* Find(const K& key)
{
	Node* cur = _root;
	while (cur)
	{
		if (cur->_kv.first < key)
		{
			cur = cur->_right;
		}
		else if (cur->_kv.first > key)
		{
			cur = cur->_left;
		}
		else
		{
			return cur;
		}
	}

	return nullptr;
}
2.5 AVL树平衡检测
我们实现的AVL树是否合格,我们通过检查左右⼦树⾼度差的的程序进⾏反向验证,同时检查⼀下结点的平衡因⼦更新是否出现了问题。
int _Height(Node* root)
{
	if (root == nullptr)
		return 0;
	int leftHeight = _Height(root->_left);
	int rightHeight = _Height(root->_right);
	return leftHeight > rightHeight ? leftHeight + 1 : rightHeight + 1;
}
bool _IsBalanceTree(Node* root)
{
	// 空树也是AVL树
	if (nullptr == root)
		return true;
	// 计算pRoot结点的平衡因⼦:即pRoot左右⼦树的⾼度差
	int leftHeight = _Height(root->_left);
	int rightHeight = _Height(root->_right);
	int diff = rightHeight - leftHeight;
		// 如果计算出的平衡因⼦与pRoot的平衡因⼦不相等,或者
		// pRoot平衡因⼦的绝对值超过1,则⼀定不是AVL树
	if (abs(diff) >= 2)
	{
		cout << root->_kv.first << "⾼度差异常" << endl;
		return false;
	}
	if (root->_bf != diff)
	{
		cout << root->_kv.first << "平衡因⼦异常" << endl;
		return false;
	}
	// pRoot的左和右如果都是AVL树,则该树⼀定是AVL树
	return _IsBalanceTree(root->_left) && _IsBalanceTree(root->_right);
}

 今天的内容就是这些,我们下次再见

相关文章:

  • Golang | 每日一练 (5)
  • RISC-V汇编学习(四)—— RISCV QEMU平台搭建(基于芯来平台)
  • 天气app:简易高效,纯净无广,随时随地掌握天气动态!
  • 元类(metaclass)如何控制类的创建过程
  • SpringBoot为什么流行以及能解决什么问题?
  • 使用DMA进行ADC数据读取与USART数据发送与接收
  • 图的存储--十字链表与邻接多重表
  • 01-虚拟系统配置
  • MySQL时间溢出原理、影响与解决方案
  • Android子线程更新View的方法原理
  • 苹果iOS 18.4将强制升级HomeKit架构,旧版设备或无法使用
  • 4-001:MySQL 中的索引数量是否越多越好?为什么?
  • 设计模式学习笔记——命令模式
  • Vue3实战学习(Vue3快速搭建后台管理系统(网页头部、侧边导航栏、主体数据展示区的设计与实现)(超详细))(9)
  • LOWORD(wParam) 与 HIWORD(wParam) 详解
  • 【C语言】编译和链接详解
  • 贪心算法和遗传算法优劣对比——c#
  • CentOS8+Zabbix7.2.4解决中文显示问题
  • 压缩空气储能仿真simulink模型
  • 人工智能就业趋势分析:机遇、挑战与未来展望
  • 长沙至赣州高铁初步设计获批,可填补湘赣两省斜向交通空白
  • 抖音开展“AI起号”专项治理,整治利用AI生成低俗猎奇视频等
  • 永久基本农田竟沦为垃圾场,湖南湘潭回应:全面启动专项整治
  • 南宁海关辟谣网传“查获600公斤稀土材料”:实为焊锡膏
  • 4月份国民经济顶住压力稳定增长
  • 新时代,新方志:2025上海地方志论坛暨理论研讨会举办