数据结构二叉树
1.树
1.1 树的概念与结构
树是⼀种⾮线性的数据结构,它是由 n(n>=0) 个有限结点组成⼀个具有层次关系的集合。把它叫做
树是因为它看起来像⼀棵倒挂的树,也就是说它是根朝上,⽽叶朝下的。
有⼀个特殊的结点,称为根结点,根结点没有前驱结点。下图中A就是根节点
除根结点外,其余结点被分成 M(M>0) 个互不相交的集合 T1、T2、……、Tm ,其中每⼀个集合 Ti(1 <= i <= m) ⼜是⼀棵结构与树类似的⼦树。每棵⼦树的根结点有且只有⼀个前驱,可以
有 0 个或多个后继。因此,树是递归定义的。

树形结构中,⼦树之间不能有交集,否则就不是树形结构
1.2 树相关术语
⽗结点/双亲结点:若⼀个结点含有⼦结点,则这个结点称为其⼦结点的⽗结点; 如上图:A是B的⽗ 结点
⼦结点/孩⼦结点:⼀个结点含有的⼦树的根结点称为该结点的⼦结点; 如上图:B是A的孩⼦结点
结点的度:⼀个结点有⼏个孩⼦,他的度就是多少;⽐如A的度为6,F的度为2,K的度为0
树的度:⼀棵树中,最⼤的结点的度称为树的度; 如上图:树的度为 6
叶⼦结点/终端结点:度为 0 的结点称为叶结点; 如上图: B、C、H、I... 等结点为叶结点
分⽀结点/⾮终端结点:度不为 0 的结点; 如上图: D、E、F、G... 等结点为分⽀结点
兄弟结点:具有相同⽗结点的结点互称为兄弟结点(亲兄弟); 如上图: B、C 是兄弟结点
结点的层次:从根开始定义起,根为第 1 层,根的⼦结点为第 2 层,以此类推;
树的⾼度或深度:树中结点的最⼤层次; 如上图:树的⾼度为 4
结点的祖先:从根到该结点所经分⽀上的所有结点;如上图: A 是所有结点的祖先
路径:⼀条从树中任意节点出发,沿⽗节点-⼦节点连接,达到任意节点的序列;⽐如A到Q的路径为:
A-E-J-Q;H到Q的路径H-D-A-E-J-Q
⼦孙:以某结点为根的⼦树中任⼀结点都称为该结点的⼦孙。如上图:所有结点都是A的⼦孙
森林:由 m(m>0) 棵互不相交的树的集合称为森林;
1.3树的表示
孩⼦兄弟表⽰法:
树结构相对线性表就⽐较复杂了,要存储表⽰起来就⽐较⿇烦了,既然保存值域,也要保存结点和结 点之间的关系,实际中树有很多种表⽰⽅式如:双亲表⽰法,孩⼦表⽰法、孩⼦双亲表⽰法以及孩⼦兄弟表⽰法等。我们这⾥就简单的了解其中最常⽤的孩⼦兄弟表⽰法
struct TreeNode{struct Node* child; // 左边开始的第⼀个孩⼦结点struct Node* brother; // 指向其右边的下⼀个兄弟结点int data; // 结点中的数据域};
1.4 树形结构实际运⽤场景
⽂件系统是计算机存储和管理⽂件的⼀种⽅式,它利⽤树形结构来组织和管理⽂件和⽂件夹。在⽂件系统中,树结构被⼴泛应⽤,它通过⽗结点和⼦结点之间的关系来表⽰不同层级的⽂件和⽂件夹之间 的关联。
如下图所示

2. ⼆叉树
2.1 概念与结构
在树形结构中,我们最常⽤的就是⼆叉树,⼀棵⼆叉树是结点的⼀个有限集合,该集合由⼀个根结点加上两棵别称为左⼦树和右⼦树的⼆叉树组成或者为空。

从上图可以看出⼆叉树具备以下特点:
1. ⼆叉树不存在度⼤于 2 的结点
2. ⼆叉树的⼦树有左右之分,次序不能颠倒,因此⼆叉树是有序树
注意:对于任意的⼆叉树都是由以下⼏种情况复合⽽成的

现实中的⼆叉树
2.2 特殊的⼆叉树
2.2.1 满⼆叉树
⼀个⼆叉树,如果每⼀个层的结点数都达到最⼤值,则这个⼆叉树就是满⼆叉树。也就是说,如果⼀个⼆叉树的层数为 K ,且结点总数是 2^k − 1 ,则它就是满⼆叉树。

根据等比数列算出来结点总数为2^k-1
2.2.2 完全⼆叉树
完全⼆叉树是效率很⾼的数据结构,完全⼆叉树是由满⼆叉树⽽引出来的。对于深度为 K 的,有 n 个结点的⼆叉树,当且仅当其每⼀个结点都与深度为K的满⼆叉树中编号从 1 ⾄ n 的结点⼀⼀对应时称之为完全⼆叉树。要注意的是满⼆叉树是⼀种特殊的完全⼆叉树。
假设二叉树层次为k
除了第k层外,每层节点的个数达到最大结点数。第k层不一定要达到最大结点数。
且第k层的结点顺序是从左到右的

💡 ⼆叉树性质
根据满⼆叉树的特点可知:
1)若规定根结点的层数为 1 ,则⼀棵⾮空⼆叉树的第i层上最多有 2^(i−1) 个结点
2)若规定根结点的层数为 1 ,则深度为 h 的⼆叉树的最⼤结点数是 2^h − 1
3)若规定根结点的层数为 1 ,具有 n 个结点的满⼆叉树的深度 h = log2 (n + 1) ( log
以2为底, n+1 为对数);2^h-1=n推出来的
2.3 ⼆叉树存储结构
⼆叉树⼀般可以使⽤两种结构存储,⼀种顺序结构,⼀种链式结构。
2.3.1 顺序结构
顺序结构存储就是使⽤数组来存储,⼀般使⽤数组只适合表⽰完全⼆叉树,因为不是完全⼆叉树会有空间的浪费,完全⼆叉树更适合使⽤顺序结构存储。

现实中我们通常把堆(⼀种⼆叉树)使⽤顺序结构的数组来存储,需要注意的是这⾥的堆和操作系统虚拟进程地址空间中的堆是两回事,⼀个是数据结构,⼀个是操作系统中管理内存的⼀块区域分段。
2.3.2 链式结构
⼆叉树的链式存储结构是指,⽤链表来表⽰⼀棵⼆叉树,即⽤链来指⽰元素的逻辑关系。 通常的⽅法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别⽤来给出该结点左孩⼦和右孩⼦所在的链结点的存储地址 。链式结构⼜分为⼆叉链和三叉链,当前我们学习中⼀般都是⼆叉链。后⾯课程学到⾼阶数据结构如红⿊树等会⽤到三叉链。

3. 实现顺序结构⼆叉树
⼀般堆使⽤顺序结构的数组来存储数据,堆是⼀种特殊的⼆叉树,具有⼆叉树的特性的同时,还具备其他的特性。
3.1 堆的概念与结构
如果有⼀个关键码的集合 K = {k0 , k1 , k2 , ...,kn−1 } ,把它的所有元素按完全⼆叉树的顺序存储⽅式存储,在⼀个⼀维数组中,并满⾜: Ki <= K2∗i+1 ( Ki >= K2∗i+1 且 Ki <= K2∗i+2 ),
i = 0、1、2... ,则称为⼩堆(或⼤堆)。将根结点最⼤的堆叫做最⼤堆或⼤根堆,根结点最⼩的堆
叫做最⼩堆或⼩根堆。

小堆堆顶是堆最小值 大堆堆顶是最大值
数组不一定是有序的
堆具有以下性质
堆中某个结点的值总是不⼤于或不⼩于其⽗结点的值;
堆总是⼀棵完全⼆叉树。
💡 ⼆叉树性质
对于具有 n 个结点的完全⼆叉树,如果按照从上⾄下从左⾄右的数组顺序对所有结点从
0 开始编号,则对于序号为 i 的结点有:
1. 若 i>0 , i 位置结点的双亲序号: (i-1)/2 ; i=0 , i 为根结点编号,⽆双亲结点
子节点------->父节点
2. 若 2i+1<n ,左孩⼦序号: 2i+1 , 2i+1>=n 否则⽆左孩⼦
父节点--->左孩子
3. 若 2i+2<n ,右孩⼦序号: 2i+2 , 2i+2>=n 否则⽆右孩⼦
父节点--->右孩子
3.2堆的插入以及堆的向上调整算法
3.2.1
//插入
void HPPush(HP* php, HPDataType x)
{assert(php);//判断空间是否足够if (php->capacity == php->size){//扩容int newCapacity = php->capacity == 0 ? 4 : 2 * php->capacity;//这个是arr扩容HPDataType* tmp = (HPDataType*)realloc(php->arr, newCapacity * sizeof(HPDataType));if (tmp == NULL){perror("relloc fail!");exit(1);}php->arr = tmp;//这个是空间大小扩容php->capacity = newCapacity;}//插入数据php->arr[php->size] = x;AdjustUp(php->arr, php->size);++php->size;
}
3.2.2
此时要插入一个16
16的下标为6,可通过(i-1)/2算得父节点 ,比较,谁小谁往上放,16和56交换位置,16又开始找他的父节点,循环比较,如下图的插入6
//交换
void Swap(int* x, int* y)
{int tmp = *x;*x = *y;*y = tmp;
}//向上调整算法
void AdjustUp(HPDataType* arr, int child)
{int parent = (child - 1) / 2;while(child>0)//不需要等于,child只要走到根节点的位置,根节点没有父节点就不需要交换{if (arr[child] < arr[parent]){//孩子小就交换Swap(&arr[parent], arr[child]);child = parent;parent = (child - 1) / 2;}else{break;}}
}
3.3堆的删除以及堆得向下调整算法
3.3.1
出堆,出的是堆顶的数据,下标为0的数据
思路:让堆顶数据和最后一个数据交换一下再出堆,然后利用堆的向下调整算法,用父节点找到两个子节点,再比较两个子节点哪个小,小的和父节点去交换,循环比较
//删除
void HPPop(HP* php)
{assert(php&&php->size);//arr[0] arr[php->size-1]Swap(&php->arr[0], &php->arr[php->size - 1]);--php->size;//根据向下调整算法AdjustDown(php->arr, 0, php->size);}
3.3.2
//向下调整算法
AdjustDown(HPDataType* arr, int parent, int n)
{int child = parent * 2 + 1;//左孩子//while (parent<n)while(child<n)//因为child比parent大,如果用parent<n来判断,child越界都不知道{//找左右孩子中最小的//左孩子加1就能找到右孩子了if (child+1<n&&arr[child] > arr[child + 1]){child++;}if (arr[child] < arr[parent]){Swap(&arr[child], &arr[parent]);parent = child;child = parent * 2 + 1;}else{break;}}
}
3.4取堆顶数据
把堆顶数据返回,但不出堆
//取堆顶元素
HPDataType HPTop(HP* php)
{//地址不能为空,数据不能为空assert(php && php->size);return php->arr[0];
}
3.5判空
//判空
bool HPEmpty(HP* php)
{assert(php);//size为0,则为空return php->size == 0;
}
4.堆的应用
排升序--大堆 排降序--小堆
因为大堆头部是最大的,把它放到末尾,那就是升序
4.1向下调整算法建堆
向下调整算法建堆要插入的话说明左右都是建好的堆
思路:从堆的最后一个节点的父节点开始进行调整,调整完该父节点之后进行--操作
建大堆
//向下调整算法建堆for(int i=(n-1-1)/2;i>=0;i--){AdjustDown(arr, i , n );}
4.2向上调整算法建堆
建小堆,一个一个放,谁小谁往上放
//向上调整算法建堆
for (int i = 0; i < n; i++)
{AdjustUp(arr, i);
}