> 技术文档 > 【数据结构】一文读懂二叉树与堆:从结构到实现,解锁高效算法基石

【数据结构】一文读懂二叉树与堆:从结构到实现,解锁高效算法基石

在这里插入图片描述

二叉树

1.树概念及结构

1.1树的概念

树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成一个具有层次关系的集合。把它叫做树是因
为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。
有一个特殊的结点,称为根结点,根结点没有前驱结点
除根结点外,其余结点被分成M(M>0)个互不相交的集合T1、T2、……、Tm,其中每一个集合Ti(1<= i
<= m)又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱,可以有0个或多个后继
因此,树是递归定义的

在这里插入图片描述

在这里插入图片描述

注意:树形结构中,子树之间不能有交集,否则就不是树形结构

在这里插入图片描述

1.2 树的相关概念

在这里插入图片描述

结点的度:一个结点含有的子树的个数称为该结点的度; 如上图:A的为6
叶结点或终端结点度为0的结点称为叶结点; 如上图:B、C、H、I…等结点为叶结点
非终端结点或分支结点度不为0的结点; 如上图:D、E、F、G…等结点为分支结点
双亲结点或父结点:若一个结点含有子结点,则这个结点称为其子结点的父结点; 如上图:A是B的父结点
孩子结点或子结点:一个结点含有的子树的根结点称为该结点的子结点; 如上图:B是A的孩子结点
兄弟结点:具有相同父结点的结点互称为兄弟结点; 如上图:B、C是兄弟结点(亲兄弟)B、F不是兄弟结点
树的度:一棵树中,最大的结点的度称为树的度; 如上图:树的度为6
结点的层次:从根开始定义起,根为第1层,根的子结点为第2层,以此类推;
树的高度或深度:树中结点的最大层次; 如上图:树的高度为4
堂兄弟结点:双亲在同一层的结点互为堂兄弟;如上图:H、I互为堂兄弟结点
结点的祖先:从根到该结点所经分支上的所有结点;如上图:A是所有结点的祖先
子孙:以某结点为根的子树中任一结点都称为该结点的子孙。如上图:所有结点都是A的子孙
森林:由m(m>0)棵互不相交的树的集合称为森林;

空树高度为0,只有根节点高度为一

在这里插入图片描述

1.3 树的表示

树结构相对线性表就比较复杂了,要存储表示起来就比较麻烦了,既然保存值域,也要保存结点和结点之间
的关系,实际中树有很多种表示方式如:双亲表示法,孩子表示法、孩子双亲表示法以及孩子兄弟表示法
等。我们这里就简单的了解其中最常用的孩子兄弟表示法。

typedef int DataType;struct TreeNode{ struct TreeNode* leftChild; // 第一个孩子结点---左孩子 struct TreeNode* rightBrother; // 指向其下一个兄弟结点-----右兄弟 DataType data; // 结点中的数据域};

在这里插入图片描述

无论一个父亲节点有多少孩子,child指向左边第一个节点

1.4 树在实际中的运用(表示文件系统的目录树结构)

在这里插入图片描述

2.二叉树概念及结构

2.1概念

一棵二叉树是结点的一个有限集合,该集合:

  1. 或者为空
  2. 由一个根结点加上两棵别称为左子树和右子树的二叉树组成

在这里插入图片描述

从上图可以看出:

1.二叉树不存在度大于2的结点

2.二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树
注意:对于任意的二叉树都是由以下几种情况复合而成的:

在这里插入图片描述

2.2 特殊的二叉树:

  1. 满二叉树:一个二叉树,如果每一个层的结点数都达到最大值,则这个二叉树就是满二叉树。也就是
    说,如果一个二叉树的层数为K,且结点总数是2^k-1,则它就是满二叉树。
  2. 完全二叉树:完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。对于深度为K
    的,有n个结点的二叉树,当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点一一对
    应时称之为完全二叉树。 要注意的是满二叉树是一种特殊的完全二叉树。

在这里插入图片描述

2.3二叉树的性质

  1. 若规定根结点的层数为1,则一棵非空二叉树的第i层上最多有2^(i-1)个结点.

  2. 若规定根结点的层数为1,则深度为h的二叉树的最大结点数是2^h-1 .

  3. 对任何一棵二叉树, 如果度为0其叶结点个数为n , 度为2的分支结点个数为m ,则有 n=m+1

  4. 若规定根结点的层数为1,具有n个结点的满二叉树的深度,h= log(n+1) 底数默认为2

  5. 对于具有n个结点的完全二叉树,如果按照从上至下从左至右的数组顺序对所有结点从0开始编号,则对
    于序号为i的结点有:

1.若i>0,i位置结点的双亲序号:(i-1)/2;i=0,i为根结点编号,无双亲结点

2.若2i+1=n否则无左孩子

3.若2i+2=n否则无右孩子

2.4二叉树的存储结构

二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构。

1.顺序存储

顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空
间的浪费。而现实中使用中只有才会使用数组来存储。二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树。

在这里插入图片描述

2.链式存储

二叉树的链式存储结构是指,用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。 通常的方法是
链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来给出该结点左孩子和右孩子所
在的链结点的存储地址 。链式结构又分为二叉链和三叉链,当前我们学习中一般都是二叉链,后面课程
学到高阶数据结构如红黑树等会用到三叉链。

在这里插入图片描述

在这里插入图片描述

3.二叉树的顺序结构及实现

3.1 二叉树的顺序结构

普通的二叉树是不适合用数组来存储的,因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结 构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储,需要注意的是这里的堆和操作系统 虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段。

在这里插入图片描述

在这里插入图片描述

3.2 堆的概念及结构

如果有一个关键码的集合K = { , , ,…, },把它的所有元素按完全二叉树的顺序存储方式存储
在一个一维数组中,并满足: <= 且 = 且 >= ) i = 0,1,2…,则称为小堆(或大堆)。将根结点最大的堆叫做最大堆或大根堆,根结点最小的堆叫做最小堆或小根堆。
堆的性质:
堆中某个结点的值总是不大于或不小于其父结点的值;
堆总是一棵完全二叉树。

在这里插入图片描述

大堆跟小堆都是完全二叉树

大堆:所有的父亲>=儿子 根节点最大

小堆:所有的父亲<=儿子 根节点最小

3.3堆的实现

同样使用多文件操作,Heap.h用来放函数的声明,Heap.c放函数的实现,test.c用来测试

在这里插入图片描述

1.定义一个堆
typedef int HPDataType;typedef struct Heap{HPDataType* a;int size;int capacity;}HP;
2.初始化
void HPInit(HP* php){assert(php);php->a = NULL;php->capacity = php->size = 0;}
3.销毁
void HPDestroy(HP* php){assert(php);free(php->a);php->a = NULL;php->capacity = php->size = 0;}
4.向上调整
void AdjustUp(HPDataType* a, int child){int parent =(child - 1) / 2;while (child > 0){if(a[child]<a[parent]){Swap(&a[child], &a[parent]);child = parent;parent = (child - 1) / 2;//去找原来父亲的父亲}else{break;}}}
5.堆的插入

插入数据时,把数据插在最后一个再向上调整

在这里插入图片描述

void HPPush(HP* php, HPDataType x){assert(php);if (php->size == php->capacity){ //扩容int newcapacity = php->capacity == 0 ? 4 : php->capacity * 2;HPDataType* tmp = (HPDataType*)realloc(php->a, newcapacity * sizeof(HPDataType));if (tmp == NULL){perror(\"realloc fail\");return;}php->a = tmp;php->capacity = newcapacity;} php->a[php->size] = x;php->size++;AdjustUp(php->a, php->size - 1);//数组下标从0开始}
6.向下调整

在这里插入图片描述

void AdjustDown(HPDataType* a, int n, int parent){//假设法 先假设左孩子小int child = parent * 2 + 1;while (child < n)//child>=n 说明孩子不存在 调整到叶子了 n是数组大小{//找出小的孩子if (child + 1 < n && a[child + 1] < a[child] )//当左孩子取n-1时 右孩子a[n]越界访问 所有要再加一个判断条件{child++;//child+1变成右孩子}if (a[child] < a[parent]){Swap(&a[child], &a[parent]);parent = child;child = parent * 2 + 1;}else{break;}}}
7.删除堆顶数据

删除堆是删除堆顶的数据,将堆顶的数据根最后一个数据一换,然后删除数组最后一个数据,再进行向下调 整算法

在这里插入图片描述

void HPPop(HP* php){assert(php);assert(php->size > 0);Swap(&php->a[0], &php->a[php->size - 1]);php->size--;AdjustDown(php->a, php->size, 0);}
8.判空
bool HPEmpty(HP* php){assert(php);return php->size == 0;}
9.返回堆顶元素
HPDataType HPTop(HP* php)//返回堆顶元素{assert(php);assert(php->size > 0);return php->a[0];}
10.按顺序打印

给一个数组让他按顺序打印

#include\"Heap.h\"void Test01(){int a[] = { 2,4,5,7,3,2,1,5 };HP hp;HPInit(&hp);for (size_t i = 0; i < sizeof(a) / sizeof(int); i++){HPPush(&hp, a[i]);//push就是建堆 把a[i]依次放入php->a}while (!HPEmpty(&hp)){printf(\"%d\", HPTop(&hp));HPPop(&hp);}}int main(){Test01();return 0;}
11.程序源码

Heap.h

#pragma once#include#include#include#includetypedef int HPDataType;typedef struct Heap{HPDataType* a;int size;int capacity;}HP;void HPInit(HP* php);void HPDestroy(HP* php);void HPPush(HP* php, HPDataType x);void HPPop(HP* php);//删除堆顶的数据void AdjustUp(HPDataType* a, int x);void AdjustDown(HPDataType* a, int n, int parent);HPDataType HPTop(HP* php);bool HPEmpty(HP* php);

Heap.c

#define _CRT_SECURE_NO_WARNINGS#include\"Heap.h\"void Swap(HPDataType* p1, HPDataType* p2){HPDataType tmp = *p1;*p1 = *p2;*p2 = tmp;}void HPInit(HP* php){assert(php);php->a = NULL;php->capacity = php->size = 0;}void HPDestroy(HP* php){assert(php);free(php->a);php->a = NULL;php->capacity = php->size = 0;}void HPPush(HP* php, HPDataType x){assert(php);if (php->size == php->capacity){int newcapacity = php->capacity == 0 ? 4 : php->capacity * 2;HPDataType* tmp = (HPDataType*)realloc(php->a, newcapacity * sizeof(HPDataType));if (tmp == NULL){perror(\"realloc fail\");return;}php->a = tmp;php->capacity = newcapacity;}php->a[php->size] = x;php->size++;AdjustUp(php->a, php->size - 1);//数组下标从0开始}//向上调整void AdjustUp(HPDataType* a, int child){int parent =(child - 1) / 2;while (child > 0){if(a[child]<a[parent]){Swap(&a[child], &a[parent]);child = parent;parent = (child - 1) / 2;//去找原来父亲的父亲}else{break;}}}void HPPop(HP* php){assert(php);assert(php->size > 0);Swap(&php->a[0], &php->a[php->size - 1]);php->size--;AdjustDown(php->a, php->size, 0);}void AdjustDown(HPDataType* a, int n, int parent){//假设法 先假设左孩子小int child = parent * 2 + 1;while (child < n)//child>=n 说明孩子不存在 调整到叶子了 n是数组大小{//找出小的孩子if (child + 1 < n && a[child + 1] < a[child] )//当左孩子取n-1时 右孩子a[n]越界访问 所有要再加一个判断条件{child++;//child+1变成右孩子}if (a[child] < a[parent]){Swap(&a[child], &a[parent]);parent = child;child = parent * 2 + 1;}else{break;}}}HPDataType HPTop(HP* php)//返回堆顶元素{assert(php);assert(php->size > 0);return php->a[0];}bool HPEmpty(HP* php){assert(php);return php->size == 0;}

test.c

#define _CRT_SECURE_NO_WARNINGS#include\"Heap.h\"void Test01(){int a[] = { 2,4,5,7,3,2,1,5 };HP hp;HPInit(&hp);for (size_t i = 0; i < sizeof(a) / sizeof(int); i++){HPPush(&hp, a[i]);//push就是建堆 把a[i]依次放入php->a}/*while (!HPEmpty(&hp)){printf(\"%d\", HPTop(&hp));HPPop(&hp);}*/int k = 0;scanf(\"%d\", &k);while (k--){printf(\"%d \", HPTop(&hp));HPPop(&hp);}}int main(){Test01();return 0;}

3.4 堆的应用

1.TOP-k问题

TOP-K问题:即求数据结合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。
比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。
对于Top-K问题,能想到的最简单直接的方式就是排序,但是:如果数据量非常大,排序就不太可取了(可能
数据都不能一下子全部加载到内存中)。最佳的方式就是用堆来解决,基本思路如下:

  1. 用数据集合中前K个元素来建堆
    前k个最大的元素,则建小堆
    前k个最小的元素,则建大堆

  2. 用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素
    将剩余N-K个元素依次与堆顶元素比完之后,堆中剩余的K个元素就是所求的前K个最小或者最大的元素。

void PrintTopK(int* a, int n, int k){ // 1. 建堆--用a中前k个元素建堆 // 2. 将剩余n-k个元素依次与堆顶元素交换,不满则则替换}void TestTopk(){ int n = 10000; int* a = (int*)malloc(sizeof(int)*n); srand(time(0)); for (size_t i = 0; i < n; ++i) { a[i] = rand() % 1000000; } a[5] = 1000000 + 1; a[1231] = 1000000 + 2; a[531] = 1000000 + 3; a[5121] = 1000000 + 4; a[115] = 1000000 + 5; a[2335] = 1000000 + 6; a[9999] = 1000000 + 7; a[76] = 1000000 + 8; a[423] = 1000000 + 9; a[3144] = 1000000 + 10; PrintTopK(a, n, 10);}
2.堆排序

堆排序即利用堆的思想来进行排序,总共分为两个步骤:

  1. 建堆
    升序:建大堆
    降序:建小堆
  2. 利用堆删除思想来进行排序
    建堆和堆删除中都用到了向下调整,因此掌握了向下调整,就可以完成堆排序。

在这里插入图片描述

古龙中文句子网