当前位置: 首页 > news >正文

数据结构篇--优先级队列排序--实验报告

  • 实验简介
  • 框架代码
  • 实验步骤
  • 运行结果
  • 实验总结

实验概述

优先队列排序算法的基本思想是:

  • 将所有待排序元素依次插入到优先队列中,然后按照从大到小的顺序,通过重复删除优先队列中的最大元素,取出所有元素,从而实现排序。
void PQsort(Item a[], int l, int r){PQinit(r-l+1);int k;for (k = l; k<=r; k++) {PQinsert(a[k]);}for (k = r; k >=l; k--) {a[k] = PQdelmax();}
}

本实验旨在通过实际运行和时间测量,比较两种基于优先队列的排序算法的性能:一种使用二叉堆作为优先队列的基础,另一种使用二项队列作为优先队列的基础。

实验将针对随机生成的整数键值进行排序,测试的数据规模 N N N 分别为 10 3 10^3 103 10 4 10^4 104 10 5 10^5 105 10 6 10^6 106,以经验性地评估它们在不同数据量下的时间效率。理论上,这两种基于优先队列的排序算法的时间复杂度都为 O ( N log ⁡ N ) O(N\log N) O(NlogN)

本实验将重点关注在实际运行中,不同数据结构所带来的常数因子差异。

框架代码

Makefile

CC = gcc
CFLAGS = -O0
TestSortWithHeapPQ: Exercise966.c HeapPQ.c$(CC) $(CFLAGS) -o $@ $^TestSortWithBinomialQueue: Exercise966.c BinomialQueue.c$(CC) $(CFLAGS) -o $@ $^clean:rm -f avg TestSortWithHeapPQ TestSortWithBinomialQueue

Exercise966.c
Item.h

typedef int Item;#define key(A) (A)
#define less(A,B) (key(A) < key(B))
#define exch(A, B) { Item t = A; A = B; B = t; }

PQ.h
HeapPQ.c
BinomialQueue.c

实验步骤

# 编译TestSortWithHeapPQ
make TestSortWithHeapPQ
# 编译TestSortWithBinomialQueue
make TestSortWithBinomialQueue
# 运行
./TestSortWithHeapPQ
# 运行
./TestSortWithBinomialQueue

运行结果

--- Running Heap-based Sort (Results below) ---
N		Time (ms)
---------------------------
1000		0.00
10000		1.00
100000		13.00
1000000		150.00--- Running Binomial Queue-based Sort (Results below) ---
N		Time (ms)
---------------------------
1000		0.00
10000		2.00
100000		25.00
1000000		300.00=======================================================
Combined Performance Comparison: Binomial Queues vs Heaps
=======================================================Heap-based Sort Results:
N		Time (ms)
---------------------------
1000		0.00
10000		1.00
100000		13.00
1000000		150.00Binomial Queue-based Sort Results:
N		Time (ms)
---------------------------
1000		0.00
10000		2.00
100000		25.00
1000000		300.00Summary (N | Heap Time (ms) | Binomial Time (ms))
---------------------------------------------------
1000			0.00			0.00
10000			1.00			2.00
100000			13.00			25.00
1000000			150.00			300.00
---------------------------------------------------

从实验结果可以看出,在所有测试的数据规模 N N N 下,基于二叉堆的排序通常比基于二项队列的排序表现出更快的执行时间。

  • 对于较小的数据量(例如 N = 1000 , 10 4 N=1000, 10^4 N=1000,104),两者的时间差异不明显,可能都在毫秒级别,甚至显示为 0.00 0.00 0.00 毫秒,这表明两种数据结构的基本操作都非常高效。
  • 然而,随着数据规模的增大(尤其是在 N = 10 5 N=10^5 N=105 N = 10 6 N=10^6 N=106 时),二叉堆的优势变得更加显著。在 N = 10 6 N=10^6 N=106 时,二叉堆排序的时间大约是二项队列排序时间的一半。

原因分析:

  1. 常数因子: 尽管两种算法的渐近时间复杂度都是 O ( N log ⁡ N ) O(N\log N) O(NlogN),但它们内部操作的常数因子不同。

    • 二叉堆(Binary Heap)通常采用数组实现,这提供了更好的缓存局部性。堆的 fixUpfixDown 操作主要涉及数组元素的简单比较和交换,这些操作对 CPU 缓存非常友好。
    • 二项队列(Binomial Queue)的实现涉及更复杂的指针操作动态内存分配(尤其是合并操作 pairBQjoin_internal)。它的结构是链式存储的二项树森林,这可能导致内存访问不连续,从而降低缓存效率。每次插入和删除最大元素都需要执行一系列的二项树合并操作,这些操作虽然渐进复杂度低,但实际的指令开销可能较大。
  2. 操作复杂性:

    • 二叉堆的插入和删除最大元素操作是相对直接的上浮或下沉,涉及到有限的比较和交换。
    • 二项队列的插入和删除最大元素操作则涉及将一个元素(或一个树)与队列中的多个树进行合并(类似二进制加法),删除最大元素后还需要将最大树的子树重新合并回队列。这些逻辑比二叉堆的维护更为复杂。

实验总结

本实验结果支持了理论分析中关于数据结构常数因子的考量。

在实际应用中,如果对性能有较高要求,且数据规模较大,二叉堆作为优先队列的基础通常是更优的选择,因为它在实现上的简洁性和更好的缓存性能使其具有更小的常数因子。

二项队列虽然在某些理论场景下(如合并两个大型优先队列)表现出色,但在简单的 insertdelmax 操作的反复执行中,其复杂性可能会导致性能略逊于二叉堆。

相关文章:

  • 城市停车场光伏-储能-充电系统耦合机制与效益分析
  • Ubuntu20.04部署KVM
  • Ubuntu22.04 系统安装Docker教程
  • 如何使用两块硬盘作为 Ubuntu24 的系统盘,实现坏掉一块不影响系统运行。
  • 域名与DNS详解
  • ROS 配置环境中的变量讲解
  • 第21天-pyttsx3语音播放功能
  • 视觉基础模型
  • 工程项目交付质量低?如何构建标准化管理体系?
  • 真实世界中的贝叶斯网络:Bootstrap、模型平均与非齐次动态的科研应用
  • Python Ray 扩展指南
  • 微信小程序AI大模型流式输出实践与总结
  • Windows在PowerShell或CMD运行 curl 命令报错 解决办法 (zx)
  • 8 种快速易用的Python Matplotlib数据可视化方法
  • 嵌入式STM32学习——串口USART 2.0(printf重定义及串口发送)
  • LM-BFF——语言模型微调新范式
  • 算法--js--电话号码的字母组合
  • 免费使用GPU的探索笔记
  • FFmpeg中使用Android Content协议打开文件设备
  • centOS8修改网络设置换成固定IP ping不同
  • 开发公司企业管理制度/排名优化公司