当前位置：首页 > news >正文

[算法笔记]一段数量变化的无序区间的中位数查找--双堆法

news 2025/10/31 3:46:09

1.为什么使用双堆法

2.双堆法的思路

插入过程：

调整过程：

3.代码实现

1.为什么使用双堆法

对于一个无序区间的中位数查找，我们最先想到的应该是排序算法，快速排序，归并排序等都是很好的方式，时间复杂度都是nlogn。而双堆法呢，每次插入一个元素，进行堆的顺序调整的时间复杂度为logn，那么插入n个元素时间复杂度也就一样时nlogn了，而且还需要额外的n的空间复杂度，为什么还要用双堆法呢？

对于一个数据量不变的区间排序，用sort是很好的，但是呢，如果数据量变化呢？每增加一个元素都需要重新调用一个快速排序，那么插入n个元素的话，就是n * nlogn的时间复杂度了，这样就非常慢了，但是使用双堆法的话，只需要对新的元素放入对应的堆空间，进行一次logn的位置改变即可。所以说对于一段数据量变化的空间，还想要一直找到区间的中位数的话，使用双堆法是个不错的选择。

2.双堆法的思路

顾名思义是采用两个堆，一个是大堆，一个是小堆，同时维护这两个堆的数据个数，小堆的数据个数最多可以比大堆的数据个数多一个，那么的话，如果是奇数个数的区间的话，那么中间值就放在了小堆的堆顶，如果是偶数个数的区间的话，那么就是根据要求了，选左边作为中间值的话，就是大堆的堆顶，如果是右区间作为中间值的话，就是小堆的堆顶了。

插入过程：

对于堆的top函数调用，如果堆为空的话，调用该函数会报错的，所以刚开始插入的时候，让其自动先放到小堆中，之后再插入的时候，就可以判断是否比小堆大了，大的话放到小堆里面，否则放到大堆里面。

// 如果大堆为空的话，先插入小堆 or 该元素比小堆的堆顶大
if (minHeap.empty() || item > minHeap.top())
	minHeap.push(item);
// 该元素比小堆的堆顶还小
else
	maxHeap.push(item);

当然也可以先放到大堆里面，然后判断元素的值是否是小于大堆的堆顶，如果是的话放到小堆，如果不是的话放到小堆中。

调整过程：

如果奇数个数的区间的时候，想让中间值放到小堆的堆顶的话，就规定小堆的元素个数最多可以比大堆多一个，而且大堆的个数不能多于小堆即可。如下图代码所示。

// 如果说小堆的数据比大堆+1还多
if (maxHeap.size() + 1 < minHeap.size())
{
	maxHeap.push(minHeap.top());
	minHeap.pop();
}
// 如果大堆的元素比小堆多
else if (maxHeap.size() > minHeap.size())
{
	minHeap.push(maxHeap.top());
	maxHeap.pop();
}

如果奇数个数的区间的中间值想要放到大堆的堆顶的时候，就可以规定大堆的元素个数最多比小堆多一个，小堆的元素个数不能多于大堆即可。

3.代码实现

#include <iostream>
#include <queue>
#include <vector>

int FindMiddenNumber(const std::vector<int>& num)
{
	std::priority_queue<int> maxHeap;										// 大堆
	std::priority_queue<int, std::vector<int>, std::greater<int>> minHeap;	// 小堆

	// 将数据插入
	for (auto item : num) 
	{
		// 如果大堆为空的话，先插入小堆 or 该元素比小堆的堆顶大
		if (minHeap.empty() || item > minHeap.top())
			minHeap.push(item);
		// 该元素比小堆的堆顶还小
		else
			maxHeap.push(item);

		// 如果说小堆的数据比大堆+1还多
		if (maxHeap.size() + 1 < minHeap.size())
		{
			maxHeap.push(minHeap.top());
			minHeap.pop();
		}
		// 如果大堆的元素比小堆多
		else if (maxHeap.size() > minHeap.size())
		{
			minHeap.push(maxHeap.top());
			maxHeap.pop();
		}
	}
	if (maxHeap.size() == minHeap.size())
		return maxHeap.top();
	else
		return minHeap.top();
}

int main()
{
	// 测试用例 1: 奇数个元素
	std::vector<int> test1 = { 1, 2, 3, 4, 5 };
	std::cout << "Test 1: " << FindMiddenNumber(test1) << std::endl;

	// 测试用例 2: 偶数个元素
	std::vector<int> test2 = { 1, 2, 3, 4 };
	std::cout << "Test 2: " << FindMiddenNumber(test2) << std::endl;

	// 测试用例 3: 包含负数
	std::vector<int> test3 = { -1, -2, -3, -4, -5 };
	std::cout << "Test 3: " << FindMiddenNumber(test3) << std::endl;

	// 测试用例 4: 包含零
	std::vector<int> test4 = { 0, 1, 2, 3, 4 };
	std::cout << "Test 4: " << FindMiddenNumber(test4) << std::endl;

	// 测试用例 5: 所有元素相同
	std::vector<int> test5 = { 5, 5, 5, 5, 5 };
	std::cout << "Test 5: " << FindMiddenNumber(test5) << std::endl;

	return 0;
}

查看全文

http://www.dtcms.com/a/93642.html