当前位置: 首页 > news >正文

今天你学C++了吗?——set


♥♥♥~~~~~~欢迎光临知星小度博客空间~~~~~~♥♥♥

♥♥♥零星地变得优秀~也能拼凑出星河~♥♥♥

♥♥♥我们一起努力成为更好的自己~♥♥♥

♥♥♥如果这一篇博客对你有帮助~别忘了点赞分享哦~♥♥♥

♥♥♥如果有什么问题可以评论区留言或者私信我哦~♥♥♥

✨✨✨✨✨✨ 个人主页✨✨✨✨✨✨

前面我们已经了解到了二叉搜索树的底层结构,而与它息息相关的就是容器——map和set,这一篇博客我们就开始探索map和set,准备好了吗~我们发车去探索C++的奥秘啦~🚗🚗🚗🚗🚗

目录

序列式容器和关联式容器

序列式容器(Sequential Containers)

关联式容器(Associative Containers)

核心区别

set

什么是set?

set的使用

插入数据排降序

双向迭代器

初始化列表

find

erase

swap

clear

count

lower_bound和upper_bound

multiset

insert

find

count

erase

接口差异总结


序列式容器和关联式容器

序列式容器(Sequential Containers)

  1. 定义
    逻辑结构为线性序列的容器,元素按存储位置的物理顺序排列,彼此无紧密关联。

  2. 核心特性

    • 顺序无关性:元素交换位置后,容器性质不变(如 vector 中交换元素仍是合法序列)。
    • 访问方式:通过元素在容器中的位置(如索引、迭代器)进行访问。
    • 典型容器vector, list, deque, array, forward_list, string
  3. 适用场景
    需要高效遍历或按位置操作元素的场景,如动态数组、链表等。

关联式容器(Associative Containers)

  1. 定义
    逻辑结构为非线性(通常为树或哈希表),元素通过关键字(Key)建立强关联关系。

  2. 核心特性

    • 有序性约束:元素按关键字排序(如 map/set)或哈希分布(如 unordered_map/set)。
    • 访问方式:通过关键字直接访问元素,而非物理位置。
    • 典型容器
      • 有序系列map, set, multimap, multiset(基于红黑树)。
      • 无序系列unordered_map, unordered_set(基于哈希表)。
  3. 适用场景
    需要高效查找、插入或删除特定关键字的场景,如字典、集合等。

核心区别

对比维度序列式容器关联式容器
逻辑结构线性序列(顺序无关)非线性结构(树/哈希表,有序/无序)
元素关系位置相邻,无键值关联通过关键字强关联
访问方式按物理位置(索引/迭代器)按关键字(find, [] 运算符)
典型操作效率插入/删除中间元素可能低效查找/插入/删除平均高效(哈希表)或对数时间(树)
内存布局连续或节点式存储树节点或哈希桶分散存储
  • 序列式容器适合按位置操作或遍历的场景,强调元素的物理顺序。
  • 关联式容器适合按关键字快速访问的场景,强调元素间的逻辑关联。
  • 两者共同构成STL容器体系的核心,分别应对不同的数据操作需求。

set

什么是set?

set(集合)是一个关联容器,它只存储键,不存储值(也就是我们前面说的key场景)。set中的元素是唯一的,multiset中的元素不是唯一的,但是它们都会进行自动排序,set底层使用红黑树进行实现,本质上是一颗平衡二叉搜索树,我们后面的博客会对红黑树进行实现~我们这里主要讲元素唯一的set容器~

  • 特点
    • 元素是唯一的。
    • 自动排序(默认情况下,使用<运算符排序,但可以自定义排序规则)。
    • 查找、插入和删除操作的时间复杂度通常为O(log n),因为set内部通常实现为红黑树。
  • 用途
    • 当你需要快速查找、插入和删除元素时。
    • 当你需要存储唯一元素的数据集时。
    • 例如,如果你想检查一个元素是否存在于某个集合中,set就非常合适。

set的使用

通过查阅文档,我们可以发现set提供了很多的接口,这里我们直接在代码里面使用,有一些注意点会在代码注释里面进行讲解~更加简洁明了~

#include<iostream>
using namespace std;
#include<set>//包含头文件

void test1()
{
	//构造使用
	set<int> s;//支持默认构造
	//插入数据
	//set里面元素唯一——所以插入数据(去重+排序)
	//默认为升序
	s.insert(2);
	s.insert(5);
	s.insert(7);
	s.insert(7);
	s.insert(1);
	s.insert(9);
	s.insert(0);
	s.insert(2);

	//迭代器使用
	//set<int>::iterator it = s.begin();
	auto it = s.begin();//使用auto更加方便
	while (it != s.end())
	{
		cout << *it << " ";
		it++;
	}
	cout << endl;
	//同样支持范围for
	for (auto e : s)
	{
		cout << e << " ";
	}
	cout << endl;
	//数据删除
	s.erase(2);
	s.erase(0);
	for (auto e : s)
	{
		cout << e << " ";
	}
	cout << endl;
}

插入数据排降序

我们插入数据的时候是去重+默认排升序,那如果是我们希望排降序呢?这个时候我们就需要看一看set的构造函数:

我们需要就需要更改第二个参数,默认是less那我们就更改为greater:

void test2()
{
	//构造使用
	set<int,greater<int>> s;//支持默认构造
	//插入数据
	//set里面元素唯一——所以插入数据(去重+排序)
	//修改第二个参数排为降序
	s.insert(2);
	s.insert(5);
	s.insert(7);
	s.insert(7);
	s.insert(1);
	s.insert(9);
	s.insert(0);
	s.insert(2);
	for (auto e : s)
	{
		cout << e << " ";
	}
	cout << endl;
}

双向迭代器

            此外,我们还可以知道set的迭代器是双向的~

void test3()
{
	//构造使用
	set<int> s;//支持默认构造
	s.insert(2);
	s.insert(5);
	s.insert(7);
	s.insert(7);
	s.insert(1);
	s.insert(9);
	s.insert(0);
	s.insert(2);
	//双向迭代器
	auto it1 = s.begin();//使用auto更加方便
	while (it1 != s.end())
	{
		cout << *it1 << " ";
		it1++;
	}
	cout << endl;

	auto it2 = s.rbegin();//使用auto更加方便
	while (it2 != s.rend())
	{
		cout << *it2 << " ";
		it2++;
	}
	cout << endl;
}

初始化列表

set同样支持创建的时候就给值进行初始化~后面会取出初始化列表的值来进行插入,并且去重和排序~

void test4()
{
	//构造使用
	set<int> s = { 1,2,8,9 };//支持初始化列表
	s.insert(2);
	s.insert(5);
	s.insert(7);
	s.insert(7);
	s.insert(1);
	s.insert(9);
	s.insert(0);
	s.insert(2);
	
	auto it1 = s.begin();
	while (it1 != s.end())
	{
		cout << *it1 << " ";
		it1++;
	}
	cout << endl;
}

find

我们知道算法库里面也有一个find()函数,那么为什么set里面还要提供find呢?算法库里面的find只需要依靠单向迭代器就可以了,那也就说明了查找的时间复杂度为O(N),我们知道set底层也就是一颗平衡二叉搜索树,那么查找时间复杂度为O(log N),明显更胜一筹~

算法库的find():

set函数的find():

代码测试:

void test5()
{
	set<int> s = { 3455,789,90,5555,5555555 };
	srand((unsigned int)time(NULL));//以时间为种子
	for (int i = 0; i < 10000000; i++)
	{
		s.insert(rand()%10000000);//生成随机数进行插入
	}
	//测试查找时间
	int begin1 = clock();//执行到当前代码时间
	s.find(5555555);
	int end1 = clock();
	cout << "set函数find时间:" << end1 - begin1 << endl;
	int begin2 = clock();
	find(s.begin(), s.end(), 5555555);
	int end2 = clock();
	cout << "算法库函数find时间:" << end2 - begin2 << endl;
	
}

可以发现set函数的find时间在0ms以下,而算法库里面的却达到了3ms~这就证明了我们的观点~

erase

我们如果想要删除元素可以给迭代器位置或者迭代器区间或者删除的值,这里我们来进行一下测试~有的人可能会觉得奇怪,删除指定的值为什么返回值是int呢?不是bool类型也不是void类型,这是因为要与multiset版本相符合,multiset版本允许重复,一次删除的可能有多个

void test6()
{
	set<int> s = { 1,2,8,9,5,7,6,0 };
	for (auto e : s)
	{
		cout << e << " ";
	}
	cout << endl;
	//1、给值
	//该版本erase的返回值给整型的原因是multiset版本相符合
	//multiset版本允许重复,一次删除的可能有多个
	int e1 = s.erase(6);
	cout << "e1==" << e1 << endl;
	for (auto e : s)
	{
		cout << e << " ";
	}
	cout << endl;
	int e2 = s.erase(10);
	cout << "e2==" << e2 << endl;
	for (auto e : s)
	{
		cout << e << " ";
	}
	cout << endl;
	//2、给相应位置的迭代器并且迭代器是有效的
	auto ret = s.find(8);
	if (ret != s.end())//判断是否为有效的迭代器
	{
		s.erase(ret);
	}
	for (auto e : s)
	{
		cout << e << " ";
	}
	cout << endl;
	//3、给一段迭代器区间
	auto ret2 = s.find(5);
	if (ret2 != s.end())
	{
		s.erase(s.begin(), ret2);
	}
	for (auto e : s)
	{
		cout << e << " ";
	}
	cout << endl;
}

swap

swap很明显就是完成两个set的交换操作~只需要一个参数就可以了~

void test7()
{
	set<int> s1 = { 2,4,7,0,1,5 };
	set<int> s2 = { 2,9,3 };
	cout << "交换前s1:" << endl;
	for (auto e1 : s1)
	{
		cout << e1 << " ";
	}
	cout << endl;
	cout << "交换前s2:" << endl;
	for (auto e2 : s2)
	{
		cout << e2 << " ";
	}
	cout << endl;
	s1.swap(s2);
	cout << "交换后s1:" << endl;
	for (auto e1 : s1)
	{
		cout << e1 << " ";
	}
	cout << endl;
	cout << "交换后s2:" << endl;
	for (auto e2 : s2)
	{
		cout << e2 << " ";
	}
	cout << endl;
}

clear

clear也就是对所有的元素进行清除了~我们同样可以进行测试~

count

count返回的是该元素的个数,返回值同样是无符号整型,这也是因为与multiset相符合,事实上判断某一个元素是否存在使用count更加方便~因为不需要再看是否是末尾迭代器了~

lower_bound和upper_bound

        在 set 中,lower_boundupper_bound 提供了高效的有序查找能力,尤其适合范围查询和边界处理~

lower_bound

  • 功能:返回指向第一个 大于等于 给定值的元素的迭代器。
  • 行为
    • 若值存在,返回指向该元素的迭代器。
    • 若值不存在,返回指向第一个比它大的元素的迭代器。
    • 若所有元素都小于该值,返回 end()

upper_bound

  • 功能:返回指向第一个 严格大于 给定值的元素的迭代器。
  • 行为
    • 若值存在,返回指向该元素下一个位置的迭代器。
    • 若值不存在,返回指向第一个比它大的元素的迭代器。
    • 若所有元素都小于等于该值,返回 end()

简单对比

函数条件返回值指向
lower_bound存在等于值该元素
不存在等于值第一个比它大的元素
upper_bound存在等于值该元素的下一个位置
不存在等于值第一个比它大的元素

测试

void test8()
{
	set<int> s = { 10,20,30,45,50,60,70,80,90,95,100 };
	//现在我们想删除40——90这段区间的值
	//我们没有办法直接找到
	//使用lower_bound找到大于等于40后返回迭代器
	auto loit = s.lower_bound(40);
	//使用upper_bound找到严格大于90后返回迭代器
	auto upit = s.upper_bound(90);

	//删除找到的迭代器区间
	s.erase(loit, upit);
	for (auto e : s)
	{
		cout << e << " ";
	}
	cout << endl;
}

    我们也可以打印观察:

    multiset

            前面我们知道set和multiset其实是差不多的,他们之间主要的差别是mulset支持重复,而set是不支持的~

     

    我们可以看到它们的接口是基本上是一致的,multiset支持值冗余,所以insert/find/count/erase都围绕着因为支持值冗余有所差异~我们这里就主要来看看它们的差异了~

    insert

    • set

      • 插入重复值时失败,返回 pair<iterator, bool>,其中 secondfalse
      • 插入成功时,secondtrueiterator 指向新元素

    multiset

    • 允许插入重复值,返回的迭代器始终指向新插入的元素(即使值已存在)。
    • 返回类型为 iterator,而非 pair

    void test9()
    {
    	set<int> s = { 1,4,7,3,9 };
    	multiset<int> ms = { 1,4,7,3,9 };
    
    	auto d1 = s.insert(4);//不支持重复
    	auto d2 = ms.insert(4);//支持重复
    	for (auto e1 : s)
    	{
    		cout << e1 << " ";
    	}
    	cout << endl;
    	for (auto e2 : ms)
    	{
    		cout << e2 << " ";
    	}
    	cout << endl;
    }

    我们可以通过监视窗口查看它们的返回值类型

    运行结果:

    可以看出ms成功插入,而s插入失败,后面的博客我们会对pair这一个返回值类型进行讲解~

    find

    • setmultiset
      • 均返回指向第一个等于给定值的元素的迭代器
      • 若不存在,返回 end()
    • 差异
      • set:最多有一个匹配元素
      • multiset:可能有多个匹配元素,但 find 仅返回第一个

    count

    set

    • 只能返回 0(不存在)或 1(存在)

    multiset

    • 返回等于给定值的元素数量(可能大于1)

    代码测试:

    void test10()
    {
    	set<int> s = { 1,4,7,3,9,5 };
    	multiset<int> ms = { 1,4,7,3,9,4,3,5,4 };
    
    	auto d1 = s.find(4);
    	auto d2 = ms.find(4);
    
    	cout << s.count(4) << endl;
    	cout << ms.count(4) << endl;
    }

    erase

    • set
      • erase(value):删除所有等于 value 的元素(最多1个)
      • erase(iterator):删除指定位置的元素
      • erase(iterator first, iterator last):删除区间 [first, last) 内的元素
    • multiset
      • erase(value):删除所有等于 value 的元素
      • 其他重载与 set 一致

    代码测试:

    void test11()
    {
    	set<int> s1 = { 1,4,7,4,3,9,5 };//去重+排序
    	set<int> s2 = { 1,4,7,4,3,9,5 };//去重+排序
    	multiset<int> ms1 = { 1,4,7,3,9,4,3,5,4,4,1 };//排序
    	multiset<int> ms2 = { 1,4,7,3,9,4,3,5,4,4 ,1 };//排序
    	cout << "删除前:" << endl;
    	cout << "s1.count(4) = " << s1.count(4) << endl;
    	cout << "ms1.count(4) = " << ms1.count(4) << endl;
    	cout << "s2.count(1) = " << s2.count(1) << endl;
    	cout << "ms2.count(1) = " << ms2.count(1) << endl;
    	s1.erase(4);//删除一个4
    	s2.erase(s2.begin());//删除开头元素
    	ms1.erase(4);//删除所有4
    	ms2.erase(ms2.begin());//只删除开头元素
    	cout << "删除后:" << endl;
    	cout << "s1.count(4) = " << s1.count(4) << endl;
    	cout << "ms1.count(4) = " << ms1.count(4) << endl;
    	cout << "s2.count(1) = " << s2.count(1) << endl;
    	cout << "ms2.count(1) = " << ms2.count(1) << endl;
    	
    }

    接口差异总结

    接口setmultiset
    insert拒绝重复,返回 pair允许重复,返回 iterator
    find返回唯一匹配返回中序遍历第一个匹配
    count仅返回 01返回实际数量
    erase删除单个元素可删除多个元素

    当我们理解这些差异有助于根据需求选择容器:需要唯一性时用 set,允许重复时用 multiset~

    如果需要可以查阅文档:set和multiset文档


    ♥♥♥本篇博客内容结束,期待与各位优秀程序员交流,有什么问题请私信♥♥♥

    ♥♥♥如果这一篇博客对你有帮助~别忘了点赞分享哦~♥♥♥

    ✨✨✨✨✨✨个人主页✨✨✨✨✨✨


    http://www.dtcms.com/a/122711.html

    相关文章:

  • 深入浅出SPI通信协议与STM32实战应用(W25Q128驱动)(实战部分)
  • 思维森林理论(Cognitive Forest Theory)重构医疗信息系统集群路径探析
  • VectorBT量化入门系列:第三章 VectorBT策略回测基础
  • 【AI News | 20250409】每日AI进展
  • Pyppeteer实战:基于Python的无头浏览器控制新选择
  • React十案例下
  • Java基础第19天-MySQL数据库
  • IT+开发+业务一体化:AI驱动的ITSM解决方案Jira Service Management价值分析(文末免费获取报告)
  • 云轴科技ZStackCTO王为:AI Infra平台具备解决私有化AI全栈难题能力
  • 超便捷超实用的文档处理工具,PDF排序,功能强大,应用广泛,无需下载,在线使用,简单易用快捷!
  • 【JSON2WEB】16 login.html 登录密码加密传输
  • IDEA 调用 Generate 生成 Getter/Setter 快捷键
  • AWS Bedrock生成视频详解:AI视频创作新时代已来临
  • 【零基础实战】Ubuntu搭建DVWA漏洞靶场全流程详解(附渗透测试示例)
  • Java常用工具算法-5--哈希算法、加密算法、签名算法关系梳理
  • 蓝桥杯 B3620 x 进制转 10 进制
  • 【蓝桥杯】15届JAVA研究生组F回文字符串
  • STM32单片机入门学习——第29节: [9-5] 串口收发HEX数据包串口收发文本数据包
  • C++设计模式+异常处理
  • 21 天 Python 计划:MySQL 数据库初识
  • LangChain使用大语言模型构建强大的应用程序
  • 开源模型应用落地-模型上下文协议(MCP)-从数据孤岛到万物互联(一)
  • Linux 实时查看 CUDA 显卡的使用情况命令
  • 基于形状补全和形态测量描述符的腓骨游离皮瓣下颌骨重建自动规划|文献速递-深度学习医疗AI最新文献
  • 【Linux】Linux 操作系统 - 03 ,初步指令结尾 + shell 理解
  • Qt中的信号与槽及其自定义
  • mysql Creating sort index
  • 博物馆小程序怎么做?从0到1打造数字化文化窗口
  • openEuler欧拉系统配置local的yum源
  • 蓝桥杯-蓝桥幼儿园(Java-并查集)