C++ std::Set<std::pair>
1) std::set
的三个关键特性
- 元素自动排序:
std::set
始终按严格弱序(默认std::less<Key>
的字典序)维持有序,常见操作(插入、查找、上下界)复杂度均为 O(log N)。 - 元素不允许重复:比较器认为“等价”的元素不能共存(即
!(a<b) && !(b<a)
为真时视为等价)。 - 基于红黑树实现:标准库通常采用红黑树;因此“有序 + 查找高效”是它相对
unordered_set
的显著特征。
2) 关于比较:Timestamp
与 std::unique_ptr<int>
能否比较?
-
Timestamp
:你给出的成员是private int secondsFromEpoch
。要参与排序,必须为Timestamp
提供可用的严格弱序比较(通常实现operator<
或在比较器内访问一个getter()
)。 -
std::unique_ptr<int>
:- 标准提供了与同类
unique_ptr
的关系运算符(<、<=、>、>=、==、!=
),其比较语义是按底层指针地址比较(实现上等价于std::less<int*>{}(p.get(), q.get())
)。 - 注意:这不是按指向的“整数值”比较,而是按地址。如果你的业务语义是“同时间戳 + 指针指向的值也相等才算相等/有序”,地址比较可能不符合预期。
- 结论:可以比较,但“比较的是地址而非内容”。
- 标准提供了与同类
字典序:std::pair<A,B>
的默认 <
比较是先比较 first
,若相等再比较 second
。因此在 std::set<std::pair<Timestamp, std::unique_ptr<int>>>
中:
- 先比较
Timestamp
; Timestamp
相等时,再比较unique_ptr<int>
的地址。
3) 自定义透明比较器(heterogeneous lookup)
直接用 pair<Timestamp, unique_ptr<int>>
做键会遇到查找难题:
- 你不能构造一个临时
unique_ptr<int>
作为查找键的第二分量(会产生错误的所有权,临时对象析构时会delete 它指向的地址,造成双重释放风险)。 - 正确姿势是用透明比较器支持“用
(Timestamp, const int*)
这类异质键进行查找”,从而无需构造unique_ptr
。
透明比较器(具备
using is_transparent = void;
)允许set.find
/erase
/lower_bound
等直接用可比较但类型不同的键(如const int*
)进行 O(log N) 查找。
4) CRUD 规范做法(C++17+)
下述代码块分别演示 Create/Read/Update/Delete。请先看类型与比较器。
#include <set>
#include <memory>
#include <utility>
#include <optional>
#include <iostream>// ========== 1) 可排序的 Timestamp ==========
class Timestamp {int secondsFromEpoch_; // 私有
public:explicit Timestamp(int s = 0) : secondsFromEpoch_(s) {}int seconds() const noexcept { return secondsFromEpoch_; }// 定义严格弱序(仅按秒比较)friend bool operator<(const Timestamp& a, const Timestamp& b) noexcept {return a.secondsFromEpoch_ < b.secondsFromEpoch_;}
};// 方便书写
using Key = std::pair<Timestamp, std::unique_ptr<int>>;// ========== 2) 透明比较器:支持 pair<Timestamp, unique_ptr<int>>
// 以及 (Timestamp, const int*) 这种异质键的比较与查找 ==========
struct PairCmp {using is_transparent = void; // 启用异质查找// 基本:pair vs pair(按字典序:先时间戳,再指针地址)bool operator()(const Key& a, const Key& b) const noexcept {if (a.first < b.first) return true;if (b.first < a.first) return false;return std::less<const int*>{}(a.second.get(), b.second.get());}// 异质:pair vs (Timestamp, const int*)bool operator()(const Key& a, const std::pair<Timestamp, const int*>& b) const noexcept {if (a.first < b.first) return true;if (b.first < a.first) return false;return std::less<const int*>{}(a.second.get(), b.second);}bool operator()(const std::pair<Timestamp, const int*>& a, const Key& b) const noexcept {if (a.first < b.first) return true;if (b.first < a.first) return false;return std::less<const int*>{}(a.second, b.second.get());}// 也可追加只按 Timestamp 的异质比较(用于范围查询)bool operator()(const Key& a, const Timestamp& t) const noexcept {return a.first < t;}bool operator()(const Timestamp& t, const Key& b) const noexcept {return t < b.first;}
};using PairSet = std::set<Key, PairCmp>;
A. Create(插入)
std::set
是节点容器,可无拷贝插入仅移动类型(如unique_ptr
)。- 用
emplace
/insert
,传右值/用std::make_unique
。
PairSet s;// 1) 直接 emplace(推荐)
s.emplace(Timestamp{100}, std::make_unique<int>(42));
s.emplace(Timestamp{100}, std::make_unique<int>(7)); // 与上一个可共存:时间戳相同但地址不同
s.emplace(Timestamp{120}, std::make_unique<int>(99));// 2) 先构造 Key 再 move
Key k{ Timestamp{130}, std::make_unique<int>(123) };
s.insert(std::move(k)); // k.second 置空
要点:
- 如果你希望“相同
Timestamp
只允许一条记录”,就不要把unique_ptr
纳入比较;而应改用“仅比较Timestamp
”的比较器(见 §7 变体方案)。
B. Read(查询/遍历)
1) 按(Timestamp, 指针地址)精确查找
利用透明比较器,避免构造临时
unique_ptr
。
Timestamp t{100};
const int* addr = /* 已知的底层指针地址,如 it->second.get() */;
auto it = s.find(std::pair<Timestamp, const int*>{t, addr});
if (it != s.end()) {std::cout << "found value=" << *(it->second) << "\n";
}
2) 按时间戳做范围/等值查找
// 所有 timestamp == 100 的区间:
auto rng = s.equal_range(Timestamp{100}); // 依赖我们在比较器中提供的 (Key, Timestamp) 重载
for (auto it = rng.first; it != rng.second; ++it) {// 这些元素的 it->first.seconds() 都是 100
}// 所有 timestamp 在 [100, 130):
for (auto it = s.lower_bound(Timestamp{100}); it != s.lower_bound(Timestamp{130}); ++it) {// ...
}
3) 遍历(有序)
for (const auto& [ts, ptr] : s) {std::cout << ts.seconds() << " -> " << (ptr ? *ptr : -1) << "\n";
}
C. Update(更新)
重要原则:std::set
中的元素作为“键”不可就地修改其影响排序的部分(包括 Timestamp
与 unique_ptr
的地址)。否则会破坏红黑树不变量。
正确做法:使用 node handle(C++17)进行“摘除-修改-再插入”。
1) 修改 Timestamp
或替换 unique_ptr
(地址会变)
// 找到一个元素
auto it = s.lower_bound(Timestamp{100});
if (it != s.end() && it->first.seconds() == 100) {// 1) extract 节点,容器不再管理平衡关系中的该节点auto nh = s.extract(it); // node_handle,拥有该 pair 的完整所有权// 2) 修改 key 内容(注意:任何影响排序的字段都只能在 node 中修改)nh.value().first = Timestamp{105}; // 改时间戳nh.value().second = std::make_unique<int>(555); // 新指针(地址变化)// 3) 重新插入auto [pos, ok] = s.insert(std::move(nh));// ok==false 表示与现有元素等价(违反唯一性),插入失败
}
2) 仅更新指向对象的“值”(不改变地址)
如果你不更换 unique_ptr
本身,只是修改它指向的 int 的数值(地址不变),就不会影响排序,可在常量迭代器上做“逻辑修改”前需要去除 const:
- 标准不允许通过
const_iterator
直接修改元素;但你可以用const_cast<int&>(*ptr)
或将迭代器转换为非常量迭代器(C++23 提供了const_iterator
到iterator
的mutable_iterator
转换;更通用办法是先通过查找得到非 const 迭代器)。
简化起见,建议:提取 node 后修改再插回,语义最清晰。
D. Delete(删除)
// 1) 迭代器删除
if (!s.empty()) {s.erase(s.begin());
}// 2) 按异质键删除(Timestamp + 地址)
Timestamp t{100};
const int* addr = /*...*/;
s.erase(std::pair<Timestamp, const int*>{t, addr});// 3) 按时间戳范围删除
s.erase(s.lower_bound(Timestamp{100}), s.lower_bound(Timestamp{130}));
5) 典型陷阱与建议
-
临时
unique_ptr
作为查找键:千万不要用find({ts, std::unique_ptr<int>(raw)})
查找,临时unique_ptr
析构时会delete raw
,导致双重释放。请使用透明比较器 + 原始指针地址的异质查找。 -
修改键值破坏有序性:在容器中直接改
Timestamp
或把unique_ptr
换成另一块地址,都会破坏树的排序假设。务必用extract
→修改→insert
。 -
语义核对:
unique_ptr
的比较是按地址而非按“指向内容”。如果你想让“同一Timestamp
+ 相同内容(例如*ptr
)才算相等,需要自定义比较器改成按*ptr
值比较(并处理空指针)。 -
标准版本:
- C++17 起:有
node_handle
、更明确的对仅移动键(如unique_ptr
)的支持。强烈建议使用 C++17+。 - 透明比较器用法在 C++14 就可行(
is_transparent
习惯用法),但与 node handle 结合最顺畅的是 C++17+。
- C++17 起:有
6) 小结(要点清单)
std::set
:自动排序、唯一性、红黑树、O(log N)。pair<Timestamp, unique_ptr<int>>
的默认字典序比较可用:先Timestamp
,再指针地址。- 由于
unique_ptr
是仅移动类型:用emplace/insert(std::move)
;查找应使用透明比较器 + 原始指针地址的异质查找,不要构造临时unique_ptr
。 - 更新键请走
extract
→修改→insert
;修改指向对象内容不改变地址,一般不破坏排序。 - 若你的业务语义不是“按地址”,请自定义比较器(例如比较
*ptr
的值,或仅比较Timestamp
)。 - 建议 C++17+(为
node_handle
与仅移动键的良好支持)。
完整最小示例(可直接参考)
#include <set>
#include <memory>
#include <utility>
#include <iostream>class Timestamp {int secondsFromEpoch_;
public:explicit Timestamp(int s = 0) : secondsFromEpoch_(s) {}int seconds() const noexcept { return secondsFromEpoch_; }friend bool operator<(const Timestamp& a, const Timestamp& b) noexcept {return a.secondsFromEpoch_ < b.secondsFromEpoch_;}
};using Key = std::pair<Timestamp, std::unique_ptr<int>>;struct PairCmp {using is_transparent = void;bool operator()(const Key& a, const Key& b) const noexcept {if (a.first < b.first) return true;if (b.first < a.first) return false;return std::less<const int*>{}(a.second.get(), b.second.get());}bool operator()(const Key& a, const std::pair<Timestamp, const int*>& b) const noexcept {if (a.first < b.first) return true;if (b.first < a.first) return false;return std::less<const int*>{}(a.second.get(), b.second);}bool operator()(const std::pair<Timestamp, const int*>& a, const Key& b) const noexcept {if (a.first < b.first) return true;if (b.first < a.first) return false;return std::less<const int*>{}(a.second, b.second.get());}bool operator()(const Key& a, const Timestamp& t) const noexcept { return a.first < t; }bool operator()(const Timestamp& t, const Key& b) const noexcept { return t < b.first; }
};using PairSet = std::set<Key, PairCmp>;int main() {PairSet s;// Createauto [it1, ok1] = s.emplace(Timestamp{100}, std::make_unique<int>(42));auto [it2, ok2] = s.emplace(Timestamp{100}, std::make_unique<int>(7));s.emplace(Timestamp{120}, std::make_unique<int>(99));// Read: find by (Timestamp, raw pointer)const int* addr = it1->second.get();auto it = s.find(std::pair<Timestamp, const int*>{Timestamp{100}, addr});if (it != s.end()) {std::cout << "Found ts=" << it->first.seconds() << " val=" << *it->second << "\n";}// Read: range by timestampstd::cout << "ts==100:\n";for (auto p = s.lower_bound(Timestamp{100}); p != s.upper_bound(Timestamp{100}); ++p) {std::cout << " " << p->first.seconds() << " -> " << *p->second << "\n";}// Update: extract -> modify -> insertif (it2 != s.end()) {auto nh = s.extract(it2); // 取出节点nh.value().first = Timestamp{105}; // 改键(时间戳)nh.value().second = std::make_unique<int>(555); // 换指针(地址变)s.insert(std::move(nh)); // 重新插入}// Delete: by heterogeneous keys.erase(std::pair<Timestamp, const int*>{Timestamp{100}, addr});// 遍历for (const auto& [ts, ptr] : s) {std::cout << ts.seconds() << " -> " << (ptr ? *ptr : -1) << "\n";}
}