当前位置：首页 > news >正文

《RANKGUESS: Password Guessing Using Adversarial Ranking》——论文解读

news 2025/9/3 12:46:31

本文提出基于对抗排序（Adversarial Ranking） 的口令猜测框架 RANKGUESS，首次将口令生成建模为马尔可夫决策过程（MDP），通过 “猜测器（Guesser）- 排序器（Ranker）” 的对抗交互，实现 “学习排序（Learning-to-Rank）” 与口令猜测的对齐。

一、研究背景

口令的不可替代性和面临的攻击威胁。当前口令猜测具有局限性：传统统计模型（PCFG，Markov）数据稀疏，过拟合等；深度学习模型（FLA，PassGan）需要超大训练集，训练时间长；经典机器学习模型（RFGuess）未结合“学习排序”，无法优先生成高概率口令。

核心挑战：

精确匹配要求；

奖励机制设置：口令猜测需 “按概率降序生成”，需将排序偏好转化为可优化的奖励信号，而非简单二分类（生成正确 / 错误）

额外信息利用：有效融合 PII（姓名 / 生日）或部分口令提升猜测针对性。

二、本文研究

本文提出的RANKGUESS 将口令猜测建模为马尔可夫决策过程（MDP），核心是 “猜测器（Guesser）- 排序器（Ranker）” 的对抗交互。核心是 “猜测器生成候选 - 排序器评分反馈 - 双方迭代优化” 。

三个步骤：模型准备，累计奖励积累，猜测过程。

2.1 猜词器

骨干网络：采用 GRU（门控循环单元），解决长序列梯度消失问题，输入为 token 嵌入向量，输出为下一个字符的概率分布

2.2 排序器

核心功能：学习 “真实口令 - 候选口令” 的排名偏好，输出候选口令的奖励分数

采用全连接网络，输入为口令特征向量，输出为排名分数，优化器为 Adam（学习率 0.0001）

2.3 阶段一：排序器（Rφ）训练 —— 学习口令排名偏好

目标是区分 “真实口令” 与 “猜测器生成的假口令”，输出能反映口令概率的排名分数，为猜测器提供奖励信号。

① 生成正负样本：

正样本（S⁺）：从训练集中随机采样与假样本等量的真实口令（如 10 万条）；
负样本（S⁻）：由猜测器 Gθ 生成假口令（通过当前策略 πθ 采样，确保与真实口令长度分布一致）。

② 构建混合样本：

按混合比例 λᵢ 生成混合样本 Sᵐᵢ = λᵢ×S⁺ + (1-λᵢ)×S⁻，共生成 72 组混合样本（覆盖不同 λ 取值，确保排序器学习连续排名偏好）。

③ 计算排名分布与优化：

对每组混合样本 Sᵐᵢ，排序器输出其排名分数（基于余弦相似度：cos(y_PW, y_E)，其中 y_PW 为候选口令特征，y_E 为专家口令（训练集 Top-1 万）特征）；

计算混合样本排名分布与 λᵢ 分布的 KL 散度，通过梯度下降最小化散度，更新排序器参数 φ

重复步骤 1-3，直至排序器对真实 / 假口令的区分准确率稳定（如验证集准确率 >95%）。

2.4 阶段二：猜测器（Gθ）训练 —— 最大化累积奖励

目标是学习 “生成高排名口令” 的策略，通过排序器提供的奖励信号，优化字符生成概率分布。

① 生成训练轨迹：

从初始状态（Bs×6 阶前缀）出发，根据当前策略 πθ(aₜ|sₜ) 采样字符，生成完整口令轨迹 τ = {s₀,a₀,s₁,a₁,…,s_T,a_T}，共生成 N=100 条轨迹，计算每条轨迹的奖励。

②计算中间奖励：

对每条轨迹的每个状态 sₜ（t 阶前缀），通过 MC 滚动（MC Rollouts）模拟后续字符生成，计算状态价值 Q̃(sₜ)

③策略梯度优化：以 “最大化累积奖励” 为目标，通过策略梯度更新猜测器参数 θ。

2.5 迭代对抗训练

猜测器生成假样本，欺骗排序器。排序器区分真假样本，引导猜测器生成更难区分的假样本。

交替进行 “排序器训练（阶段 1）” 与 “猜测器训练（阶段 2）”，共迭代 K=30 次；

每轮迭代后，验证猜测器生成口令的 “排名一致性”（即高概率口令是否被排序器评为高排名），若一致性 >90% 则停止训练。最终形成极小极大博弈，推动双方迭代优化，实现 “按概率降序生成口令” 的目标。

三、本文场景

（1）漫步猜测

核心任务：无额外信息，最大化破解数量。通过栈（存储前缀）和查找表（记录概率），匹配真实口令长度分布；

弹出栈顶前缀 sₜ，通过猜测器 Gθ 预测下一个字符的概率分布。保留概率 > 阈值 α的字符，若字符为 Es，则将前缀 sₜ 加入猜测集 P；否则，将新前缀 sₜ+c 压入栈 Q，更新查找表LUT 中该前缀的概率。栈 Q 为空时，输出猜测集 P（按概率降序排序）。

图为在跨站点猜测场景中，RANKGUESS与其他最先进方法的猜测性能对比。

10⁴次猜测后，RANKGUESS 成功率（46.63%）超 RFGuess（43.24%）、FLA（43.41%），10¹⁰次达 83.55%。

（2）定向猜测

定向猜测：PII 标签数字化（如 1000 = 完整姓名、2000 = 完整生日）+ 多表示数据增强

对训练好的猜测器，生成含 PII 标签的候选口令，将标签替换为目标用户的真实 PII，生成针对性猜测。对每个 PII 标签组合，生成对应猜测，按排序器评分降序去重；保留 Top-K 猜测，优先尝试高评分候选。

在跨站点目标场景中，我们的RANKGUESS与其他使用PII的目标方法的猜测性能比较。分数代表训练的比例。

（3）条件猜测（利用部分口令）

利用剪枝策略来进行优化。

输入部分口令（如 “d***l02*”），确定 wildcard 位置（记为 m 个），计算每个 wildcard 位置的候选字符数 ω = ⌈m×√n⌉。对每个 wildcard 位置，通过猜测器 Gθ 预测 Top-ω 字符，生成部分填充的前缀；重复填充直至所有 wildcard 被替换，生成完整口令候选。过滤不匹配部分口令模板的候选。按排序器评分降序输出猜测集。

四、总结

本文通过 “对抗排序 + RL” 的创新路线，突破传统口令猜测的三大痛点，构建的 RANKGUESS 框架在三大场景下均显著优于 SOTA 模型，衍生的 PSM 工具可直接落地。其核心贡献在于：将口令猜测从 “生成任务” 升级为 “排序优化任务”，为后续结合大模型用户画像、扩展经典机器学习算法提供了通用范式，对口令安全研究与实践具有重要指导意义。

查看全文

http://www.dtcms.com/a/357962.html