当前位置: 首页 > news >正文

【第五章:计算机视觉-项目实战之推荐/广告系统】2.粗排算法-(1)粗排用来干什么?“我大体筛一下“

第五章:计算机视觉-项目实战之推荐/广告系统

第二部分:粗排算法

第一节:粗排用来干什么?"我大体筛一下"

在推荐系统中,召回阶段已经从海量候选池(百万/千万级)中,粗略筛选出了数百到几千个候选内容(例如 Top 2000 的候选商品、视频、内容)。然而,这个数量显然无法直接拿去精排或最终展示给用户,因此系统需要一个 “承上启下的阶段” 来进行进一步筛选,这个关键角色,就是——粗排(粗排序,Coarse Rank)

一句话概括粗排:

粗排的目标是:在“准确率”和“系统实时性能”之间保持平衡,从数千候选中过滤到数百个候选(通常是 Top 200 ~ Top 500),为后续精排争取空间。


粗排处在什么位置?

推荐系统简化流程如下:

(数百万级候选池)↓ 召回(Recall)
(Top 5000 / Top 2000)↓ 粗排(Coarse Rank)
(Top 300 / Top 500)↓ 精排(Fine Rank / Ranking)
(Top 50 / Top 100)↓  重排(Rerank)
(Top 10 / Top 20 展现给用户)

粗排阶段最关键的词只有两个:

目标关键词解释
模型必须足够轻,毫秒级推理
效果不能太差,否则精排救不回来

粗排不追求特别高的预测精度,但追求性价比最大化


粗排为什么是“必要存在”?

如果没有粗排会发生什么?
直接把几千候选交给精排精排模型太大,耗时严重,卡死 QPS
直接从召回跳到重排分数不准,推荐变得粗糙,体验差
全用 DNN 精排模型性能瓶颈,延迟不可接受

所以在工业推荐系统中,粗排属于不可省略的阶段,它是整个推荐流水线的“分水岭”:

召回:保证有东西
粗排:保证不差太多
精排:负责“尽最大可能做得好”
重排:保证多样、组合策略、展示体验


粗排模型一般长什么样?

粗排常用:

粗排模型特点是否可线上落地
LR(逻辑回归)极快、鲁棒、特征可控工业常用
GBDT / XGBoost表达能力更强常用
DIN / 简化版 DNN引入兴趣注意力(淘宝 & 信息流常见)
双塔模型裁剪版本与召回 embedding 对齐

特点总结:

粗排模型 = 轻量特征 + 小模型结构 + 高吞吐推理

它与召回最大的区别是:

对比项召回粗排
主要目的找可能性粗筛可信度
算法类型向量检索 / GraphLR/GBDT/小DNN
计算特点召回更粗、更快精度更高但仍需快速

粗排关注的指标

粗排最看重:

指标解释
AUC衡量正负样本排序质量
Recall@K / HitRateTop-K 能否命中真实正样本
Latency(延迟)线上必须毫秒级
QPS(吞吐量)能抗大流量

召回偏 覆盖率
粗排偏 排序 + 性能
精排偏 精准度与收益


粗排阶段常用特征

粗排不使用超复杂特征,只使用轻特征集合,例如:

特征类型示例
用户侧 User Feature性别、年龄、兴趣主题
物品侧 Item Feature类目、时长、热度、CTR
行为特征点击次数、曝光次数、最近点击时间
User-Item 交叉特征用户是否看过同类 item

特征原则:

够用即可,越轻越好


粗排一句核心总结

粗排的使命:在性能可控的前提下,把 Top2000 缩到 Top300,并尽量保证后续精排还能救。

它既是召回后的质量过滤器,也是精排前的减负器

http://www.dtcms.com/a/515209.html

相关文章:

  • FDAbench-Full 数据代理任务基准:Python 使用路径
  • HarmonyOS之启动应用内的UIAbility组件
  • 【开题答辩全过程】以抖音热点与可视化分析为例,包含答辩的问题和答案
  • SONiC控制面 + VPP数据面:AsterNOS-VPP的高性能开放之路
  • 未来之窗昭和仙君(二十八)商业收银开发音频播放——东方仙盟筑基期
  • 自助网站系统上海网站建设公司网站建设
  • 杭州网站设计推荐柚米莆田做外贸网站
  • Rust 枚举类详解
  • UU远程——让工作、学习、娱乐跨设备无缝衔接,“远程”更像“身边”
  • 关于模型结构与参数的文件类型及运行设备
  • 一种基于STL-LSTM混合模型的低轨卫星钟差短期预报方法
  • 【Docker】[特殊字符] Docker 部署完全指南 - 从本地开发到云服务器
  • 宝塔面板部署Django:使用Unix Socket套接字通信的完整教程(附核心配置与问题排查)
  • 广西建设局建设行政主管部网站资源网站优化排名软件公司
  • 基于Vue的2025年哈尔滨亚冬会志愿者管理系统5zqg6m36(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
  • 软件可用性测试历史概念✅软件可用性测试的国际标准✅软件可用性测试方法
  • 深入 JavaScript 对象与代理模式的本质、应用与区别!
  • 响水网站制作公司平顺网站建设
  • 顺昌网站建设临沂网站制作公司
  • Llama-2-7b 昇腾 NPU 测评总结:核心性能数据、场景适配建议与硬件选型参考
  • 奥威BI:AI数据分析赋能企业智能决策
  • Python机器学习与数据分析教程之pandas
  • 【性能】android 启动丢帧分析全攻略
  • 个人网站免费域名注册海报设计网站官网
  • Linux定制篇-Nacos的安装和配置
  • 【矩阵分析与应用】记录
  • 大模型-7种大模型微调方法 下
  • 企业级Nexus实践:守护软件供应链安全
  • 通过自定义时间服务器向指定的客户端主机同步时间
  • 好一点的网站建设网站建设的难点在哪里