当前位置: 首页 > news >正文

推荐系统召回粗排的优化思路

召回

召回作为推荐庞大候选底池中捞取候选的入口,一个完整的推荐系统都是由多路召回组成,甚至一些大场景的召回路数几十上百路,每一路召回最终曝光的独占比非常低。从召回迭代初期来看,一般新增合理的召回通路都能带来新线上指标的提升。但随着召回通路不断增加,一是线上召回的机器资源压力激增,二是受边际递减的规律,新增召回的收益会越来越小,最终导致新增召回的 ROI(投入产出比)非常低。
因此,召回的迭代路线主要包括新增合理的召回通路,在已有的召回通路上优化迭代,在多路召回每路的权重。

  • 新增合理的召回通路
    在这里插入图片描述

  • 召回通路上优化迭代:一般来说倒排类的召回一般构建好后就不再需要长期迭代,相当于“一锤子买卖”,上线就把这一路的收益拿完了;召回的优化迭代主要在向量化召回上,向量化召回可以像排序模型一样长期迭代,也是一个轻量级的深度神经网络模型。向量化召回的迭代出要可以从样本,特征和结构三个大方向优化;

    • 样本:增加更多场域的样本,跨域样本的利用,负样本的选取,样本采样与LogQ纠偏等
    • 特征:属性特征,序列特征,Dense特征(多模态等)
    • 结构:双塔结构,序列建模等
  • 多路召回的权重设计:每路召回一般根据整个召回的Quota配额按照一定的比例权重分配,通过Snake Merge算法将多路召回的候选结果合并送往推荐的下一环节。权重参数一般可以通过手动搜参、设计自适应权重算法进行动态调整等。

粗排

粗排受限于打分数量的限制,需要比较高的性能要求,所以粗排模型的结构相对来说比较简单,是一种介于向量召回和精排之间的一种结构。一般粗排也是双塔结构,在底层的特征处理过程都是User侧和Item侧分离的过程,因为一次请求下粗排会计算上千个Item

http://www.dtcms.com/a/317125.html

相关文章:

  • 数据大集网:以数据为纽带,重构企业贷获客生态的助贷平台实践
  • 【WAIC 2025】AI安全的攻防前线:合合信息AI鉴伪检测技术
  • 基于Vue+Node.js(Express)实现(Web)物联网的蔬菜大棚温湿度监控系统
  • Google地图的“网络定位”功能
  • 中国移动h10g-01_S905L处理器安卓7.1当贝纯净版线刷机包带root权限_融合终端网关
  • Spring Boot 参数校验全指南
  • 学习日志29 python
  • 猫头虎AI分享:Claude Opus 新版 4.1 在 SWE-bench Verified 上准确率达到了 74.5%,在多文件代码重构方面表现突出
  • 力扣经典算法篇-44-组合总和(回溯问题)
  • Qt菜单栏与工具栏实战
  • Linux86 sheel流程控制前瞻4 判断vsftpd服务启动,如果启动,打印端口号,进程id
  • 基于FFmpeg和HLS的大文件分片传输方案
  • SRS简介及简单demo
  • 豆包新模型与PromptPilot工具深度测评:AI应用开发的全流程突破
  • 神经网络搭建对CIFAR10数据集分类
  • 生成式AI如何颠覆我们的工作和生活
  • 深度学习(pytorch版)前言:环境安装和书籍框架介绍
  • 【Canvas与三角形】黑底回环金片三角形
  • 如何解决网页视频课程进度条禁止拖动?
  • DHCP 服务器与DNS服务器
  • QML开发:QML中的基本元素
  • JAVA高级编程第六章
  • 深入解析Java NIO在高并发场景下的性能优化实践指南
  • Kubernetes服务发现、名称解析和工作负载
  • 如何根据枚举值,快速方便显示对应枚举含义 js
  • 大疆无人机连接Jetson主板
  • hive专题面试总结2
  • 疯狂星期四文案网第31天运营日记
  • GitHub Spark公共预览版上线
  • Sourcetree GIT 可视化工具安装全攻略