当前位置: 首页 > news >正文

生成式召回-TIGER范式

TIGER(Transformer Index for GEnerative Recommenders)是生成式召回的经典力作,其核心思想就是语义ID+Seq2Seq,这一范式启发了后续大量生成式推荐工作。

📌 背景与痛点

item id是商品在候选库中的独特标识,其具有高度稀疏性,且没有任何物理含义,对于模型训练、新品冷启、可解释性都极不友好。假设一个item的side info足够多,可以完整刻画该item的属性,那么item id完全是可以舍弃的。

TIGER利用多个语义id来表征该item,极大地减少了id embedding词表空间,对工业界生产环境友好;通过模型结构共享相似item的语义信息,提升模型泛化性,利好新品冷启。

✅ TIGER 解决的痛点和优势

痛点TIGER 的解决方法优势
embedding 太大 / 存储高Semantic ID token 数量极小,token vocabulary 可控制内存友好、减小表规模
冷启动 item embedding 缺失Semantic ID 来源于 item 内容特征可推广至新 item,无需训练 embedding
类似 item 无共享相似内容生成相近的 Semantic ID用户语义共享,加强泛化
模型检索复杂Transformer decoder 直接生成端到端简洁流程

🧠 核心创新点

Semantic ID表示

语义id

  • 使用内容编码(如 SentenceT5)生成 item embedding
  • 将embedding经RQ-VAE量化为一系列codeword Tuple,即 Semantic ID
  • 各token具有语义信息,编码符号总量远小于item总量

生成式检索(Generative Retrieval)

seq2seq

通过自回归解码生成目标item id,而不是传统embedding + ANN。Transformer的decoder直接输出item的Semantic ID作为推荐结果。

实验结果

exp
别看实验结果相对值提升很大,很唬人,其实绝对值提升很小。但TIGER范式建模确是一个极大的创新,为生成式推荐打开了思路。

🧾 总结

  • TIGER是第一篇将 Generative Retrieval 自回归生成方式 应用于推荐系统的工作;
  • 它通过Semantic ID 和 Seq2Seq Transformer,突破embedding + ANN的传统限制;
  • 冷启动、多样性、效率和泛化能力上展现强优势;
  • 适用于大规模推荐场景,尤其是content-rich、item海量、频繁上线新品的平台。

参考

  • Recommender Systems with Generative Retrieval
  • 【谷歌2023】TIGER:基于生成式召回的推荐系统
  • NIPS‘23「谷歌」语义ID|TIGER:Recommender Systems with Generative Retrieval
http://www.dtcms.com/a/300680.html

相关文章:

  • 【硬件-笔试面试题】硬件/电子工程师,笔试面试题-39,(知识点:单相桥式整流电路,输出电压计算,电流计算,二极管最大反向电压)
  • C语言笔记02
  • 【Oracle】套接字异常(SocketException)背后隐藏的Oracle问题:ORA-03137深度排查与解决之道
  • 【代码问题】【包安装】MMCV
  • SCUDATA esProc SPL Enterprise Edition(大数据计算引擎) v20250605 中文免费版
  • 【前后端】node mock.js+json-server
  • 第四科学范式(数据密集型科学):科学发现的新范式
  • hackthebox-Pwn-You know 0xDiablos(ret2text)
  • 详解删除链表的倒数第k个结点:双指针法优化与边界处理
  • SpringAI入门及浅实践,实战 Spring‎ AI 调用大模型、提示词工程、对话记忆、Adv‎isor 的使用
  • [spring6: Mvc-异步请求]-源码分析
  • 《 接口日志与异常处理统一设计:AOP与全局异常捕获》
  • 数据结构 堆(4)---TOP-K问题
  • 详解力扣高频SQL50题之1164. 指定日期的产品价格【中等】
  • 【element-ui】HTML引入本地文件出现font找不到/fonts/element-icons.woff
  • Reason-before-Retrieve(CVPR 2025)
  • 网易大模型算法岗面经80道
  • Vim 编辑器工作模式及操作指南
  • ksql连接数据库免输入密码交互
  • Spring Boot + @RefreshScope:动态刷新配置的终极指南
  • C#中Visual Studio平台按照OfficeOpenXml步骤
  • Pinocchio 结合 CasADi 进行 IK 逆运动学及 Mujoco 仿真
  • 【嵌入式硬件实例】-555定时器调光电路实现
  • Java大数据面试实战:Hadoop生态与分布式计算
  • 数据赋能(340)——技术平台——共享平台
  • 不坑盒子:Word里1秒制作“花括号”题目,多音字组词、形近字组词……
  • 零基础学习性能测试第五章:求最佳线程数
  • MySQL 8.0.42创建MGR集群
  • 元宇宙中的“虫洞“:技术实现、应用场景与未来挑战
  • Dify v1.6.0:支持MCP了,为更顺畅的交互打开了大门