当前位置: 首页 > news >正文

【王树森推荐系统】行为序列01:用户历史行为序列建模

概述

  • 我们把用户行为序列叫做 last-n,意思是用户最近交互过的 n 个物品
  • 用户的行为序列可以反映用户对什么样的物品感兴趣,召回的双塔模型,粗排的三塔模型还有精排模型都可以用 last-n 特征
  • last-n 特征很有效,把它用到召回和排序模型中,所有指标都会大涨

多目标排序模型回顾

  • 这是之前介绍的多目标排序模型,模型的任务是预估点击率,点赞率,收藏率和转发率等指标,然后根据这些指标对物品做排序,选出用户最感兴趣的物品
    在这里插入图片描述
  • 后面我们重点关注用户特征的 last-n 序列

在这里插入图片描述

LastN特征

  • 用户的 last-n 记录是最近交互过(点击,点赞)的 n 个物品的 ID
  • 做 embedding 把 n 个物品映射成向量
  • 最后对向量取平均得到一个向量,这个向量可以作为用户的一个特征,表示用户曾经对什么样的物品感兴趣
  • 适用于召回双塔模型,粗排三塔模型,精排模型
    在这里插入图片描述

小红书的实践

  • 小红书的召回,粗排,精排都用到了 last-n 行为序列,用法如下:
  • 对最近点击的 N 个物品,对它们的ID做 embedding,求平均得到一个向量,它可以反映出兴趣
  • 取平均是早期的做法,现在也很常用。效果更好的方法是 attention,但是计算量更大
    在这里插入图片描述
  • 用户类似的行为还有点赞,收藏,转发等,同样记录这些行为的 last-n 物品ID
  • 对这些ID做 embedding,然后对同一种行为的向量取平均
  • 用这种方法把点击,点赞,收藏等行为表征为多个向量,把这些向量拼起来作为一种用户特征,用于召回或排序模型

在这里插入图片描述

  • 我们实际用的时候,不止是用物品ID,还用物品的其他特征,比如物品类目,把ID embedding和其他特征的 embedding 拼在一起,这样比只用ID embedding 效果更好
    在这里插入图片描述
http://www.dtcms.com/a/276540.html

相关文章:

  • Java责任链模式实现方式与测试方法
  • Python爬虫实战:研究xlwt 和 xlrd 库相关技术
  • 【理念●体系】迁移复现篇:打造可复制、可复原的 AI 项目开发环境k
  • 笔试题库 | 亿纬锂能社招大易笔试测评题库考点分析及真题整理
  • 张量拼接操作
  • 【IT-Infra】从ITIL到CMDB,配置管理,资产管理,物理机与设备管理(含Infra系列说明)
  • QML与C++相互调用函数并获得返回值
  • 2025 年 4-6 月大模型备案情况分析
  • [ABC267F] Exactly K Steps
  • 部署项目频繁掉线-----Java 进程在云服务器内存不足被 OOM Killer 频繁杀死-----如何解决?
  • python正则表达式re(Regular Expression)
  • 【代码随想录】刷题笔记——哈希表篇
  • 【人工智能】AI Agent 工作流及产品介绍
  • 傅里叶方法求解正方形区域拉普拉斯方程
  • 2025 年第十五届 APMCM 亚太地区大学生数学建模竞赛-B 题 疾病的预测与大数据分析 成品
  • 阻有形,容无声——STA 签核之RC Corner
  • docker—— harbor私有仓库部署管理
  • 在LC480T上部署xapp1052
  • OSPF五类LSA之FA实验案例解析
  • promise 如何实现红绿黄灯亮
  • BGP 路由优选属性(7)【MED】官方考试综合实验题【bgp】【acl】【ip-prefix】【route-policy】【icmp 环路】精讲
  • 基于同花顺API的熊市与牛市识别模型开发及因子分析
  • CCS-MSPM0G3507-2-基础篇-定时器中断
  • Linux如何设置自启动程序?
  • 复现永恒之蓝
  • LINUX文件系统权限,命令解释器alias,文件查看和查找
  • frp内网穿透教程及相关配置
  • LaTeX | 在电脑上输入专业数学符号
  • Cursor创建Spring Boot项目
  • CUDA Graph与torch.compile推理计算图捕获详解