当前位置: 首页 > news >正文

多行为推荐综述

一共两篇综述,23年的多行为序列推荐(MBSR)和25年3月的多行为推荐(MBR)。

MBR利用多种用户行为,采用多任务学习来静态预测某一目标行为的偏好或发生概率,MBSR考虑了行为发生的时间顺序,预测用户下一步要发生目标行为的项目。

1.MBSR

第一篇是23年的综述,发表在TKDE。这篇综述从三个技术角度(基于邻域,矩阵分解以及深度学习)来分类与分析多行为序列推荐方法,并进一步从数据建模视角和建模结构视角进行细化。

1.1 MBR和SBSR存在的问题

用户行为的异质性,用户意愿的不确定性使得MBSR中用户偏好的预测更具挑战性。 因此,如何在不丢失信息的情况下很好地对序列推荐中的异构行为进行建模是。

用户行为之间的关系建模, 在MBSR问题中,用户的多种行为往往是相互关联的。 例如,在电子商务平台中,用户倾向于在购买商品之前检查商品,并查看商品的评论。与MBR不考虑行为的顺序关系不同,MBSR考虑了各种行为的顺序性。 

基于用户异质性行为的长期和短期偏好联合建模,传统推荐算法大多静态建模用户与商品之间的交互信息揭示了用户长期稳定的偏好。 然而,它忽略了用户与项目交互的序列行为的动态变化。 用户偏好的动态表示用户当前的短期偏好,可以通过用户动态变化的行为序列信息来揭示。

相关问题,如噪音和偏差。

1.2 分类

MBSR问题的相关方法在技术层面上可以分为三类,分别是基于邻域的方法、基于矩阵分解的方法和基于深度学习的方法,下面说一下基于深度学习。

1.3 基于深度学习的方法

论文介绍了基本范式和在MBSR应用的方法并介绍了一些模型,这里就只放基于RNN架构工作中使用的数据和建模视角和特征。

GNN,也是MBR最常用的方法

 Transformer

通用方法的学习架构:使用一个通用的框架,可以利用任何先前的相关作品来获取信息。 可以在最先进的模型上使用特定设计的模块,并结合一些创新的建模模块来提高模型的性能。

混合方法:将多种技术结合起来进行建模,可以利用不同技术的优势,不同技术之间也可以相互补充,从而提高建模能力。 例如Transformer + GNN

 1.4 未来方向

数据:数据稀疏性,数据不平衡,周期性和噪声。 周期性是指用户在特定时间交互项目的倾向,噪声是指用户检查与他们当前偏好不一致的项目。 

技术:单一类型的技术有其自身的局限性。 其次,由于数据的复杂性,效率是MBSR的关键问题。 如何在不牺牲效率的前提下提高推荐性能,从而实现实时推荐。 第三,当行为类型增加时,如何保持可接受的时间和空间复杂性也是一个具有挑战性的问题。 ​ 因此,提高MBSR模型的泛化程度仍然是一个挑战。 此外,利用来自不同领域的数据,或带有辅助信息(如项目类别信息、评论和知识图)的数据来调查MBSR问题也存在困难。 

llm:在多行为顺序推荐任务中,除了对序列关系进行建模外,还需要对项目的不同行为信息进行建模。 如何使用一个大模型来实现不同的行为信号与用户和项目的文本概况的协同合并是一个相对较新的方向。 在不同的行为下,项目可能有不同的关系。 如果浏览了某种类型的产品,你可能会从不同的品牌购买相同类型的产品。 但购买这类商品可能不会再从其他品牌购买。 因此,有必要将多行为信息集成到大型模型和推荐任务的建模中,而不是简单的序列建模中。

Trustworthy:当推荐系统不断追求更高的准确性,并公平和公正地向用户推荐物品时,就需要建立更值得信赖和负责任的推荐系统。 可解释性和安全性是推荐系统可信度的两个主要方面,这也需要在MBSR中进一步关注。现在也包括公平性,debias,去混淆因素等。


2 MBR

将多行为推荐系统的研究分为三个主要阶段:

数据建模,使用特定的数据结构(如图或序列)来表示多行为交互,以捕获多行为的独特特征或它们的协同作用。

表示编码,将建模的多行为转换为向量表示(即嵌入),以有效捕获有意义的行为模式。

训练优化,优化多行为推荐系统的参数,以增强其有效学习和利用多行为信息的能力。

​2.1数据建模

从广义上讲,有三类:(a)特定于视图的图,它用不同的图来模拟每种行为; (b)视图统一图,用一个统一图对各种行为进行建模; (c)视图统一序列,用单个序列对每个用户的所有行为进行建模。

​2.1.1行为特定图

将每种类型的用户交互表示为单独的图,该方法独立地为每种行为建立关系模型,旨在保持每种交互类型的独特特征。 单击、添加到购物车操作和购买可以表示为三个不同的图,每个图对应一个特定的行为类型。 特定于视图的图可以进一步分类,这取决于是否考虑了不同行为之间的顺序。分为无顺序的并行图和有顺序的级联行为图

​2.1.2行为统一图

将不同的用户行为整合到一个图中,捕捉它们的交互和协同作用。 根据如何处理图中不同的边类型,这种方法可以进一步分为两个子方法。不考虑边类型的统一图方法(将所有用户行为聚集到一个单一的同质图中,将它们视为用户和项目之间相同类型的关系)以及感知边型统一图(法通过利用异构图表示来保留每条边的类型)。

​2.1.3行为统一序列

显式地合并了用户交互的顺序特性,捕捉用户行为随时间的动态变化。通过使用一个包含所有行为类型的统一序列,同时考虑了它们发生的顺序和特定类型的交互(即行为)。

​2.1.4其他方法

超图,有向无环图以及知识图谱。

2.2表征编码

建模后的多行为输入转化为向量表示,分为并行编码和序列编码以及其他方法。

​2.2.1并行编码

保留每个行为的独特特征,同时支持跨行为的协作学习(隐式或显式)。 假定行为之间没有特定的顺序,可以通过单独的特定于视图的图独立地处理它们,也可以通过将它们集成到区分交互类型的统一图中来集体处理它们。 现有的并行编码框架可以进一步分为

(a)对非有序特定视图图的编码,每个特定行为的图独立执行编码,确保每个行为的独特特征不受其他行为的干扰 

(b)对边缘类型感知的统一图的编码,多个行为的交互被整合到一个统一的图中,同时区分每个交互来自哪个行为。

​2.2.2序列编码

序列编码旨在捕获多行为交互中的时间依赖性。 它要么假设行为交互中的固有序列,要么利用明确的时间信息来更好地理解这些动态。 这一类现有的方法可以进一步分为

(a)有序特定视图图的编码:假定一个特定的行为顺序(例如,点击→购物车→购买)。 每个行为都被建模为一个单独的图,并显式地捕获时间依赖性来反映这个序列

(b)无边缘类型统一图的编码:利用一个不考虑边缘类型的统一图来生成初始嵌入,这些嵌入随后被用作编码特定行为信息的输入

(c)视图统一序列的编码:采用各种序列模型来捕获多个行为之间的时间依赖关系

​2.2.3其他方法

其他方法开发了独特的消息传递框架和专门的编码框架来捕捉多行为交互的复杂性。 EHCF使用一种传递机制,通过嵌入空间中的转换,将先前行为(例如,视图)的预测投射到后续行为(例如,购买),捕获行为类型之间的相互依赖关系。 HMGCR]利用gnn对表示用户行为模式的超元图进行编码,并捕获语义关系和拓扑结构。 KHGT采用分层图转换器架构,该架构利用基于图的消息传递与自关注机制相结合,并通过时间感知嵌入集成时间动态。 DA-GCN引入了一种基于有向无循环图的消息传递框架,该框架跨特定于用户和特定于项目的行为图传播消息,并基于跨行为依赖关系改进嵌入。

2.3训练

在多行为推荐系统中,设计有效的训练目标是保证推荐相关性的关键。训练目标分为(a)主要目标,直接旨在优化推荐性能;(b)辅助目标,通过利用额外的信息间接提高性能。

​2.3.1主训练目标

多行为推荐系统的主要目标是准确预测目标行为,这是推荐任务的首要目标。 要做到这一点,需要设计一个有效的损失函数,引导模型区分正样本和负样本,确保正样本的分数高于负样本的分数。负采样策略分类:多行为感知采样;统一采样;Non-Sampling(将用户未与之交互的所有项目视为负样本)

多行为感知抽样利用辅助行为信息选择信息量更大的负样本,增强了模型区分用户各种偏好和捕捉复杂用户偏好的能力。 统一抽样提供了简单和效率,但可能包括信息较少的阴性或假阴性。 非基于采样的损失函数消除了负采样过程,它们在数据稀疏和异构交互的情况下特别有用。

​2.3.2辅助训练目标

利用来自辅助行为的额外信息来增强表示学习并提高模型的鲁棒性。辅助目标可以分为三类:

(a)辅助排名预测,目标行为和辅助行为的联合学习,该模型捕获嵌入在用户交互中的附加信号,使其能够学习共享模式和潜在相关性。

(b)对比学习,有效地捕捉有意义的相似性和差异性来增强表征学习

(c)生成式学习,通过训练推荐系统预测被屏蔽的项目或行为,增强了推荐系统捕捉用户-项目交互的能力

2.4未来方向

数据稀疏性与不平衡:某些类型的行为是丰富的,而其他类型的行为仍然稀少

模型可扩展性:现实世界的用户行为经常大规模地发生,因此多行为推荐系统必须具有可伸缩性才能有效地处理这些行为

时间动态建模:用户偏好随着时间的推移而变化,因此捕捉这些动态以提供相关建议至关重要。

模型可解释性:基于深度学习的推荐系统,尤其是那些利用复杂架构的推荐系统,经常充当黑盒的角色。 提高可解释性以解释不同行为如何影响推荐是促进用户信任和透明度的重要研究方向。

隐私保护与伦理: 详细的用户行为数据引发了对隐私的担忧,使安全和道德合规变得至关重要。

相关文章:

  • 混境之地1
  • 批量删除 PDF 中的所有图片、所有二维码图片以及指定的某张图片
  • CCF CSP 第33次(2024.03)(2_相似度计算_C++)(字符串中字母大小写转换+哈希集合)
  • Mysql的单表查询和多表查询
  • Cookie、sessionStorage、localStorage
  • vue3(笔记)5.0--pinia工具的知识扩展
  • 系统工程-信息系统的分类
  • How to use pgbench to test performance for PostgreSQL?
  • 【C++】String类的模拟实现
  • [Qt5] QMetaObject::invokeMethod使用
  • Netty源码—7.ByteBuf原理三
  • 蓝桥云客-染色时间
  • 1424.对角线遍历
  • 322 零钱兑换
  • 【大模型基础_毛玉仁】4.4 低秩适配方法
  • RocketMQ 4.x、5.x 性能对比
  • 绩效考核如何从形式化任务升级为公司战略工具?
  • 2025.3.25
  • 基于CondLaneNet论文和全卷积分割头的车道线head设计
  • QML输入控件: Dial基本用法与样式定制(1)
  • 习近平会见委内瑞拉总统马杜罗
  • 长期对组织隐瞒真实年龄,广元市城发集团原董事韩治成被双开
  • 人民财评:网售“婴儿高跟鞋”?不能让畸形审美侵蚀孩子身心
  • 数理+AI+工程,上海交大将开首届“笛卡尔班”招生约20名
  • 上海杨浦:优秀“博主”购房最高可获200万补贴
  • “上海之帆”巡展在日本大阪开幕,松江区组织企业集体出展