当前位置: 首页 > news >正文

论文阅读:arxiv 2024 Large Language Model Enhanced Recommender Systems: A Survey

https://arxiv.org/pdf/2412.13432
在这里插入图片描述

速览

大语言模型赋能推荐系统:综述与展望

该论文题为《Large Language Model Enhanced Recommender Systems: Taxonomy, Trend, Application and Future》,由来自西安交通大学、香港城市大学等多所高校的研究人员共同撰写,对大语言模型(LLM)增强推荐系统(LLMERS)的研究进展进行了全面综述。

随着LLM在自然语言理解与推理方面的强大能力逐渐显现,其在推荐系统领域的应用也备受关注。传统推荐系统主要依赖用户与物品之间的交互数据,而LLM能够为推荐系统补充丰富的语义信息,从而提升推荐效果。然而,早期将LLM直接应用于推荐的尝试面临着推理成本高昂的问题,难以满足实际应用中对低延迟的要求。因此,近年来研究者们开始探索将LLM融入推荐系统的在线系统,避免在推理阶段使用LLM,这一方向被称为LLM增强推荐系统(LLMERS)。

论文首先对LLMERS进行了分类,将其分为知识增强、交互增强和模型增强三大类。知识增强类方法利用LLM的推理能力和世界知识,为用户或物品生成文本描述作为额外特征,以补充传统推荐系统在知识理解方面的不足。例如,通过提示LLM输出用户偏好或物品属性的文本总结,这些总结文本经过编码后可增强推荐模型。交互增强类方法则针对传统推荐系统中数据稀疏性的问题,借助LLM生成新的用户与物品之间的交互数据,用于训练传统推荐模型。模型增强类方法直接将LLM的语义信息注入到传统推荐模型中,通过模型初始化、模型蒸馏、嵌入利用和嵌入引导等方式,提升推荐模型的性能。

论文还对LLMERS的发展趋势进行了分析。从语义角度来看,研究方向正从显式语义向隐式语义转变。显式语义是指通过LLM生成的自然语言文本,虽然可读性强,但在编码过程中可能会丢失信息;而隐式语义则是直接利用LLM的隐藏状态等非文本形式的语义信息,能够更好地保留LLM的语义知识。此外,开源LLM的使用越来越普遍,因为它们不仅可以节省调用API的成本,还可以通过微调来适应推荐任务。微调后的开源LLM能够更好地与推荐任务对齐,从而提高推荐效果。

在应用方面,LLMERS主要集中在那些具有丰富文本信息或特征的应用场景中。例如,在电子商务领域,用户和商品的特征信息可以被LLM理解并提取语义,从而增强推荐效果;在新闻推荐领域,LLM可以对大量新闻文本进行总结,为推荐系统提供语义支持。论文还总结了当前LLMERS研究中使用到的LLM类型,以及相关的应用领域和数据集资源,为后续研究提供了宝贵的参考。

最后,论文提出了未来LLMERS研究的几个方向。一是探索更多推荐任务的应用,如多模态推荐系统,LLM可以用于处理不同模态数据的语义提取和融合。二是加强用户侧的增强研究,目前大多数LLMERS工作集中在物品侧,用户侧的研究相对较少,但用户侧的增强对于提升推荐系统的个性化和准确性具有重要意义。三是提高推荐系统的可解释性,LLM的语义理解能力可以为推荐结果提供更合理的解释。四是建立LLMERS的基准测试,目前该领域尚缺乏统一的基准,建立基准测试有助于推动LLMERS研究的进一步发展。


文章转载自:

http://HWqT1mAd.wprxm.cn
http://XwjRmijl.wprxm.cn
http://Wc6pKjL1.wprxm.cn
http://BD2bR5ri.wprxm.cn
http://bNPxuhxx.wprxm.cn
http://c8iuHhXa.wprxm.cn
http://QgQEosKd.wprxm.cn
http://wmbu15m4.wprxm.cn
http://j9ZvlOuu.wprxm.cn
http://G8T50YFV.wprxm.cn
http://yiAAlfSh.wprxm.cn
http://XRQqYUbK.wprxm.cn
http://P6OIxaJl.wprxm.cn
http://INcYgJJe.wprxm.cn
http://m3gfUFN6.wprxm.cn
http://KfGwbpfG.wprxm.cn
http://OEgjwYBD.wprxm.cn
http://HeVJ6uh7.wprxm.cn
http://qXYNvHyw.wprxm.cn
http://fN0zQyqe.wprxm.cn
http://3tLuIAC9.wprxm.cn
http://bbF0YxP2.wprxm.cn
http://ECCpbNIf.wprxm.cn
http://Ca5OUJWG.wprxm.cn
http://dly4k1TN.wprxm.cn
http://WwJfg1t4.wprxm.cn
http://w5Oi8mTK.wprxm.cn
http://kI1gshrl.wprxm.cn
http://XVurTK5u.wprxm.cn
http://dOhCCplP.wprxm.cn
http://www.dtcms.com/a/376688.html

相关文章:

  • 微店平台商品详情接口技术实现:从接口解析到数据结构化全方案
  • (12)使用 Vicon 室内定位系统(一)
  • 疯狂星期四文案网第65天运营日记
  • 【从零开始】12. 一切回归原点
  • JavaSE之深入浅出 IO 流:字节流、字符流与序列化流详解(含完整代码示例)
  • 【大模型推理】Qwen2.5模型硬件要求与4090Ti多并发推理方案
  • Node 中进程与子进程的区别及使用场景
  • 【C++进阶系列】:万字详解红黑树(附模拟实现的源码)
  • 以供应链思维为钥,启数字化转型之门——读《供应链思维》有感
  • 体验访答浏览器
  • Zynq开发实践(FPGA之spi实现)
  • 2025年度总结
  • Redis 哨兵模式详解:实现高可用的自动故障转移方案
  • 电动汽车充电系统(EVCS)的入侵检测
  • 自定义事件发布器
  • 零基础学AI大模型之从0到1调用大模型API
  • vue3:调用接口的时候怎么只传递一个数组进去,得到一个key-value数据
  • Transformer 训不动:注意力 Mask 用反 / 广播错位
  • Prometheus部署监控实战
  • vue3引入海康监控视频组件并实现非分屏需求一个页面同时预览多个监控视频(2)
  • AGV 智能车驱动仓储效率提升:应用场景,智慧物流自动化实践指南
  • 【全栈实战】Elasticsearch 8.15.2 高可用集群部署与AI搜索全特性指南
  • Django REST Framework 构建安卓应用后端API:从开发到部署的完整实战指南
  • neo4j数据库创建范例(SQL文)
  • [rStar] docs | 求解协调器
  • WPF迁移avalonia之触发器
  • 【WPF+Prism】日常开发问题总结
  • 差异基因分析实战:手把手教你用R语言找到关键基因
  • 金融数据库--3Baostock
  • 【ICLR 2023】可逆列网络(RevCol)