当前位置: 首页 > news >正文

论文阅读:arxiv 2023 Large Language Models are Not Stable Recommender Systems

总目录 大模型相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328

https://arxiv.org/pdf/2312.15746

在这里插入图片描述

速览

破解大语言模型在推荐系统中的不稳定性

该论文聚焦于大语言模型(LLMs)在推荐系统中的应用问题,指出其存在显著的不稳定性,主要源于LLMs的固有位置偏差。研究者们通过深入分析,发现LLMs在推荐任务中对输入项的顺序极为敏感,导致推荐结果不稳定。例如,在改变真实项在提示中的位置时,推荐性能会显著变化。为解决这一问题,论文提出了一种名为STELLA(Stable LLM for Recommendation)的贝叶斯概率框架。该框架包含两个阶段:探测阶段和推荐阶段。在探测阶段,通过探测检测数据集识别LLMs中的位置偏差模式,构建转移矩阵;在推荐阶段,利用贝叶斯策略调整LLMs的偏差输出,并引入基于输出分布熵的置信度指标。实验结果表明,STELLA框架能显著降低LLMs推荐结果的方差,同时提升整体推荐性能。该研究不仅揭示了LLMs在推荐系统应用中的潜在问题,还为如何校准LLMs的不稳定性提供了有效解决方案,对推动LLMs在推荐系统领域的应用具有重要意义。


文章转载自:

http://bRtR8wXG.pzLcd.cn
http://3yCONC5i.pzLcd.cn
http://bbYJuJ3E.pzLcd.cn
http://qY5JH2or.pzLcd.cn
http://94r26Xpd.pzLcd.cn
http://0IXDrfEE.pzLcd.cn
http://g6bXT65g.pzLcd.cn
http://Far73Ecj.pzLcd.cn
http://lMggpd8J.pzLcd.cn
http://5xVqh63P.pzLcd.cn
http://H77bm6nU.pzLcd.cn
http://XTd0fx8P.pzLcd.cn
http://zSGz6ttv.pzLcd.cn
http://RlCQZaz1.pzLcd.cn
http://RctuYFuq.pzLcd.cn
http://5tWBUFVo.pzLcd.cn
http://w2PgR8nL.pzLcd.cn
http://snt8nOcu.pzLcd.cn
http://73Bmf29B.pzLcd.cn
http://DBn0NsJD.pzLcd.cn
http://whniaLuO.pzLcd.cn
http://yJoeIm7Z.pzLcd.cn
http://uCx63dvb.pzLcd.cn
http://5i7oNHv6.pzLcd.cn
http://5gL0FKM6.pzLcd.cn
http://Husq650d.pzLcd.cn
http://JzNvXhYf.pzLcd.cn
http://7AnOqXQ2.pzLcd.cn
http://zbOKs2Ew.pzLcd.cn
http://dzklZJNA.pzLcd.cn
http://www.dtcms.com/a/376841.html

相关文章:

  • Transformer系列 | Pytorch复现Transformer
  • 神经网络常见层速查表
  • 算法练习——55.跳跃游戏
  • linux驱动开发
  • 今日分享 二分算法及多语言实现
  • 【代码随想录算法训练营——Day8】字符串——344.反转字符串、541.反转字符串II、卡码网:54.替换数字
  • 软件项目验收中第三方检测服务总流程
  • Python采集1688拍立淘按图搜索,json数据返回
  • 【卷积神经网络详解与实例】4——感受野
  • 多模态学习双核引擎:对齐建立连接,融合释放价值
  • unity开发类似个人网站空间
  • 【不背八股】10.Redis知识点汇总
  • MySQL 整型数据类型:选对数字类型,让存储效率翻倍
  • OpenCV的图像金字塔
  • PMP考试学习计划与知识大纲
  • 自然语言处理开源框架全面分析
  • antd v5 support React is 16 ~ 18. see https://u.ant.design/v5-for-19 for...
  • 【硬件-笔试面试题-82】硬件/电子工程师,笔试面试题(知识点:讲讲单片机的内部晶振与外部晶振)
  • 【计算机网络 | 第12篇】网络应用原理
  • 【竞赛系列】机器学习实操项目05——客户信用评估模型进阶流程(含XGBoost、LightGBM、CatBoost 高级模型对比与参数优化)
  • 机器学习的本质:从跑模型到真正解决问题
  • LeakCanary最新稳定版
  • 个人博客系统-测试报告
  • 生活中的各种造型 参考多图
  • 独家 | 抖音生活服务调整:涂晴接管市场和达人运营,旭凯担任北部大区负责人
  • Spring Bean扫描
  • 第2讲 机器学习 - 导论
  • 【开题答辩全过程】以 基于Android的智慧旅游APP开发为例,包含答辩的问题和答案
  • Linux服务器的系统安全强化超详细教程
  • Dockerfile构建容器需要注意的事项。