当前位置：首页 > news >正文

论文阅读：arxiv 2023 Large Language Models are Not Stable Recommender Systems

news 2025/9/11 7:31:32

总目录大模型相关研究：https://blog.csdn.net/WhiffeYF/article/details/142132328

https://arxiv.org/pdf/2312.15746

在这里插入图片描述

速览

破解大语言模型在推荐系统中的不稳定性

该论文聚焦于大语言模型（LLMs）在推荐系统中的应用问题，指出其存在显著的不稳定性，主要源于LLMs的固有位置偏差。研究者们通过深入分析，发现LLMs在推荐任务中对输入项的顺序极为敏感，导致推荐结果不稳定。例如，在改变真实项在提示中的位置时，推荐性能会显著变化。为解决这一问题，论文提出了一种名为STELLA（Stable LLM for Recommendation）的贝叶斯概率框架。该框架包含两个阶段：探测阶段和推荐阶段。在探测阶段，通过探测检测数据集识别LLMs中的位置偏差模式，构建转移矩阵；在推荐阶段，利用贝叶斯策略调整LLMs的偏差输出，并引入基于输出分布熵的置信度指标。实验结果表明，STELLA框架能显著降低LLMs推荐结果的方差，同时提升整体推荐性能。该研究不仅揭示了LLMs在推荐系统应用中的潜在问题，还为如何校准LLMs的不稳定性提供了有效解决方案，对推动LLMs在推荐系统领域的应用具有重要意义。

文章转载自：

http://bRtR8wXG.pzLcd.cn
http://3yCONC5i.pzLcd.cn
http://bbYJuJ3E.pzLcd.cn
http://qY5JH2or.pzLcd.cn
http://94r26Xpd.pzLcd.cn
http://0IXDrfEE.pzLcd.cn
http://g6bXT65g.pzLcd.cn
http://Far73Ecj.pzLcd.cn
http://lMggpd8J.pzLcd.cn
http://5xVqh63P.pzLcd.cn
http://H77bm6nU.pzLcd.cn
http://XTd0fx8P.pzLcd.cn
http://zSGz6ttv.pzLcd.cn
http://RlCQZaz1.pzLcd.cn
http://RctuYFuq.pzLcd.cn
http://5tWBUFVo.pzLcd.cn
http://w2PgR8nL.pzLcd.cn
http://snt8nOcu.pzLcd.cn
http://73Bmf29B.pzLcd.cn
http://DBn0NsJD.pzLcd.cn
http://whniaLuO.pzLcd.cn
http://yJoeIm7Z.pzLcd.cn
http://uCx63dvb.pzLcd.cn
http://5i7oNHv6.pzLcd.cn
http://5gL0FKM6.pzLcd.cn
http://Husq650d.pzLcd.cn
http://JzNvXhYf.pzLcd.cn
http://7AnOqXQ2.pzLcd.cn
http://zbOKs2Ew.pzLcd.cn
http://dzklZJNA.pzLcd.cn

http://www.dtcms.com/a/376841.html

相关文章：

Transformer系列 | Pytorch复现Transformer

神经网络常见层速查表

算法练习——55.跳跃游戏

linux驱动开发

今日分享二分算法及多语言实现

【代码随想录算法训练营——Day8】字符串——344.反转字符串、541.反转字符串II、卡码网：54.替换数字

软件项目验收中第三方检测服务总流程

Python采集1688拍立淘按图搜索，json数据返回

【卷积神经网络详解与实例】4——感受野

多模态学习双核引擎：对齐建立连接，融合释放价值

unity开发类似个人网站空间

【不背八股】10.Redis知识点汇总

MySQL 整型数据类型：选对数字类型，让存储效率翻倍

OpenCV的图像金字塔

PMP考试学习计划与知识大纲

自然语言处理开源框架全面分析

antd v5 support React is 16 ~ 18. see https://u.ant.design/v5-for-19 for...

【硬件-笔试面试题-82】硬件/电子工程师，笔试面试题（知识点：讲讲单片机的内部晶振与外部晶振）

【计算机网络 | 第12篇】网络应用原理

【竞赛系列】机器学习实操项目05——客户信用评估模型进阶流程（含XGBoost、LightGBM、CatBoost 高级模型对比与参数优化）

机器学习的本质：从跑模型到真正解决问题

LeakCanary最新稳定版

个人博客系统-测试报告

生活中的各种造型参考多图

独家 | 抖音生活服务调整：涂晴接管市场和达人运营，旭凯担任北部大区负责人

Spring Bean扫描

第2讲机器学习 - 导论

【开题答辩全过程】以基于Android的智慧旅游APP开发为例，包含答辩的问题和答案

Linux服务器的系统安全强化超详细教程

Dockerfile构建容器需要注意的事项。