当前位置: 首页 > news >正文

大型语言模型个性化助手实现

大型语言模型个性化助手实现

目录

  • 大型语言模型个性化助手实现
    • PERSONAMEM,以及用户资料和对话模拟管道
    • 7种原位用户查询类型
    • 关于大语言模型个性化能力评估的研究

大型语言模型(LLMs)已经成为用户在各种任务中的个性化助手,从提供写作支持到提供量身定制的建议或咨询。随着时间的推移,用户和LLM之间的交互历史可以提供有关个人特征和偏好的广泛信息。

然而,关于当今LLM如何有效地利用这些历史来(1)内化用户的固有特征和偏好,(2)跟踪用户分析和偏好如何随时间演变,以及(3)在新场景中相应地生成个性化响应,仍然存在悬而未决的问题。

在这项工作中,我们介绍了PERSONMEM基准。PERSONMEM具有精心策划的用户配置文件,其中包含180多个模拟用户LLM交互历史,每个历史包含多达60个会话,涉及15个需要个性化的现实世界任务

给定一个现场用户查询,即用户从第一人称角度发出的查询,我们评估LLM聊天机器人根据用户个人资料的当前状态识别最合适响应的能力。

我们观察到,当前的LLM仍然难以通过直接提示方法识别用户资料随时间的动态演变。因此,LLM通常无法提供与用户当前情况和偏好相一致的响应,GPT-4.1、o4-mini、GPT-4.5、o1或Gemini-2.0等前沿模型的总体准确率仅为50%左右,这表明还有改进的空间。我们希望PERSONAMEM,以及用户资料和对话模拟管道&

相关文章:

  • 深度学习经典网络之LeNet-5详解
  • 【BLE】【nRF Connect】 精讲nRF Connect自动化测试套件(宏录制、XML脚本)
  • 最大子段和 Java
  • 青少年编程与数学 02-018 C++数据结构与算法 24课题、密码学算法
  • JavaScript基础-流程控制概念
  • 第六章,BGP---边界网关协议
  • Redis从入门到实战实战篇2
  • 《应用开发突围指南:敏捷开发的实战精髓》
  • ecs网站备份,ecs网站备份的方法
  • 生成式 AI 的阐释
  • Python语句类型与格式规范研究
  • 数据仓库方法论书籍及其阅读建议
  • 【quantity】9 长度单位模块(length.rs)
  • IO模型和多路复用
  • piccolo-large-zh-v2 和 bge-m3哪个效果好?
  • 什么是生成式 AI (GenAI)?
  • IDEA快速上手Maven项目:模板选择 + 多模块拆分
  • k8s笔记——kubebuilder工作流程
  • [蓝桥杯真题题目及解析]2025年C++b组
  • IRF2+IRF3表格配置思路
  • 贵州召开全省安全生产电视电话会议:以最严要求最实举措守牢安全底线
  • 这个五一假期,外贸拓内销好货和识货人在上海“双向奔赴”
  • 科普|治疗腰椎间盘突出症,筋骨平衡理论如何提供新视角?
  • 谢承祥已任自然资源部总工程师
  • 重庆渝中警方:男子点燃摩托车欲寻衅滋事,被民警和群众合力制服
  • 月薪3万文科友好,“AI训练师”真有那么赚?