当前位置: 首页 > news >正文

大型语言模型个性化助手实现

大型语言模型个性化助手实现

目录

  • 大型语言模型个性化助手实现
    • PERSONAMEM,以及用户资料和对话模拟管道
    • 7种原位用户查询类型
    • 关于大语言模型个性化能力评估的研究

大型语言模型(LLMs)已经成为用户在各种任务中的个性化助手,从提供写作支持到提供量身定制的建议或咨询。随着时间的推移,用户和LLM之间的交互历史可以提供有关个人特征和偏好的广泛信息。

然而,关于当今LLM如何有效地利用这些历史来(1)内化用户的固有特征和偏好,(2)跟踪用户分析和偏好如何随时间演变,以及(3)在新场景中相应地生成个性化响应,仍然存在悬而未决的问题。

在这项工作中,我们介绍了PERSONMEM基准。PERSONMEM具有精心策划的用户配置文件,其中包含180多个模拟用户LLM交互历史,每个历史包含多达60个会话,涉及15个需要个性化的现实世界任务

给定一个现场用户查询,即用户从第一人称角度发出的查询,我们评估LLM聊天机器人根据用户个人资料的当前状态识别最合适响应的能力。

我们观察到,当前的LLM仍然难以通过直接提示方法识别用户资料随时间的动态演变。因此,LLM通常无法提供与用户当前情况和偏好相一致的响应,GPT-4.1、o4-mini、GPT-4.5、o1或Gemini-2.0等前沿模型的总体准确率仅为50%左右,这表明还有改进的空间。我们希望PERSONAMEM,以及用户资料和对话模拟管道&


文章转载自:
http://brack.ciuzn.cn
http://alchemical.ciuzn.cn
http://barbe.ciuzn.cn
http://biopoiesis.ciuzn.cn
http://atmospheric.ciuzn.cn
http://applied.ciuzn.cn
http://adenoidectomy.ciuzn.cn
http://alleviation.ciuzn.cn
http://bogged.ciuzn.cn
http://chronical.ciuzn.cn
http://ameslan.ciuzn.cn
http://chalutz.ciuzn.cn
http://bumblebee.ciuzn.cn
http://beech.ciuzn.cn
http://cadenced.ciuzn.cn
http://catenative.ciuzn.cn
http://bss.ciuzn.cn
http://cap.ciuzn.cn
http://agrostologist.ciuzn.cn
http://cartful.ciuzn.cn
http://blackball.ciuzn.cn
http://chromosome.ciuzn.cn
http://abasement.ciuzn.cn
http://anuclear.ciuzn.cn
http://carthago.ciuzn.cn
http://cercis.ciuzn.cn
http://afterwar.ciuzn.cn
http://chorography.ciuzn.cn
http://actual.ciuzn.cn
http://archiepiscopate.ciuzn.cn
http://www.dtcms.com/a/169967.html

相关文章:

  • 深度学习经典网络之LeNet-5详解
  • 【BLE】【nRF Connect】 精讲nRF Connect自动化测试套件(宏录制、XML脚本)
  • 最大子段和 Java
  • 青少年编程与数学 02-018 C++数据结构与算法 24课题、密码学算法
  • JavaScript基础-流程控制概念
  • 第六章,BGP---边界网关协议
  • Redis从入门到实战实战篇2
  • 《应用开发突围指南:敏捷开发的实战精髓》
  • ecs网站备份,ecs网站备份的方法
  • 生成式 AI 的阐释
  • Python语句类型与格式规范研究
  • 数据仓库方法论书籍及其阅读建议
  • 【quantity】9 长度单位模块(length.rs)
  • IO模型和多路复用
  • piccolo-large-zh-v2 和 bge-m3哪个效果好?
  • 什么是生成式 AI (GenAI)?
  • IDEA快速上手Maven项目:模板选择 + 多模块拆分
  • k8s笔记——kubebuilder工作流程
  • [蓝桥杯真题题目及解析]2025年C++b组
  • IRF2+IRF3表格配置思路
  • 【Linux】驱动开发方法
  • 基于D-Mixer与TransXNet的YOLOv8改进—融合全局-局部特征与空间降维注意力机制的CNN-ViT混合架构
  • C语言中memmove和memcpy
  • [2025常问知识点]关于spring的ioc和aop?ioc和DI的区别,ioc是怎么实现的?aop是怎么实现的?
  • 主自开发光枪鼠标模拟器实战,使用micro pro板子方式
  • 【Vue】跨平台开发(Electron、Quasar)
  • 蓝桥杯 摆动序列
  • 冒泡排序详解:从零理解其核心思想与循环设计原理
  • 微软发布了面向0基础的AI agent新课
  • 人工智能——层次聚类算法