当前位置: 首页 > news >正文

论文略读:DAILYDILEMMAS:REVEALINGVALUEPREFERENCES OFLLMSWITHQUANDARIESOFDAILYLIFE

ICLR 2025 spotlight  5888

  • 随着用户越来越多地依赖大语言模型(LLMs)来辅助日常生活中的决策,许多决策并非非黑即白,而是高度依赖于个人价值观与道德标准
  • 为此,论文提出 DailyDilemmas,一个包含 1,360 个现实生活中道德困境的数据集。每个困境都提供两个可能的行动选项,并列出了每个选项涉及的相关方与人类价值观。

  • 基于这些道德困境,我们建立了一个涵盖人际关系、职场、环境问题等多种日常主题的人类价值观语料库。借助 DailyDilemmas,我们评估 LLM 在这些道德困境中会选择哪种行为,以及这些选择所体现的价值倾向。
  • 进一步通过五种理论框架分析这些价值取向,这些框架来自社会学、心理学和哲学,包括:
    • 世界价值观调查(World Values Survey)

    • 道德基础理论(Moral Foundations Theory)

    • 马斯洛需求层次(Maslow's Hierarchy of Needs)

    • 亚里士多德美德伦理(Aristotle's Virtues)

    • Plutchik 情绪之轮(Plutchik's Wheel of Emotions)

  • 论文呢发现
    • LLM 在 World Values Survey 中更倾向于自我表达(self-expression)而非生存需求(survival),在 Moral Foundations Theory 中则更重视关怀(care)而非忠诚(loyalty)
    • 不同模型在某些核心价值上存在显著差异。例如,在**“诚实”**这一价值上,Mixtral-8x7B 表现出忽视的倾向(减少 9.7%),而 GPT-4-turbo 更倾向选择它(增加 9.4%)
    • 终端用户难以通过系统提示(system prompts)有效地引导模型的价值排序,这对模型对齐与用户控制提出了新的挑战。

相关文章:

  • OCR(光学字符识别)算法
  • 智能合约中人工智能驱动的漏洞分析:趋势、挑战与未来方向
  • 【leetcode-合并两个有序链表】
  • AI助手一键生成专业PPT(Gamma/Genspark/Kimi)
  • [Git] 标签管理
  • 三.Gitee远程操作标签操作
  • FastAPI基础入门(三)
  • 智慧医疗能源事业线深度画像分析(下)
  • MySQL 基础笔记
  • Reactive-Resume:重构你的简历编写体验
  • 【系统设计【1】】系统设计面试方法论:从0到百万用户的需求到架构的推演
  • 分布式I/O在食品包装行业中的应用
  • 【 WWDC25:新系统,新命名】
  • < 买了个麻烦 (二) 618 京东云--轻量服务器 > 可以为您申请全额退订呢。 挣取来的,东京云 轻量服务器,可以“全额退款“
  • 【Linux】进程控制(下)---程序替换宝藏岛
  • 前端~三维地图(cesium)点位聚合
  • 黑马教程强化day2-1
  • 七牛云图片上传 前后端全过程
  • vue封装的echarts组件被同一个页面多次引用只显示一个的问题
  • Uncaught (in promise) TypeError: Cannot read properties of null (reading ‘xxx’)
  • 网站建设营销的技巧/济南seo优化
  • 河北疫情紧急通知最新/广州网络优化最早的公司
  • 网站维护一次多少钱/seo小白入门教学
  • wordpress显示评论数/上海网站建设优化
  • 怎么用路由器做网站/衡阳seo快速排名
  • 国内移动端网站做的最好的/百度推广优化技巧