当前位置: 首页 > news >正文

清华大学《DeepSeek与AI幻觉》(无套路免费分享)

随着人工智能技术的飞速发展,以DeepSeek为代表的国产大模型正逐渐成为各行各业的重要工具。然而,AI在生成内容时常常会出现“幻觉”——即生成与事实不符、逻辑断裂或脱离上下文的内容。

清华大学新闻与传播学院与人工智能学院联合推出的这篇教程《DeepSeek与AI幻觉》,系统性地讲解了AI幻觉的成因、评测方法及应对策略,旨在帮助用户更好地理解和使用AI工具。

《DeepSeek与AI幻觉》:https://pan.quark.cn/s/d213450b7a8d

一、核心要义

  1. AI幻觉的定义与分类:AI幻觉分为事实性幻觉(与事实不符)和忠实性幻觉(与用户指令不符)。

  2. DeepSeek的幻觉成因:数据偏差、泛化困境、知识固化、意图误解等是导致AI幻觉的主要原因。

  3. AI幻觉的双刃剑效应:虽然幻觉可能带来信息污染和信任危机,但也可能激发创造力和科学突破。

  4. 应对AI幻觉的策略:通过联网搜索、双AI验证、提示词工程等方法,用户可以有效减少幻觉带来的负面影响。


二、AI幻觉的定义与案例

AI幻觉指的是AI模型生成的内容与事实不符、逻辑断裂或脱离上下文的现象。通俗地说,就是AI“一本正经地胡说八道”。教程通过多个案例生动展示了AI幻觉的表现:

  1. 金融行业应用案例(第3页):
    DeepSeek在金融领域的应用案例中,某银行利用其构建因果归因网络,成功降低了小微企业的不良率。然而,AI生成的某些案例可能存在虚构成分,如“某头部银行”的具体名称和数据的真实性无法验证。

  2. 推荐错误(第4页):
    用户让DeepSeek推荐阿布扎比的本地市场,结果AI推荐了一个根本不存在的商场。虽然AI道歉后再次推荐,但依然出现了错误。

  3. 医疗转录错误(第5页):
    OpenAI的Whisper系统在医疗转录中出现了大量幻觉问题。例如,原音频为“她的父亲再婚后不久就去世了”,转录文本却变成了“她确实在65岁时去世了”,这种错误可能对患者健康和医疗系统产生严重影响。

  4. 虚构事件(第16页):
    当被问及“水浒传中李逵为什么大闹五台山”时,DeepSeek生成了虚构的情节,实际上大闹五台山的是鲁智深,而非李逵。


三、AI幻觉的成因

教程深入分析了AI幻觉的成因,主要包括以下几点:

  1. 数据偏差:训练数据中的错误或片面性被模型放大。例如,医学领域的过时论文可能导致AI生成错误的医疗建议。

  2. 泛化困境:模型难以处理训练集外的复杂场景。例如,预测南极冰层融化对非洲农业的影响时,AI可能生成不准确的结论。

  3. 知识固化:模型过度依赖参数化记忆,缺乏动态更新能力。例如,AI可能虚构2023年后的事件。

  4. 意图误解:用户提问模糊时,模型容易“自由发挥”。例如,用户要求“介绍深度学习”,AI可能生成与用户需求无关的内容。


四、AI幻觉的评测

教程通过多个测试案例,展示了如何评测AI幻觉:

  1. 通用提示语测试(第12页):
    随机生成100条通用提示语,模仿普通用户的真实使用场景,评测各大模型的幻觉率。结果显示,DeepSeek V3的幻觉率为2%,DeepSeek R1为3%。

  2. 事实性幻觉测试(第13页):
    随机抽取300道事实性幻觉测试题,涵盖健康、科学、历史等领域。DeepSeek V3的幻觉率为29.67%,DeepSeek R1为22.33%。

  3. 常识错误与逻辑陷阱(第14-15页):
    在常识问题和逻辑推理任务中,AI模型常常生成错误的答案。例如,当被问及“为什么一向见钱眼开的小明仍然会被金钱蒙住双眼”时,DeepSeek生成了复杂的逻辑分析,但并未直接回答问题的核心。


五、如何应对AI幻觉?

教程提供了三种应对AI幻觉的策略:

  1. 联网搜索(第20页):
    通过联网功能,AI可以实时检索权威信息,减少幻觉率。例如,DeepSeek V3在开启联网搜索后,事实性测试的幻觉率从29.67%降至24.67%。

  2. 双AI验证(第21页):
    利用多个AI模型进行交叉验证。例如,先用DeepSeek生成答案,再用其他大模型进行审查,确保答案的准确性。

  3. 提示词工程(第22-23页):
    通过设计精准的提示词,约束AI的生成内容。例如,使用“时间锚定法”限定时间范围,或使用“知识锚定法”限定权威来源,减少虚构内容的生成。


六、AI幻觉的创造力价值

尽管AI幻觉可能带来风险,但它也具有一定的创造力价值:

  1. 科学发现(第27页):
    AI幻觉在蛋白质设计中发挥了重要作用。大卫·贝克团队利用AI的“错误折叠”启发新型蛋白质结构,最终获得了2024年诺贝尔化学奖。

  2. 文艺与设计(第28页):
    AI幻觉可以突破人类思维定式,生成超现实的艺术作品和设计灵感。例如,AI生成的虚拟环境和角色设计为游戏开发提供了无限的可能性。

  3. 技术创新(第30页):
    AI幻觉在某些技术任务中意外提升了系统性能。例如,DeepMind团队发现,AI在图像分割任务中产生的“超现实边界”提升了自动驾驶系统在极端天气下的识别精度。


七、教程的优势
  1. 全面覆盖:从AI幻觉的定义、成因到应对策略,教程涵盖了用户在使用AI工具时可能遇到的所有关键问题。

  2. 案例丰富:通过多个真实案例,教程生动展示了AI幻觉的表现及其潜在风险。

  3. 操作性强:教程提供了具体的应对策略,如联网搜索、双AI验证、提示词工程等,用户可以直接套用。

  4. 创造力启发:教程不仅关注AI幻觉的负面影响,还探讨了其在科学、艺术和技术创新中的潜在价值。


八、总结

AI幻觉是当前大模型技术面临的一个重要挑战,但它并非完全负面。通过理解AI幻觉的成因,并采取有效的应对策略,用户可以最大限度地减少其带来的风险,同时利用其创造力价值。清华大学的这篇教程为普通用户提供了一份详实的指南,帮助他们在AI时代更好地驾驭这一强大的工具。正如教程中所说:“与其追求‘绝对正确’,不如学会与AI的‘想象力’共舞——因为最伟大的创新,往往诞生于理性与狂想的交界处。”


这篇教程不仅适合AI领域的专业人士,也适合普通用户。通过学习如何应对AI幻觉,用户可以在工作、学习和生活中更高效地使用AI工具,同时避免因AI的“胡说八道”而陷入困境。

相关文章:

  • lerobot调试记录
  • 传统的自动化行业的触摸屏和上位机,PLC是否会被取代?
  • Web 开发中的 5 大跨域标签解析:如何安全地进行跨域请求与加载外部资源
  • 路由基本配置
  • 神经网络八股(三)
  • 扩散模型中,Flow Matching的训练方式相比于 DDPM 训练方法有何优势?
  • 【GPU驱动】OpenGLES图形管线渲染机制
  • HTML 字符实体
  • MariaDB 历史版本下载地址 —— 筑梦之路
  • 代码随心录算法训练营第四十五天| 动态规划08
  • DeepSeek-R1使用生存指南
  • 金融学-金融机构
  • 利用非球面透镜进行激光光束重组
  • Linux中DataX使用第四期
  • CUDA跟Nvidia适配处理
  • AIP-148 标准域
  • LeetCode 热题 100 283. 移动零
  • 记录:Docker 安装记录
  • 应用篇| 小白本地部署DeepSeek-R1
  • 动态规划进阶:Python实现最长递增子序列(LIS)问题及其优化
  • 调查:“笔枪”风靡校园存隐患,平台应为手工教学视频设红线
  • “除非我去世”,马斯克称仍致力于继续执掌特斯拉
  • 建立双城双向科创项目孵化机制,2025沪港创新项目评选启动
  • 63岁微波遥感领域著名专家李春升参加学术会议期间病逝
  • 男子聚餐饮酒后身亡,同桌3人被判赔偿近20万元
  • 专利申请全球领先!去年我国卫星导航与位置服务产值超5700亿