当前位置: 首页 > news >正文

大模型提示词简介

《大模型应用开发 鲍亮,李倩 清华大学出版社》【摘要 书评 试读】- 京东图书

本节将从提示词工程的理论基础出发,深入探讨其在人工智能应用中的核心概念、技术原理和实践方法。通过系统性地分析提示词设计的认知机制和优化策略,结合具体应用场景的实例剖析,旨在为读者构建完整的提示词工程知识体系,并提供可操作的技术指导框架。

4.1.1  提示词工程概念和作用

提示词工程是一门专注于设计、测试和优化AI模型输入指令的应用技术学科。其研究对象主要包括指令的语义结构、上下文信息的组织方式以及模型响应行为的可控性机制[1]。从认知科学的角度来看,提示词工程本质上构建了一种新型的人机语义映射关系,通过结构化的自然语言指令实现对机器智能行为的程序化控制[2]。

提示词工程的发展轨迹与大语言模型技术的演进密切相关。根据现有文献记录,该概念最初在2020年前后伴随GPT-3等transformer架构模型的突破而逐渐形成[3]。学术界普遍认为,该领域在2021年~2022年间经历了快速发展期,相关研究方法论逐步趋于成熟。值得注意的是,一些知名学者和研究机构的公开课程在一定程度上促进了该学科知识的普及和标准化。

那么如何正确理解提示词和提示词工程这个概念呢?

1. 提示词

用户向AI模型输入的指令或问题,例如“分析当前国际贸易格局的主要特征”或“设计一个面向中小企业的数字化转型方案”。

提示词的作用:通过适当的提示词,我们可以引导模型生成预期的内容,从而使其在特定任务上表现更好。提示词可以是直接的提问、陈述、描述或是带有上下文的句子。

2. 提示词工程

围绕提示词设计、优化和评估的系统化方法,包含结构设计、上下文管理、模型行为控制等[4]。

3. 提示词和提示词工程的区别

从理论层面来看,提示词可以被视为单次交互中的“指令(Instructions)”,而提示词工程则代表了涵盖全流程的“方法论(Methodologies)”[5]。提示词工程在实践中需要综合考虑模型的内在特性(如推理能力边界、知识覆盖范围)、具体任务场景(如创作类任务与分析类任务的差异)以及用户的多样化需求(如风格偏好、格式要求)等因素的协同优化。

简单的任务指令如“解释人工智能”可能会产生过于宽泛的回答,而使用经过工程化设计的指令“请从技术原理、应用领域和社会影响三个维度,为非技术背景的管理者解释人工智能技术,每个维度控制在200字以内”,则更可能生成结构清晰、针对性强的专业回答。

从应用价值来看,提示词工程在一定程度上实现了让普通用户无需掌握编程技能,即可通过自然语言对大模型进行“编程”操作,因此被部分研究者称为“非程序员与大模型对话的API接口”。

4. 提示词和用户提示词

系统提示词的原理:AI大模型本身通常并不具备记忆功能。当用户在对话界面中与AI进行多轮交互时,模型能够维持上下文连贯性的原因在于:我们所使用的对话界面实际上是专门开发的“AI大模型对话应用”,该应用系统利用存储机制保存用户的历史对话内容以及模型的输出结果。在每次新的对话中,系统会将用户的历史输入、历史输出以及当前输入内容一并传递给大模型,从而实现重新生成回应[6]。

在AI大模型的开发实践中,为了确保模型能够在特定领域内保持一致的回答质量,开发者通常会为模型设定“系统提示词”。这相当于在每次对话中,模型都会自动携带预设的系统提示词参与交互过程。

所以,我们可以给系统提示词和用户提示词进行一个定义:

系统提示词:用于定义大模型的角色定位、行为规范和回答框架的全局性提示词,在每次对话中都会自动携带。

用户提示词:用户输入给大模型的具体指令,主要用于表达用户希望模型执行的特定任务。

5. 提示词工程作用

(1)输出质量的提升[7]:通过系统化的指令设计,可能显著改善AI系统回答的准确性、相关性和实用性,使其更好地契合特定业务场景的要求。

(2)一致性保障:在批量处理或长期应用场景中,有助于维持输出结果的风格统一和质量稳定。

(3)复杂任务的分解与执行:为多步骤推理、结构化分析、程序代码生成等高复杂度任务提供了可行的技术路径。

(4)角色化应用的实现:支持构建具有特定专业背景的AI助手,如法律顾问、技术专家、教育导师等,以适应不同领域的专业需求。

(5)技术集成与功能扩展:结合检索增强生成(RAG)、知识图谱等先进技术,可能实现更广泛的应用场景覆盖。

4.1.2  提示词应用示例

1. 文本概括

场景:将长论文浓缩为摘要。

原始提示词:“总结这篇文章。”

问题:未指定长度、核心要素或风格。

优化后的提示词:

请将以下论文压缩至100字内,突出三个创新点:

1. 核心方法论

2. 实验结论

3. 行业应用价值

语言风格:学术简报型

效果:定向提取关键信息,规避冗余描述。

2. 信息提取

场景:从合同文本提取法律要素。

原始提示词:“提取重要条款。”

问题:未定义“重要”标准及输出格式。

优化后的提示词:

JSON格式提取以下合同中的:

- 签约双方(字段:parties 

- 履约期限(字段:term

- 违约责任条款(字段:liability

若某字段缺失则返回null

效果:结构化输出直接对接法律数据库。

3. 问答

场景:医疗知识咨询。

原始提示词:“二甲双胍有什么用?”

问题:回答可能遗漏禁忌人群或相互作用。

优化后提示词:

作为药剂师回答:

Q: 二甲双胍的适应症、禁忌症及与阿司匹林的相互作用? 

要求:

1. 引用《中国2型糖尿病防治指南》

2. 分点陈述(max 200字)

效果:限定专业范围,规避非权威信息。

4. 文本分类

场景:电商评论情感分析。

原始提示词:“判断这条评论是好评还是差评。”

问题:无法处理中立评价及原因分析。

优化后提示词:

按三级体系分类评论情感:

- 积极(含关键词“推荐”“超值”)

- 中立(仅描述功能) 

- 消极(含“故障”“退款”) 

输出格式:{"sentiment":"", "reason":""} 

效果:精细化分类支持客服策略制定。

5. 对话

场景:AI心理咨询对话。

原始提示词:“安慰焦虑的用户。”

问题:可能导致空洞鸡汤式回复。

优化后提示词:

你作为认知行为疗法(CBT)顾问:

1. 先共情(例:我理解焦虑让你很难受

2. 引导用户描述具体压力源 

3. 提供1个可立即执行的缓解技巧 

禁止诊断或开药! 

效果:符合伦理规范,提供可操作建议。

6. 代码生成

场景:自动化数据清洗脚本。

原始提示词:“用Python清洗CSV数据。”

问题:缺少细节导致不可用代码。

优化后提示词:

编写Python函数:   

- 输入:含缺失值和字符串日期的CSV路径 

- 任务: 

  用中位数填充数值缺失值 

  将日期转为datetime格式

  删除重复行

- 输出:清洗后的DataFrame

要求:添加异常处理及类型注解  

效果:开箱即用,减少调试时间。

7. 推理

场景:商业决策分析。

原始提示词:“要不要开拓日本市场?”

问题:缺乏分析维度与数据支撑。

优化后提示词:

基于以下数据分步推理:

- 优势:我司产品在日本竞品少(数据源:2023行业白皮书P120

- 风险:物流成本增30%(数据源:财务表Q4

结论:是否建议进入?

要求:

1. 计算预期ROI

2. 列出三个关键风险缓解策略。

效果:数据驱动决策,增强逻辑可信度。

http://www.dtcms.com/a/490334.html

相关文章:

  • R语言术语(2)
  • 广州网站建设推广谷歌官网首页
  • 【Python】基于Tkinter库实现文件夹拖拽与选择功能
  • Spring Boot 官方文档精解:构建与依赖管理
  • ONLYOFFICE 桌面编辑器9.1版本已发布:PDF密文功能和全新注释、工作表公式优化及文件恢复便捷化等
  • 重视网站阵地建设广州市天河区建设局官方网站
  • QPS、TPS、RPS 详解
  • 零基础从头教学Linux(Day 50)
  • 《计算机操作系统》_理解并发程序的执行_第4次课20250925
  • 结合多技术指标(如MACD、RSI)来验证布林带参数的可靠性
  • 设计师网站pintset广州市住房城乡建设部门户网站
  • 精品下载站百度怎么在视频下方投放广告
  • 智能Agentic业务系统设计:从任务语义到状态流转的全栈思考
  • 【Leetcodenowcode数据结构】单链表的应用(进阶)
  • Python基础语法全解析
  • Spring Boot 3零基础教程,Spring Boot 自定义日志系统,笔记23
  • 智慧园区的安全守护者
  • 【avalonia教程】12自定义Converter
  • 大数据处理:Dask DataFrame,内存不足解决方案?
  • 我的AI助手矩阵:从单模型调用到多模型协作的智能升级
  • 网页制作邢台网站公司wordpress采 文章权限
  • 网站设计方案和技巧新鸿儒网站建设
  • Lua 中的 __index、__newindex、rawget 与 rawset 介绍
  • CAN、ROS数据录制与rqt图形化显示
  • 基于深度学习的卫星图像分类(Kaggle比赛实战)
  • 银河麒麟 aarch64 linux 里面的 qt 发布应用怎么打包
  • linux常用命令(6)——网络管理
  • 江阴建设局网站招考设计说明500字通用
  • Lab Deploying Multi-container Applications
  • 目标检测2