【大语言模型】-- Prompt Engineering 提示工程

文章目录
文章目录
- 什么是提示工程?
- 为什么需要提升工程?
- 常见提示类型与工程技巧?
- 系列文章
什么是提示工程?
提示工程是一门不修改模型权重、仅靠设计/优化输入提示词(Prompt)来引导大模型输出期望结果的技术与实践集合。核心目标是让模型“听懂”人的意图,把潜藏能力最大程度地“召唤”出来。
为什么需要提升工程?
提示工程通过构造、迭代与优化离散型自然语言先验分布,能够在冻结模型参数的条件下,有效调控大语言模型在潜在空间中的注意力分配与生成路径,从而提升下游任务中输出分布与目标分布的对齐度,显著改善零样本与少样本场景下的精确率、召回率与鲁棒性,并降低微调所需的数据与算力开销。
常见提示类型与工程技巧?
零样本(zero-shot)
核心原理:仅靠预训练学到的任务先验,用自然语言指令直接激活对应“隐式任务向量”
示例:1. 将“我爱你”翻译成法语。2.判断以下评论的情感(正面/负面):这手机充电真快。
少样本(few-shot)
核心原理:用 2-5 组输入-输出示例让模型“照葫芦画瓢”,梯度下降-free 元学习
示例:1. Q:苹果→红色;Q:香蕉→黄色;Q:葡萄→?2. 把中文变成拼音:中国→zhōng guó;北京→běi jīng;上海→?
思维链(Chain-of-thought)
核心原理:显式生成中间推理步骤,降低一次性跳结论的累积误差
示例:1. 问题:2+3×4=?让我们一步一步想:先算3×4=12,再算2+12=14,答案是14。2. 一本书原价100元,先打8折再满减10元,共付多少钱?步骤:100×0.8=80;80-10=70,答案70元。
自动提示工程(APE)
核心原理:让模型自己生成→评估→筛选提示,无人值守迭代
示例:1. 指令:生成3条“让模型把中文诗翻译成英文”的更好提示,并打分→选最高分提示再用。2. 循环:模型自动生成多种“总结”提示→在验证集测ROUGE→自动保留最优提示。
模板化/变量
核心原理:用占位符{{}}复用提示,批量或动态替换内容。
示例:1. 把下面句子翻译成英文:{{sentence}}。2. 为以下商品写10字广告语:{{product_name}}。
角色扮演
核心原理:先定义身份,再提问,激活对应领域知识子空间
示例:1. 你是一名资深营养师,请给出一日三餐低糖食谱。2. 扮演初中物理老师,用生活例子解释牛顿第三定律。
系列文章
【大语言模型】-- OpenAI定义的五个AGI发展阶段
【大语言模型】-- Fine-tuning 微调
【大语言模型】-- 私有化部署
【大语言模型】-- Prompt Engineering 提示工程
【大语言模型】-- Function Calling函数调用
【大语言模型】-- RAG
【大语言模型】-- Agent
【大语言模型】-- 一些概念
