当前位置：首页 > news >正文

AI——提示词工程认识

news 2025/8/27 8:25:17

提示词工程

简介

聊天，提示词与提示词工程

聊天
与大模型聊天（Chat）是指用户通过自然语言与像ChatGPT这样的人工智能模型进行互动。这种互动通常是通过输入文本（问题，请求或对话）来实现的，模型会根据输入生成相应的回复。与大模型聊天的目的是获取信息，完成任务或进行娱乐性对话。用户不需要具备技术背景，只需用自然语言表达自己的需求即可。
提示词
提示词（Prompt）是用户输入给大模型的文本，用于引导模型生成特定的输出，从而完成特定的任务。提示词可以是一个问题，一个陈述句或一个不完整的句子，旨在为模型提供上下文或方向，以便生成更相关的回复。提示词的设计对生成结果的质量有很大影响，因此选择合适的提示词是与大模型互动的关键。

提示词工程
提示词工程（Prompt Engineering）是指设计和优化提示词的过程，以便从大模型中获得更准确或更有用的输出。提示词工程不仅涉及理解模型的工作原理，测试不用的提示词格式和内容，还包括分析模型的响应以改进提示词。随着技术的进步，提示词工程逐渐演变为一个复杂的“工程项目”，需要整合多种技术和方法，也衍生出了许多技巧和门派。
在提示词工程中，检索增强生成（RAG）技术被广泛使用，RAG结合了信息检索和生成模型的优势，通过从外部知识库中检索相关信息来增强生成模型的输出质量。这种方法可以显著提高模型的准确性和实用性，使得提示词工程更具挑战性和技术深度。
此外，**多智能体（Multi-Agent）**系统的引入为提示词工程提供了新的视角。通过多个智能体的协作，可以实现更复杂的任务分解和信息处理。这种方法不仅提高了提示词设计的效率，还增强了系统的灵活性和适应性。
类似 Coze 提供的工作流自动化也是提示词工程中的一个重要组成部分。通过自动化工具和流程，提示词工程师可以更高效地管理和优化提示词设计过程。这种自动化不仅减少了人为错误，还提高了整体工作效率，使得提示词工程更具系统性和可扩展性。
综上所述，提示词工程已经超越了简单的提示词设计，成为一个集成多种技术和方法的复杂工程项目。提示词工程师需要具备深厚的工程技术背景和对模型行为的深入理解，以便在这个快速发展的领域中有效地设计和优化提示词。

通过 API 访问大模型

以 OpenAI 的 Open API 为例，你可以通过调用 openai.ChatCompletion.create() API 访问大模型。其参数如下：

参数	说明
messages	messages 是一个 message 对象列表，其中每条消息都是一个字典，包含以下两个关键字段： 1. role：指定消息的角色，通常有以下几种： “system”：系统提示（System Prompt）。用于设置对话的初始条件或背景信息。通常用于定义助手的行为或个性。 “user”：表示用户输入的消息，有时也被用作“用户提示（User Prompt）”来使用。 “assistant”：表示助手生成的响应。在一些特殊的提示词技巧中，我们会通过模拟大模型的输出，来进一步优化生成的结果。 2. content：包含实际的文本或多媒体（如图片、音频、Word、Excel、PDF 等文件）内容，即用户或助手的消息内容或文件。
temperature	temperature 参数用于控制生成文本的随机性和多样性，参数值越小，模型就会返回越确定的一个结果。它是一个浮点数，通常在 0 到 1 之间。具体来说：低温度（接近 0）：生成的文本更具确定性和一致性。模型会倾向于选择概率最高的词语，因此输出通常更为保守和可预测。这适用于需要精确和一致回答的场景。高温度（接近 1）：生成的文本更具随机性和多样性。模型会选择概率较低的词语，因此输出可能更具创意和多样性。这适用于需要创造性和多样化回答的场景。
top_p	top_p 参数是用于控制生成文本的多样性和随机性的另一种方法，通常与 temperature 参数结合使用。top_p 采用的是一种称为“核采样”（nucleus sampling）的技术。 top_p 与 temperature 的区别：虽然两者都用于控制生成文本的随机性，但 temperature 是通过调整词的选择概率来实现的，而 top_p 是通过限制候选词的集合来实现的。
n	指定生成多少个独立的响应。通过设置 n，用户可以一次性获得多个不同的生成结果，以便进行比较或选择。
max_length	max_length 参数用于指定生成文本的最大长度。它定义了模型在生成响应时可以输出的最大标记（token）数量。这个参数对于控制生成内容的长度和计算资源的使用非常重要。
stop	用于指定一个或多个停止标记。当生成的文本包含这些标记时，生成过程会提前终止。这对于控制输出的结束条件非常有用。例如，如果你需要大模型只生成代码，可将 stop 设置为“```”代码块结束符时，停止输出。

提示词的要素

⚙️ 指令
通常包括执行的特定任务描述或指令，好的指令应该包含有条理的需求、限制条件以及异常处理。
🧩 上下文
包含外部信息或额外的上下文信息，引导大语言模型更好地响应。
✉️ 输入数据
用户输入的内容或问题，因此又被称为“用户提示（User Prompt）”。
📤 输出指示
指定输出的类型及格式，通常还会包含输出的一个或多个样例。
🌐 我们推荐所有的提示词都用 Markdown 格式表示，建议使用英文。

🛠️ 必备技能

1. Zero-shot, One-shot 与 Few-shot Learning

在提示工程中，**样本（Shot）**通常指代输出样例。像豆包、GPT-4 这样的大语言模型，经过大量数据训练并调优提示词能够较好的执行零样例任务。
然而，尽管大语言模型在零样本提示下能够生成令人满意的结果，但在输出控制、输出稳定性以及处理较为复杂的任务时仍然存在一定的局限性。这主要是因为在缺乏具体上下文或示例的情况下，这些模型可能难以准确把握用户的意图或理解任务的复杂性。
大语言模型具有非常强大的模仿、推理和仿写能力。因此，提供一份或多份示例提示仍然是目前最简单且有效的提示工程方法之一。通过示例提示，模型可以更好地理解任务要求，从而提高输出的准确性和一致性。这种方法不仅有助于增强模型的表现，还能在一定程度上减少生成结果的随机性，使其更符合用户的期望。

2. 思维链（Chain of Thought）

思维链（Chain of Thought, CoT）是一种用于推理能力的方法，特别是在自然语言处理任务中。其核心思想是通过模拟人类的思维过程，将复杂问题分解为一系列更简单的步骤，从而更有效地解决问题。这种方法在处理需要多步推理或逻辑分析的任务时（如意图识别、解数学题等），尤为有用。
思维链的主要特点包括：

分步推理：将问题分解为多个步骤，每个步骤都相对简单且易于理解。这样可以帮助模型更好地理解问题的结构和逻辑关系
透明性：通过展示每一步的推理过程，思维链方法可以提高模型的透明性，使人类更容易理解模型的决策过程。
可解释性：由于每一步的推理都是显式的，思维链方法可以提高模型的可解释性，帮助识别和纠正潜在的错误。
思维链方法通常通过在训练数据中加入示例来实现，这些示例展示了如何将复杂问题分解为一系列简单的推理步骤。通过这种方式，模型可以学习到如何在面对类似问题时应用这种分步推理的方法。
然而，思维链需要更多的 Token 资源，消耗更多的算力和推理时间。

3. 实现常见的自然语言处理任务

大语言模型在自然语言处理领域展现出了卓越的能力。通过简单的提示，它们能够高效地完成多种任务。例如，在翻译方面，大语言模型可以在不同语言之间进行准确的转换，帮助人们跨越语言障碍，实现无缝交流。在文本润色方面，它们能够识别并改进语法错误、提升表达的流畅性，使文章更加优美和易于理解。
此外，大语言模型在仿写任务中也表现出色。它们可以根据给定的文本风格和主题，生成具有相似风格的新内容，满足创作者的多样化需求。在情感分析方面，这些模型能够识别文本中的情感倾向，帮助企业和研究人员更好地理解用户反馈和市场趋势。
关键词提取是另一个大语言模型擅长的任务。通过分析文本内容，它们能够识别出最能代表文章主题的关键词，帮助用户快速抓住文章的核心信息。这些能力使得大语言模型成为自然语言处理领域中不可或缺的工具，推动了相关技术的不断进步和应用的广泛普及。关键词提取还可以帮助我们从用户的输入中提取出搜索关键字，并调用搜索引擎获得相关的结果，即检索增强生成。

4. 检索增强生成（Retrieval-Augmented Generation, RAG）

**检索增强生成（Retrieval-Augmented Generation, RAG）**是一种结合信息检索和生成模型的技术，旨在提高生成式模型的准确性和信息丰富性。传统的生成模型（如GPT-3）在生成文本时主要依赖于训练数据中的知识，而检索增强生成通过引入外部知识库或文档库，能够在生成过程中动态获取相关信息，从而生成更为准确和上下文相关的内容。
RAG 的基本流程包括以下几个步骤：

检索阶段：在生成文本之前，系统会根据输入查询从一个大型的外部文档库中检索出与查询相关的文档或信息片段。这通常使用信息检索技术，如向量检索（如使用 ByteGraph）。
生成阶段：将检索到的相关文档或信息片段与原始输入一起传递给大语言模型，以生成最终的输出文本。大语言模型会利用这些附加信息来提高生成内容的准确性和相关性。
这种方法的优点在于：

增强知识覆盖：通过访问外部知识库，生成模型可以利用最新的信息，而不局限于训练数据。
提高准确性：检索到的相关信息可以帮助生成模型避免常识性错误或过时的信息。
灵活性：可以根据不同的任务或领域，动态调整检索的文档库，以适应不同的需求。
RAG 在问答系统、对话系统和内容生成等领域有广泛的应用，尤其是在企业内部需要高准确性和实时信息的场景中表现出色。

查看全文

http://www.dtcms.com/a/351902.html