当前位置：首页 > news >正文

【速通RAG实战：生成】8.智能生成引擎：大模型与Prompt工程黄金指南

news 2025/7/1 19:52:29

在 RAG（检索增强生成）系统中，生成环节是将检索到的相关信息与大语言模型相结合，为用户生成准确、有用回答的关键步骤。
而 Prompt 提示工程则是引导大模型输出高质量结果的重要手段。

1.RAG生成流程

RAG的典型流程分为四步：

1.用户查询输入 → 2. 检索相关文档 → 3. 融合检索结果与查询 → 4. 生成最终输出。

经过 RAG 索引流程对外部知识的解析及向量化，RAG 检索流程语义相似性的匹配及混合检索，系统进入 RAG 生成流程。
生成流程中，首先需要组合指令，指令将携带查询问题及检索到的相关信息输入到大模型中，由大模型理解并生成最终的回复，从而完成整个应用过程。
在这里插入图片描述

RAG 的本质是通过为大模型提供外部知识来增强其理解和回答领域问题的能力。

1.大模型与RAG

大模型在 RAG 系统中起到大脑中枢的作用，尤其在面对复杂且多样化的 RAG 任务时，大模型的性能直接决定了整个系统的效果和响应质量，可以说大模型是整个系统的大脑。

2.提示词工程与RAG

提示词工程是生成流程中的另一关键环节。通过有效的指令的设计和组合，可以帮助大模型更好地理解输入内容，从而生成更加精确和相关的回答。

2.大模型在 RAG 生成中的作用

核心地位：大模型是RAG系统的“大脑”，负责整合检索结果并生成精准回答。
发展历程：
- ChatGPT（OpenAI）引领AI 2.0时代，推动大模型进入繁荣期。
- 国内大模型：文心一言、通义千问、Qwen系列、Baichuan、ChatGLM等各具优势。

1. 理解查询与检索信息

大模型具备强大的语言理解能力，能够分析用户的查询意图，同时对检索模块提供的相关文本信息进行综合理解。
例如，当用户查询“人工智能在医疗影像诊断中的应用有哪些挑战”，大模型可以理解查询的核心是关于人工智能在医疗影像诊断应用中的挑战，并从检索到的文档中提取与该主题相关的信息。

2. 知识整合与推理

大模型可以将检索到的零散信息进行整合，结合自身预训练学到的知识进行推理。
比如，检索到的文档中分别提到了数据隐私问题、算法准确性问题以及硬件计算能力限制等方面与人工智能医疗影像诊断相关的内容，大模型能够将这些信息进行组织和推理，形成一个完整的关于挑战的回答。

3. 生成自然流畅的回答

大模型擅长生成自然语言文本，它可以将整合和推理后的信息以清晰、流畅的语言表达出来，符合人类的阅读和交流习惯。
输出的回答可以是结构化的列表形式，也可以是段落式的详细阐述，根据查询的性质和要求进行灵活调整。

3.常见大模型选择

选型维度：
- 开源 vs 闭源：数据敏感场景选开源（如Qwen），快速开发选闭源（如通义千问）。
- 参数规模：复杂任务用大参数模型（如Qwen-72B），轻量场景选小模型（如Qwen-1.8B）。
- 部署环境：国内场景优先本地化模型（如ChatGLM），避免合规风险。

1. OpenAI 的 GPT 系列

特点：具有强大的语言生成能力和广泛的知识覆盖，在各种自然语言处理任务中表现出色。例如，GPT - 4 能够处理复杂的语言理解和生成任务，对语义的把握和逻辑推理能力较强。
应用场景：适用于对回答质量要求较高、需要处理复杂问题的 RAG 系统，如专业知识问答、智能客服等领域。

2. Meta 的 LLaMA 系列

特点：开源的大语言模型，具有一定的性能表现，并且可以在本地进行部署，对于一些有数据安全和隐私要求，不适合使用外部 API 的场景较为友好。
应用场景：适合企业内部的知识库问答系统、特定领域的智能助手等，用户可以根据自身需求对模型进行微调。

3. 国产大模型（如百度文心一言、字节跳动云雀等）

特点：针对中文语言和本土应用场景进行了优化，在中文处理方面可能具有更好的表现，同时部分模型还结合了国内的行业知识和数据。
应用场景：适用于中文内容的生成和问答，在国内的电商客服、政务咨询等领域有较好的应用前景。

4. Transformer模型原理

Google 在 2017 年发表的论文《Attention Is All You Need》，引入了 Transformer 模型，它是深度学习领域的一个突破性架构，大型语言模型的成功得益于对 Transformer 模型的应用。

Transformer 模型的核心创新在于位置编码和自注意力机制。
网图侵权必删
Transformer 模型由编码器和解码器两部分组成。编码器负责理解输入信息的顺序和语义，解码器则输出概率最高的词元。

核心机制：
- 自注意力（Self-Attention）：捕捉词元间全局依赖，优于传统RNN。
- 位置编码（Positional Encoding）：保留序列顺序信息。
架构优势：支持长上下文处理（如Qwen-14B扩展至8K Token），适合RAG的长文本生成需求。

5. Prompt 的概念及作用

Prompt 是向大模型提供的输入文本，用于引导大模型按照特定的要求和格式生成回答。
在 RAG 中，合理设计的 Prompt 可以帮助大模型更好地利用检索到的信息，生成更符合用户需求的结果。
网图侵权必删

6. 常见的 Prompt 设计策略

提供检索信息：在 Prompt 中明确给出检索到的相关文本，让大模型基于这些信息进行回答。
- 例如：

已知信息：在人工智能医疗影像诊断中，数据隐私是一个重要挑战。患者的医疗影像数据包含大量敏感信息，如果数据泄露，可能会对患者造成严重影响。另外，算法的准确性也有待提高，目前的算法在某些复杂疾病的诊断上还存在一定误差。
用户问题：人工智能在医疗影像诊断中的应用有哪些挑战？
回答：

限定回答要求：通过在 Prompt 中添加一些限定条件，如回答的字数、格式、语言风格等，来规范大模型的输出。
- 例如：

已知信息：……
用户问题：……
要求：回答不超过 200 字，分点列出。
回答：

提供示例（Few - Shot Prompting）：给出一些类似问题及对应的正确回答示例，让大模型学习示例的模式和风格，从而更好地生成回答。
- 例如：

示例 1：
已知信息：智能手机的电池续航能力一直是用户关注的问题。随着功能的不断增加，电池消耗速度加快。一些新技术如快充技术可以在一定程度上缓解这个问题。
问题：智能手机电池方面存在什么问题，如何缓解？
回答：
1. 问题：电池续航能力不足，随着功能增加电池消耗快。
2. 缓解方法：采用快充技术。已知信息：在人工智能医疗影像诊断中，数据隐私是一个重要挑战。患者的医疗影像数据包含大量敏感信息，如果数据泄露，可能会对患者造成严重影响。另外，算法的准确性也有待提高，目前的算法在某些复杂疾病的诊断上还存在一定误差。
用户问题：人工智能在医疗影像诊断中的应用有哪些挑战？
回答：

设定角色（Role - Playing Prompting）：为大模型设定一个特定的角色，如专家、客服等，让其以该角色的视角进行回答，使回答更具专业性和针对性。
- 例如

你是一位人工智能医疗影像诊断领域的专家。
已知信息：……
用户问题：……
回答：

7. Prompt 优化与迭代

Prompt 的设计不是一次性完成的，需要根据实际应用中的反馈不断进行优化和迭代。可以通过人工评估生成结果的质量，分析回答中存在的问题（如回答不准确、不完整、格式不符合要求等），然后调整 Prompt 的内容和结构，以提高大模型的输出质量。

8. 提示工程（Prompt Engineering）技巧

核心元素：指令（Instruction）、上下文（Context）、输入数据（Input Data）、输出格式（Output Indicator）。
实战技巧：

技巧	示例	作用
具体指令法	“总结市场趋势，按Markdown输出：- 趋势 - 政策影响 - 风险”	明确任务目标，减少模糊性
示例学习	提供分析模板：“示例1：趋势：政策放宽→贷款增长”	引导模型模仿示例生成答案
默认回复策略	“若文档无相关内容，返回{无法回答}”	避免模型“幻觉”，确保事实性
角色设定	“角色：银行业专家；任务：生成趋势分析；限制：仅基于报告数据”	提升回答专业性与一致性
解释理由法	“生成摘要，原因：读者可查阅原文”	增强模型对任务背景的理解

9. 实战代码示例

调用大模型生成回答（以Qwen为例）：

from dashscope import Generationdef generate_answer(query, context):prompt = f"""根据以下上下文回答问题：{context}问题：{query}回答要求：简洁、基于事实，若无法回答则返回“无相关信息”。"""response = Generation.call(model="qwen-max",prompt=prompt,api_key="YOUR_API_KEY")return response.output.text

提示工程优化：

# 示例学习提示
examples = """
示例1：
- **趋势**：政策放宽促进贷款增长。
- **政策影响**：新利率政策影响中小企业融资。
示例2：
- **趋势**：数字化转型加速。
- **政策影响**：数据安全法规增加合规成本。
"""
prompt = f"{examples}\n请按示例分析以下报告：{report_text}"