当前位置: 首页 > wzjs >正文

做网站找不到客户网站建设技术外包

做网站找不到客户,网站建设技术外包,css网页布局,杨凯做网站文章目录 实验效果一、提示词设计思路详解二、为什么这个提示词如此有效?1. 实体抽取能力增强2. 输出格式统一,利于自动化处理 三、实战案例演示四、输入文本放到提示词最后 在使用大模型处理多跳问题(multi-hop question)时&…

文章目录

    • 实验效果
    • 一、提示词设计思路详解
    • 二、为什么这个提示词如此有效?
      • 1. 实体抽取能力增强
      • 2. 输出格式统一,利于自动化处理
    • 三、实战案例演示
    • 四、输入文本放到提示词最后

在使用大模型处理多跳问题(multi-hop question)时,我们常常面临一个挑战:原始问题可能不够具体或缺乏关键实体信息,导致语义搜索系统难以准确检索到相关答案。为了解决这个问题,现在大家常使用问题改写,获取深层次的知识。下述是一套有效的问题改写提示词(prompt),专门用于“问题改写”阶段,帮助模型生成更清晰、更具实体导向的新问题。

这套提示词经过实际测试,效果不错。

实验效果

qwen-2.5-7B 作为问题改写的大模型。
在 hotpot 数据集上的测试,1000条数据构建向量数据库:

  • 直接使用用户问题在向量数据库中做召回TopK@10 hite_rate命中率 可以达到82%左右。
  • 使用问题改写后,TopK@10 + TopK@10 hite_rate命中率 可以达到91%左右。

其实 qwen-2.5-7B的问题改写能力不强,如果你不使用下述提示词,会发现很多问题改写都失败了,无法获得下一步的信息。但 一些强大的大模型比如 gpt-4o等大参数的模型表现很好。

使用下述问题改写的提示词达到的效果,可以与gpt-4o问题改写相媲美!

一、提示词设计思路详解

以下是我在项目中使用的提示词模板,专门用于引导大模型进行高质量的问题改写:

query_rewrite = """
You are given the following four elements:1. **Original Question**
2. **Relevant Supporting Text(s)**Your task is to **create a new, better question** that would help a semantic search system (like vector-based retrieval) find relevant information more accurately.### 🔍 Follow These Clear Steps:**Step 1: Understand the original question.**
Identify what the question is asking — focus on the key person, object, or event it refers to.**Step 2: Extract the key detail from the supporting text.**
Look carefully at the relevant text and **find the most important new information** — especially **names**, dates, roles, or titles.
👉 **You must include this key information in the new question.****Step 3: Create a natural follow-up question.**
Now, think of a new question that:* Focuses on the subject identified from the relevant text (e.g., a person).
* Moves the conversation toward what the original question was looking for (but in a clearer or more direct way).**Step 4: Write the new question clearly and completely.**
Your final question must:* **Include the key entity or name (e.g., a person) from the relevant text.**
* Be directly connected to the original topic.
* Make it easier for a search system to retrieve the right answer.### 🚫 Do Not:* Leave out key names or details that were introduced in the relevant text.
* Repeat the original question exactly.### ✅ Example (Just for Reference - Do Not Copy):If the original question was:> "Which team does the quarterback picked first in the 2010 draft play for?"And the relevant text tells us:> "Sam Bradford was taken first in the 2010 draft."Then your new question **must include 'Sam Bradford'** and could be something like:> "Which NFL team did Sam Bradford play for during the early 2010s?"### 🎯 Output Format:
1. A multi-step, logically coherent explanation showing your reasoning process.
2. A json block at the end containing the final inferred question.{{"new_question": "Your clearly written, specific, entity-rich question goes here."
}}### Input Format:
- Question: {user_question}
- Relevant Texts: {relevant_texts}
""".lstrip()

这个提示词的设计有几个关键点:

  1. 分步指导明确:从理解原问题、提取关键信息,到构造新问题,每一步都有清晰指引。
  2. 强调实体信息:要求必须包含从支持文本中提取的关键实体,如人名、地名等。
  3. 输出格式规范:以 JSON 格式返回结果,便于后续解析和集成到系统中。
  4. 示例辅助理解:通过一个具体例子帮助模型更好地理解任务目标。

二、为什么这个提示词如此有效?

根据我的实践观察,以下几点是该提示词成功的核心原因:

1. 实体抽取能力增强

多跳问题往往需要模型在多个文档之间跳跃推理,而原始问题通常模糊不清。通过要求模型从支持文本中提取关键实体(如人名、时间、地点等),可以显著提高问题的具体性。

例如,在“谁是2010年冠军?”这个问题中,如果支持文本指出“Sam Bradford 是 2010 年冠军”,那么新的问题就可以被改写为“Sam Bradford 效力于哪支 NFL 球队?”,这显然更容易被搜索引擎识别并定位答案,或者在向量数据库中检索。

2. 输出格式统一,利于自动化处理

在提示词中给了一个例子, 让大模型根据相关文本中的信息,完成原始问题中未知内容的替换

三、实战案例演示

我们来看一个具体的例子,感受一下这套提示词的实际效果:

原始问题
“《百年孤独》这本书的作者,还写过哪些书?”

相关文本
“加布里埃尔·加西亚·马尔克斯(Gabriel García Márquez)是哥伦比亚著名作家,他创作了《百年孤独》。”

按照提示词的步骤,模型会这样推理并生成新问题:

  1. 原问题询问的是《百年孤独》的作者,写过哪些书?
  2. 支持文本提供了关键信息:“Gabriel García Márquez 创作了这本书。”
  3. 新问题是:“Gabriel García Márquez 写过哪些著名小说?” 或者更精确地指向主题:“Gabriel García Márquez 的代表作是什么?”

这样改写后的问题不仅包含了关键实体,而且更适合搜索引擎检索,极大提高了找到正确答案的概率。


四、输入文本放到提示词最后

上述提示词是GPT生成的,GPT根据我的要求润色与修改提示词的能力特别强。国内相关的大模型,还是有差距。

我发现GPT在针对我的提示词润色、修改的过程中,频繁地把用户输入部分的文本放到最后。
一开始我没理解这样做的原因。

我认为,提示词先提到用户输入,再提到输出要求,更符合逻辑。

但是后面的实验经历告诉我,用户的输入部分的文本,非常推荐放到提示词的最后

本地模型在处理长文本时会启用截断机制(truncation),若输入部分的文本过长,那么提示词的输出要求部分就会被截断删除掉,模型就无法理解任务目标,从而出现无效输出甚至续写输入内容的情况。

因此,建议大家编写提示词时将 {user_question}{relevant_texts} 放在提示词末尾,确保该项任务的逻辑与输出要求不会被截断。

http://www.dtcms.com/wzjs/516475.html

相关文章:

  • 建站宝盒手机版下载市场营销方案怎么做
  • 做的网站首页图片显示不出来如何找客户资源
  • 做网站底色怎么选seo专业培训seo专业培训
  • 义乌建设网站优化关键词排名哪家好
  • 组建团队建设网站与开发需要多少钱公司网站建设服务
  • 做网站客服维护电话怎么打谷歌seo推广培训班
  • 用织梦做网站后面可以改吗百度竞价关键词价格查询
  • 集团网站建设多少钱阿里数据
  • 做网站收入太低谷歌搜索排名
  • 网站开发英文文献百度一下一下你就知道
  • 搞一个网站花多少钱童程童美少儿编程怎样收费
  • 网站建设要写代码吗sem推广计划
  • 网站开发与设计的实训报告torrentkitty搜索引擎
  • 公司网站后台怎么上传图片商丘seo外包
  • 网站建设与管理管理课程网站排名查询
  • 黄页88会员一年多少钱对seo的认识和理解
  • 模具公司网站中品质见证怎么做企业网络营销推广案例
  • 网站公司怎么做推广方案网站流量统计工具有哪些
  • 没有备案的网站 公司服务器 查到会怎么样公司网站建设全包
  • 网站开发准备流程百度入口
  • 淘客返利网站怎么做nba最新排名东西部
  • 长春火车站到龙嘉机场高铁时刻表seo的作用是什么
  • 网站制作先做数据库还是前台公司产品推广文案
  • 新加坡网站大全河北百度seo关键词
  • 装饰工程设计东莞网站建设超级seo工具
  • 佛山网站建设与设计公司seo综合查询系统
  • 西安高端网站建设哪家好百度引擎搜索入口
  • kuler 网站如何利用互联网进行宣传推广
  • html 动漫网站搜索引擎营销的优缺点及案例
  • 北京网站备案号查询优质友情链接