当前位置: 首页 > news >正文

Dify框架下的基于RAG流程的政务检索平台

项目需求:

项目需要实现对于41个公司规章制度文件的检索,输出检索出自文件名称、命中的问题答案内容,并且保证原始规章制度的格式输出,不允许加工修改。

项目方案:

模型使用DeepSeek-R1-70B基于ollama搭建,平台基于Dify搭建,RAG基于Dify中成熟的流程引擎实现。对于用户的提问首先进行知识库检索,输出的内容分2个分支,第一个分支进入LLM大模型,第二个分支进入代码执行模块提取出出处标题和内容。两个分支同时进入变量聚合器实现2个分支结果的合并,最终进入结束节点,输出最终结果。

提示词prompt:

你是一个系统助手,使用以下内容作为你学习的知识。

<context>

</context>

回答用户的问题时,如果在知识库中可以找到与问题最相关的原文,就输出原文内容;如果在知识库中找不到,就说不知道。

知识库构建:

在知识库的构建过程中,文章分段采用通用的分段模式,分段最大长度4000,重叠长度50。然后人工对人段结果进行修正微调。索引模式采用向量检索+全文检索这样的混合检索模式,其中向量检索Embedding 模型使用bge-large-zh-v1.5,排序Rerank 模型使用bge-reranker-large模型,其他参数TopK设置为0,阈值为0.7。

http://www.dtcms.com/a/53107.html

相关文章:

  • 计算机毕业设计Python+DeepSeek-R1大模型微博的话题博文及用户画像分析系统 微博舆情可视化(源码+ 文档+PPT+讲解)
  • JPA编程,去重查询ES索引中的字段,对已有数据的去重过滤,而非全部字典数据
  • ETL系列-数据加载(Load)
  • MCU-缓存Cache与CPU中的主存SRAM
  • WPF框架---MvvmLight介绍
  • 大模型——模型上下文协议 (MCP)
  • 懒加载预加载
  • pyqt实现yolov8主界面和登录界面以及数据库
  • 轻量级语义分割算法:演进与创新
  • 基于全局拓扑图和双尺度图Transformer的视觉语言导航
  • 深度融合,智领未来丨zAIoT 全面集成 DeepSeek,助力企业迎接数据智能新时代
  • Qt6.8.2创建WebAssmebly项目使用FFmpeg资源
  • 文件操作(详细讲解)(2/2)
  • 使用LSTM对2D pose sequence进行行为分类
  • 计算机毕业设计Python+Django+Vue3微博数据舆情分析平台 微博用户画像系统 微博舆情可视化(源码+ 文档+PPT+讲解)
  • html css网页制作成品——非遗文化京剧网页设计(5页)附源码
  • DeepSeek安全:AI网络安全评估与防护策略
  • 大模型 LoRA
  • 对WebSocket做一点简单的理解
  • Halcon:HObject与opencv:Mat互转
  • Linux下安装elasticsearch(Elasticsearch 7.17.23)
  • 出现FullGC的排查思路
  • MATLAB程序介绍,三维环境下的IMM(交互式多模型),使用CV和CT模型,EKF作为滤波
  • 如何在web页面下做自动化测试?
  • OCR识别技术在集装箱号码识别中的应用
  • LLM run
  • 利用Postman和Apipost进行API测试的实践与优化-动态参数
  • SpringMvc的设计模式
  • Blazor-全局路由跳转事件
  • 污酸提铼系统提升改造工艺