当前位置: 首页 > news >正文

手机网站被自动跳转阳江赶集网

手机网站被自动跳转,阳江赶集网,给几个手机网站,手机网站建设过程RAG基本步骤 parse:将pdf,doc,ppt等file解析成文本,如markdown。有基本的metadata。chunk:将markdown文本进行分块,比如按大小分,语义分等。可以为每个块添加更丰富的metadata。index&#xff1…

RAG基本步骤

  1. parse:将pdf,doc,ppt等file解析成文本,如markdown。有基本的metadata。
  2. chunk:将markdown文本进行分块,比如按大小分,语义分等。可以为每个块添加更丰富的metadata。
  3. index:将每个分块使用embedding model转换为向量,存储到vector db中,方便后续检索。
  4. retrieve:将user query也用embedding model转换为向量,连接vector db进行相似度搜索,rerank等找到和query最相关的top k个块。
  5. generate:根据上一步返回的最相关块和user query结合,调用llm进行生成。一般会有些后处理。

123步会在user上传知识库文件后执行,45步会在user对知识库进行问答时执行。


我们使用llamaindex完成rag整个过程,此外还需要:

  • minio: object store,存储文件
  • pgvector: vector db,存储embedding向量
  • docker env(非必须)

llamaindex提供了high level的RAG实现,但是我们需要更好的灵活性,所以会用更低层的API来做

  1. 需要设计五个base类,覆盖5个步骤的基础功能
  2. 每个base类有具体实现,能够实现对应功能
  3. 实现类按顺序串联,即可形成pipeline执行QA。其中index和retrieve通过db config保持一致
  4. 每个步骤可作为一个service

代码等忙完再整理

http://www.dtcms.com/a/610836.html

相关文章:

  • 芋道vue3 内网无法显示icon问题解决
  • 国内金融机构数据分类分级建设方案——实践路径、落地要点与平台选型建议
  • 汕头建站网站信息系统设计
  • 物理层信道编码与5G编码技术介绍
  • Python3 循环语句
  • 网站制作过程合理步骤是什么成年培训班有哪些
  • AI一周资讯 251108-251114
  • 如何解决 Linux 文件系统挂载失败的问题?
  • 网站是做流程图怎么向谷歌提交网站
  • 唐山做网站优化怎样理解网站建设与开发这门课
  • c++零基础通关教程第一课
  • 国产RISC-V MCU/SoC芯片推荐
  • 【Linux】 调试器gdb
  • @RequestBody 和 @ResponseBody 的使用场景
  • 做学校网站导航条应该有哪些住房和城乡建设部网站统计
  • 杭州 网站建设公司排名全flash网站制作
  • 建站宝盒手机版下载做农产品的网站
  • 数仓练习的最佳实践扩展(一)
  • 电子商务网站的建设要求知名企业官网
  • Gauge的小坑
  • ss网站代码太原做网站公司运营
  • 湖北手机版建站系统信息wordpress判断函数
  • 桂林有名网站制作公司旅游网站推荐
  • 用discuz做的网站建站官网
  • SpringBoot-38-开发实战(五)SS+JPA+Thymeleaf+Bootstrap+iframe+jQuery+AJAX
  • 网站部署设计公众号商城制作价格
  • 怎样做网站框架图怎么查看网页源代码
  • 公司门户网站设计商城网站验收标准
  • 【javaEE】多线程——线程安全初阶☆☆☆
  • 机器视觉的卷对卷不干胶标签丝印应用