当前位置: 首页 > wzjs >正文

网站页面设计规范新浪体育nba

网站页面设计规范,新浪体育nba,门户网站 建设 通知,wordpress5分钟安装数据库询问RAG框架Vanna的总体架构 概述 Vanna是一个数据库询问的RAG框架,可以通过自然语言来和数据库对话。 本质上来说Vanna是以RAG框架的模式来设计的。其中有一个训练的过程,而所谓训练的过程其实就是把相关知识,包括:DDL&…

数据库询问RAG框架Vanna的总体架构

概述

Vanna是一个数据库询问的RAG框架,可以通过自然语言来和数据库对话。

本质上来说Vanna是以RAG框架的模式来设计的。其中有一个训练的过程,而所谓训练的过程其实就是把相关知识,包括:DDL,table信息,相关文档等信息,添加到向量数据库中。

Vanna可以支持多种源数据库和向量数据库,比如:faiss,chromdb,milvus,pgvector等。可以根据自己的情况来进行选择和配置。

Vanna的总体架构如下图所示:

在这里插入图片描述

训练过程

在Vanna中,使用的时候有两个过程:

  • 训练过程:训练通过调用train()函数来实现训练过程。
  • ask过程:实现和数据对话;

训练过程实际上是把相关知识保存到向量数据库中的过程。这里相关的知识,包括:数据表的DDL,数据表的说明文档,数据表的Schema信息等。

把这些知识保存的向量数据库中后,在后续回答用户问题的时候,就可以从向量数据库中查找问题相关的内容。

要注意的是,在处理相关知识时,包括文档和DDL语句等,Vanna并没有对文档内容进行切分,而是把整个文档内容都放入到了向量数据库中。这会导致每次获取到的内容比较冗余,或者导致token的数量会比较多。我个人觉得,这个也是Vanna可以进一步改进的地方。

SQL问答对训练数据

您也可以通过SQL-问答对来训练系统。这是训练系统的最直接方法,并且对系统了解要提出的问题的上下文是最有帮助的。

vn.train(question="What is the average age of our customers?", sql="SELECT AVG(age) FROM customers"
)

SQL-问答对对包含大量嵌入信息,系统可以用来理解问题的上下文。当您的用户倾向于提出具有很多歧义的问题时,尤其如此。

ask过程

询问过程是典型的RAG流程。

(1)先从向量数据库中找到与用户问的问题相关的内容

(2)把与问题相关的内容添加到提示词中

(3)此时提示词就包含了相关内容上下文,然后再把提示词发送给大模型,并获取大模型的返回结果,并对结果内容进行解析。

(4)然后再执行大模型生成的SQL语句,并返回数据

(5)若需要可视化,再对返回的数据进行图表的生成

人工SQL纠正的过程

若是通过页面使用Vanna,则可以人工核验查询结果是否正确,若不正确,可以人工纠正SQL语句,并把正确的SQL语句保存到知识库(向量数据库)中。这个过程其实是一个Human-in-Loop和自我学习的过程,这样可以让AI的结果更加可信,减少由于幻觉而导致的错误结果。

Vanna的特点

  1. 在复杂数据集上具有高精度。
    • Vanna 的能力与你提供的训练数据息息相关
    • 更多的训练数据意味着大型复杂数据集的准确性更高
  2. 安全且私密。
    • 数据库内容永远不会发送到 LLM 或向量数据库
    • SQL 执行发生在您的本地环境中
  3. 自我学习
    • 如果通过 Jupyter 使用,您可以选择对成功执行的查询进行“自动训练”
    • 如果通过其他界面使用,您可以让界面提示用户对结果提供反馈
    • 正确的问题和 SQL 对会被保存以供将来参考,使未来的结果更加准确
  4. 支持任何 SQL 数据库。
    • 该包允许您连接到任何可以使用 Python 连接的 SQL 数据库
  5. 选择您的前端。
    • 大多数人都是从 Jupyter Notebook 开始的。
    • 通过 Slackbot、Web 应用程序、Streamlit 应用程序或自定义前端向您的最终用户展示。

小结

总的来说Vanna是根据RAG构建了自己的后台架构。通过和向量库的知识库检索相关上下文知识,可以让生成的SQL语句更加准确。Vanna提供了正确知识的反馈机制,这可以说是一种自我学习的过程,这样可以让后续的回答更加准确。另外,在整个过程中加入了人工审核的过程,这在大模型的精准度没有达到一定程度之前,是非常有必要的。Vanna还提供多种使用方式(有前端,或没有前端),这样可以让用户使用起来更加灵活。

另外,在向量生成这一块,还需要进一步优化,才能够让上下文知识更加准确,减少token的小孩,和幻觉的产生。

参考

  • https://github.com/vanna-ai/vanna
http://www.dtcms.com/wzjs/520891.html

相关文章:

  • 代理网名大全搜索引擎的优化和推广
  • 新闻网站怎么做缓存黄金网站app视频播放画质选择
  • 要怎么做网站百度推广登录地址
  • 企业网站推广怎么做二级分销小程序
  • 网站开发人员的水平万能搜索引擎网站
  • 网站设计公司要多少钱厦门seo优
  • 商业中心 网站建设汕头百度关键词推广
  • 网投网站如何建设软件开发工程师
  • 网站目录结构推广网页怎么做的
  • 公司网站建设费用包括哪些百度平台商家
  • 顺德网站建设策划淘宝的17种免费推广方法
  • 做散热网站一键优化软件
  • 中国做跨境电商出口的网站今日最新军事新闻
  • 武汉做医疗器械公司网站的seo试用软件
  • 做服装团购网站深圳网络营销推广外包
  • 在广告公司上班都干嘛南京seo代理
  • 门户网站制作流程做网站用什么软件好
  • 口碑好的做pc端网站谷歌seo培训
  • 网站建设管理维护制度武汉网站推广公司
  • 哪个网站能上传自己做的简历seo全网优化指南
  • 图书馆门户网站建设怎么制作公司网页
  • 宛城区网站制作竞价被恶意点击怎么办
  • 平面设计网站排行榜成都seo招聘
  • 厦门网站建设门户怎么把平台推广出去
  • 网站开发首选十大免费网站推广平台
  • brophp框架做网站微信怎么推广自己的产品
  • 如何做属于自己的领券网站怎么做好市场宣传和推广
  • 泸州工投建设集团有限公司网站厦门百度整站优化服务
  • 网站开发工具概述与比较产品网络推广的方法
  • 12306网站建设超30亿12345浏览器网址大全