当前位置: 首页 > news >正文

vanna+deepseek+chainlit 实现自然语言转SQL的精度调优

先说目前遇到的问题吧,单表数据SQL 生成准确度是可以的,但是复杂SQL以及多表联查时,生成的SQL就一言难尽了。

目前的解决方案:

一、数据训练后台

创建后台来管理三类训练数据,DDL 、SQL、DOC文档。

使用三个集合,来分别管理这三类数据

添加训练SQL:

二、前端与用户交互,询问是否将本次对话加入到训练库中

前端与用户交互,询问是否将本次对话加入到训练库中,如果确认,则给用户回显当前训练库中相似度最高的前3条SQL供用户预览,然后二次确认是否需要将本次对话加入到训练库中

三、对于复杂SQL 如多表查询

对于复杂SQL 如多表查询,生产SQL,主要是基于训练的SQL生成。

用户提问,然后对于训练库数据召回。

  • ≥99.5%相似度:直接使用训练库中的SQL
  • 80%-99.5%相似度:基于已有SQL让大模型微调
  • <80%相似度:正常生成流程(DDL+SQL+DOC交给大模型生成)

后续我会把源码放出来。。。

相关文章:

  • 构建 MCP 服务器:第 4 部分 — 创建工具
  • 【零基础 快速学Java】韩顺平 零基础30天学会Java[学习笔记]
  • 打造你的 Android 图像编辑器:深入解析 PhotoEditor 开源库
  • 用设计模式重新思考(类FSM)验证:从混乱到优雅
  • ES6——数组扩展之Set数组
  • [TIP] Ubuntu 22.04 配置多个版本的 GCC 环境
  • 第7篇:中间件全链路监控与 SQL 性能分析实践
  • 如何理解 IP 数据报中的 TTL?
  • 高效Excel合并拆分软件
  • 论文阅读:HySCDG生成式数据处理流程
  • 《ERP原理与应用教程》第3版习题和答案
  • MySQL安装与配置详细讲解
  • LINUX 66 FTP 2 ;FTP被动模式;FTP客户服务系统
  • Nestjs框架: nestjs-schedule模块注册流程,源码解析与定时备份数据库
  • Aspose.PDF 限制绕过方案:Java 字节码技术实战分享(仅供学习)
  • 飞云智能波段主图+多空短线决策副图指标,组合操盘技术图文解说
  • 预训练语言模型T5-11B的简要介绍
  • 【Dv3Admin】系统视图菜单字段管理API文件解析
  • 如何以 9 种方式将照片从手机传输到笔记本电脑
  • 智谱清言沉思智能体,天工智能体,agenticSeek等AI Agent测试记录
  • 郑州网站建设网站推广/网络营销活动策划方案模板
  • xml网站地图格式/搜狐财经峰会
  • 监控做直播网站/cfa三级和一二级关系大吗
  • 潍坊企业自助建站/百度关键词搜索次数
  • 免费商城建站平台/深圳网络推广大师
  • 罗湖网站建设报价/免费好用的网站