当前位置: 首页 > news >正文

LLM Text2SQL NL2SQL 实战总结

目录

尽量全面的描述表的功能

尽量全面的描述字段的功能

适当放弃意义等价的字段

放弃业务上无用的字段


对于LLM来说,由于它没有什么行业经验,所以我们需要尽可能的给予它恰当的“背景信息”,才能使它更好的工作。所谓恰当,不是越多越好,因为太多的信息会消耗掉LLM的可接受上下文大小,同时也可能会造成LLM信息理解混乱。因此,笔者从实践中总结了以下几条数据库“背景信息”整理原则,用于提高LLM生成SQL语句的正确率:

尽量全面的描述表的功能

  • 以业务视角描述表的功能含义,表的描述文字尽量与常用的业务数据契合。比如:这是一张学生信息表。

  • 包含表中拥有的核心字段信息。如:包括,学生的学号,姓名,年龄,性别,班级ID...。这些信息可以有效帮助LLM判断回答问题时,是否要检索这张表。

  • 描述表的关联性,如果当前表与其它表有关联性,需要描述表的关联性。比如:本表通过班级ID与班级表相关,班级表的ID字段是班级ID的外键。这种描述方便LLM了解表之间的结构。

相关文章:

  • MongoDB数据库深度解析:架构、特性与应用场景
  • 呼叫中心高可用方案:全方位保障客服业务持续稳定
  • 7、MinIO服务器简介与安装
  • Python3 简易DNS服务器实现
  • Python机器学习笔记(二十三 模型评估与改进-网格搜索)
  • 20、工业协议转换与数据采集中间件 (模拟) - /数据与物联网组件/protocol-converter-middleware
  • 全球宠物经济新周期下的亚马逊跨境采购策略革新——宠物用品赛道成本优化三维路径
  • IP防护等级举例解析
  • 专项智能练习(加强题型)-DA-02
  • websocket入门详解
  • 【Ubuntu】安装BitComet种子下载器
  • 远程实时控制安卓模拟器技术scrcpy
  • 基于EtherCAT与ABP vNext 构建高可用、高性能的工业自动化平台
  • 软考 系统架构设计师系列知识点之杂项集萃(60)
  • Metagloves Pro+Manus Core:一套组合拳打通虚拟制作与现实工业的任督二脉
  • 【笔记】CosyVoice 模型下载小记:简单易懂的两种方法对比
  • Trae 插件 Builder 模式:从 0 到 1 开发天气查询小程序,解锁 AI 编程新体验
  • 康复训练:VR 老年虚拟仿真,趣味助力恢复​
  • IP地址查询可以了解到哪些宿主信息
  • SpringBoot 自动装配流程
  • “16+8”“生酮饮食”,网红减肥法究竟靠谱吗?
  • 李公明︱一周书记:当前科学观中的盲点、危机与……人类命运
  • 巴菲特谈卸任CEO:开始偶尔失去平衡,但仍然保持敏锐的头脑,仍打算继续工作
  • 青海省交通运输厅副厅长田明有接受审查调查
  • 美国务院批准向土耳其出售导弹及相关部件,价值3.04亿美元
  • 国家林业和草原局原党组成员、副局长李春良接受审查调查