当前位置: 首页 > news >正文

【第6篇】引入高配大模型

返回目录

【第6篇】引入高配大模型

比赛相关介绍参见 《2025年羊城工匠杯nl2sql比赛介绍》。

开发环境配置参见《nl2sql2025开发环境配置》

本文介绍向量、关键字、重排序等方式匹配到问题对应的库表后,构造提示词使用qwen3-235B高配大模型,生成自然语言问题对应的SQL脚本。

一、如何触发高配大模型生成SQL脚本

src/query/get_sql_answer.py 是构造提示词的关键程序,其中触发高配大模型的逻辑在 Line 36 :if table_define is None and llm==“high”:

如果通过问题经过模板化处理后,无法匹配到相关库表信息,并且使用高配大模型参数调用(llm=high),那么就调用 query_ddl(question) 提取问题对应的库表ddl信息

首先,我们模拟这是一个新问题,无法正常命中到问题模板,手工删除tmp_question2sql.json文件 Line 4:“各受理渠道工单所占的百分比分别是多少?”
在这里插入图片描述

$ python ./src/query/get_sql_answer.py --query_text "请问2024年各受理渠道工单所占的百分比分别是多少?" --debug --llm high

使用上面命令行运行程序,如下图,可以看到高配大模型在没有案例、仅通过库表的DDL定义,推理出自然语言问题对应的SQL脚本。
在这里插入图片描述

经过评估程序测算,对于逻辑较为简答的level1和level2级问题,高配大模型的准确率可以达到70%以上。

二、寻找问题对应库表的挑战

使用高配对话大模型生成SQL脚本最大的挑战是如何根据自然语言问题,找到对应的库表。

相关程序逻辑:

1. src/query/query_ddl.py: 调用query_vector.py获得的topK 记录,再调用query_rerank.py,返回table_define 给 get_sql_answer.py

2. src/query/query_vector.py: 根据问题question,调用嵌入模型,确定topK最可能的库表集合

3. src/query/hit_keywords.py: 根据手工维护的 data/keywords.txt 关键字表,返回问题与库表业务关键字重叠最多的记录

4. src/query/query_rerank.py: 根据query_vector.py返回的filtered_docs调用重排序模型,确定唯一的一张库表

query_ddl.py query_vector.py hit_keywords.py query_rerank.py retrieve_similar_texts(question) hit_keywords(query_text, filtered_docs) hitIndexs filtered_docs query_reranker(filtered_docs in request_body) table_define query_ddl.py query_vector.py hit_keywords.py query_rerank.py

三、提示词优化的挑战

相关程序逻辑:

1. src/utils.py: 构造提示词的模板程序

在这里插入图片描述

这一块逻辑比较简单,把自然问题、库表结构、扩展提示词和案例提示词拼接起来,后续提供给大模型使用。

2. src/query/build_extra_hint.py: 特殊问题question需要提示大模型的约束或者案例说明

在这里插入图片描述

这部分代码写得不优雅,逻辑上直接通过问题关键字,增加提示词,如果重构,可以考虑新增 data/hint.txt文件,集中管理。

【本文结束】

http://www.dtcms.com/a/491328.html

相关文章:

  • 嵌入式计算机AF208:自动化装配管理集成方案核心
  • 五台县建设局网站有ip地址如何做网站
  • 数码产品商城网站建设网上推广赚钱方法
  • 数智时代的软件架构峰会
  • 展板模板网站河东网站建设公司
  • 快手编程大模型真实水平,本地部署,实测
  • 如何在AutoCAD中进行GIS空间查询?
  • 旧电脑变废为宝:打造低成本网络打印机服务器全记录
  • EF Core 导航属性赋值的一种方式
  • 做实验流程图的网站必应搜索引擎入口官网
  • 做那个的网站谁有wordpress用户信息修改
  • VMware虚拟机安装文档
  • 分布式专题——46 ElasticSearch高级查询语法Query DSL实战
  • Spring Boot核心功能深度解析
  • 麒麟系统使用-使用Sublime浏览小说
  • 【2025年10月一区SCI】Experience Exchange Strategy 经验交换策略(EES),优化算法改进新方法!-附Matlab免费代码
  • 渭南建网站如何建立官方网站
  • Azure Cobalt 100 VM:以卓越性能与能效优化云端工作负载
  • 【泛3C篇】AI深度学习在手机背板外观缺陷检测应用方案
  • OpenAI Sora 2 现已在Azure AI Foundry 公共预览中开放
  • 外贸网站推广渠道网站录入
  • **Unreal引擎中的发散创新思维:探索创新与优化之路**随着游戏
  • h5游戏免费下载:电子木鱼
  • h5游戏免费下载:《飞跃的奶酪》
  • 网站速度对seo的影响羽毛球赛事在哪里看
  • 阿里云渠道商:阿里云CDN怎么进行配额优化?
  • 自行车零部件尺寸自动化三维测量快速尺寸测量-中科米堆CASAIM
  • 帮人恶意点击网站岳阳做网站费用
  • 希尔排序解析
  • 水果网站系统的建设与实现人才招聘网站开发背景