当前位置：首页 > news >正文

【第6篇】引入高配大模型

news 2025/10/18 15:12:00

返回目录

【第6篇】引入高配大模型

比赛相关介绍参见《2025年羊城工匠杯nl2sql比赛介绍》。

开发环境配置参见《nl2sql2025开发环境配置》

本文介绍向量、关键字、重排序等方式匹配到问题对应的库表后，构造提示词使用qwen3-235B高配大模型，生成自然语言问题对应的SQL脚本。

一、如何触发高配大模型生成SQL脚本

src/query/get_sql_answer.py 是构造提示词的关键程序，其中触发高配大模型的逻辑在 Line 36 ：if table_define is None and llm==“high”:

如果通过问题经过模板化处理后，无法匹配到相关库表信息，并且使用高配大模型参数调用（llm=high），那么就调用 query_ddl(question) 提取问题对应的库表ddl信息

首先，我们模拟这是一个新问题，无法正常命中到问题模板，手工删除tmp_question2sql.json文件 Line 4：“各受理渠道工单所占的百分比分别是多少？”
在这里插入图片描述

$ python ./src/query/get_sql_answer.py --query_text "请问2024年各受理渠道工单所占的百分比分别是多少？" --debug --llm high

使用上面命令行运行程序，如下图，可以看到高配大模型在没有案例、仅通过库表的DDL定义，推理出自然语言问题对应的SQL脚本。
在这里插入图片描述

经过评估程序测算，对于逻辑较为简答的level1和level2级问题，高配大模型的准确率可以达到70%以上。

二、寻找问题对应库表的挑战

使用高配对话大模型生成SQL脚本最大的挑战是如何根据自然语言问题，找到对应的库表。

1. src/query/query_ddl.py：调用query_vector.py获得的topK 记录，再调用query_rerank.py，返回table_define 给 get_sql_answer.py

2. src/query/query_vector.py：根据问题question，调用嵌入模型，确定topK最可能的库表集合

3. src/query/hit_keywords.py：根据手工维护的 data/keywords.txt 关键字表，返回问题与库表业务关键字重叠最多的记录

4. src/query/query_rerank.py：根据query_vector.py返回的filtered_docs调用重排序模型，确定唯一的一张库表

三、提示词优化的挑战

1. src/utils.py：构造提示词的模板程序

在这里插入图片描述

这一块逻辑比较简单，把自然问题、库表结构、扩展提示词和案例提示词拼接起来，后续提供给大模型使用。

2. src/query/build_extra_hint.py：特殊问题question需要提示大模型的约束或者案例说明

在这里插入图片描述

这部分代码写得不优雅，逻辑上直接通过问题关键字，增加提示词，如果重构，可以考虑新增 data/hint.txt文件，集中管理。

【本文结束】

查看全文

http://www.dtcms.com/a/491328.html

嵌入式计算机AF208：自动化装配管理集成方案核心

五台县建设局网站有ip地址如何做网站

数码产品商城网站建设网上推广赚钱方法

数智时代的软件架构峰会

展板模板网站河东网站建设公司

快手编程大模型真实水平，本地部署，实测

如何在AutoCAD中进行GIS空间查询？

旧电脑变废为宝：打造低成本网络打印机服务器全记录

EF Core 导航属性赋值的一种方式

做实验流程图的网站必应搜索引擎入口官网

做那个的网站谁有wordpress用户信息修改

VMware虚拟机安装文档

分布式专题——46 ElasticSearch高级查询语法Query DSL实战

Spring Boot核心功能深度解析

麒麟系统使用-使用Sublime浏览小说

【2025年10月一区SCI】Experience Exchange Strategy 经验交换策略（EES），优化算法改进新方法！-附Matlab免费代码

渭南建网站如何建立官方网站

Azure Cobalt 100 VM：以卓越性能与能效优化云端工作负载

【泛3C篇】AI深度学习在手机背板外观缺陷检测应用方案

OpenAI Sora 2 现已在Azure AI Foundry 公共预览中开放

外贸网站推广渠道网站录入

**Unreal引擎中的发散创新思维：探索创新与优化之路**随着游戏

h5游戏免费下载：电子木鱼

h5游戏免费下载：《飞跃的奶酪》

网站速度对seo的影响羽毛球赛事在哪里看

阿里云渠道商：阿里云CDN怎么进行配额优化？

自行车零部件尺寸自动化三维测量快速尺寸测量-中科米堆CASAIM

帮人恶意点击网站岳阳做网站费用

希尔排序解析

水果网站系统的建设与实现人才招聘网站开发背景

【第6篇】引入高配大模型

比赛相关介绍参见 《2025年羊城工匠杯nl2sql比赛介绍》。

开发环境配置参见《nl2sql2025开发环境配置》

本文介绍向量、关键字、重排序等方式匹配到问题对应的库表后，构造提示词使用qwen3-235B高配大模型，生成自然语言问题对应的SQL脚本。

一、如何触发高配大模型生成SQL脚本

src/query/get_sql_answer.py 是构造提示词的关键程序，其中触发高配大模型的逻辑在 Line 36 ：if table_define is None and llm==“high”:

如果通过问题经过模板化处理后，无法匹配到相关库表信息，并且使用高配大模型参数调用（llm=high），那么就调用 query_ddl(question) 提取问题对应的库表ddl信息

二、寻找问题对应库表的挑战

1. src/query/query_ddl.py： 调用query_vector.py获得的topK 记录，再调用query_rerank.py，返回table_define 给 get_sql_answer.py

2. src/query/query_vector.py： 根据问题question，调用嵌入模型，确定topK最可能的库表集合

3. src/query/hit_keywords.py： 根据手工维护的 data/keywords.txt 关键字表，返回问题与库表业务关键字重叠最多的记录

4. src/query/query_rerank.py： 根据query_vector.py返回的filtered_docs调用重排序模型，确定唯一的一张库表

三、提示词优化的挑战

1. src/utils.py： 构造提示词的模板程序

2. src/query/build_extra_hint.py： 特殊问题question需要提示大模型的约束或者案例说明

相关文章：

比赛相关介绍参见《2025年羊城工匠杯nl2sql比赛介绍》。

1. src/query/query_ddl.py：调用query_vector.py获得的topK 记录，再调用query_rerank.py，返回table_define 给 get_sql_answer.py

2. src/query/query_vector.py：根据问题question，调用嵌入模型，确定topK最可能的库表集合

3. src/query/hit_keywords.py：根据手工维护的 data/keywords.txt 关键字表，返回问题与库表业务关键字重叠最多的记录

4. src/query/query_rerank.py：根据query_vector.py返回的filtered_docs调用重排序模型，确定唯一的一张库表

1. src/utils.py：构造提示词的模板程序

2. src/query/build_extra_hint.py：特殊问题question需要提示大模型的约束或者案例说明