当前位置：首页 > news >正文

【NL2SQL(text2sql) 到底准不准】智能BI中生成sql模块的评测数据构造 + 评测办法

news 2025/10/16 20:56:58

写在前面

自然语言转 SQL (NL2SQL, 或 Text-to-SQL) 技术旨在将用户的自然语言问题自动转换为可在数据库上执行的 SQL 查询语句。这项技术是 GenBI (生成式商业智能) 的核心，也是连接自然语言处理 (NLP) 和数据库领域的一座桥梁。

然而，NL2SQL 模型的效果如何？它们生成的 SQL 查询到底准不准？为了回答这些问题，我们需要构建高质量的评测数据集，并采用科学的评测方法。

本文将深入探讨 NL2SQL 评测数据的构造方法 (包括收集、预处理) 以及常用的评测指标和计算方法，并提供丰富的代码示例，帮助读者全面了解 NL2SQL 模型的评估过程。

1. 评测数据构造

高质量的评测数据是客观评估 NL2SQL 模型性能的基础。评测数据的构造主要包括以下几个步骤：

1.1. 数据来源

公开数据集:
- Spider: 目前最常用的 NL2SQL 基准数据集，包含 10,181 个问题和 5,693 个独特的复杂 SQL 查询，涵盖 200 个不同领域的数据库。
- WikiSQL: 包含 80,654 个手工标注的自然语言问题、SQL 查询和表格数据，SQL 查询相对简单，主要涉及单表查询

http://www.dtcms.com/a/54733.html

相关文章：

在 ASP.NET Core 中启用 Brotli 和 Gzip 响应压缩

SpringBoot的启动流程是怎样的？

全志A133 android10 mipi屏幕调试

Git - 补充工作中常用的一些命令

字节青训营后端方向的个人总结（2025年3月4日）

SQL Server查询计划操作符（7.3）——查询计划相关操作符（9）

构建私有化AI知识库：基于CentOS的Ollama + DeepSeek-R1 +ragflow 整合部署教程

硬通货用Deekseek做一个Vue.js组件开发的教程

2025 DPIN AI+DePIN 巴厘岛峰会聚焦人工智能与去中心化的未来

QT——基于 QListWidget 和 QStackedWidget 的页面切换

数据库的安装（mysql）

使用jcodec库，访问网络视频提取封面图片上传至oss

苹果Siri升级遇阻，国行iPhone或将引入阿里、百度AI自救

‌PLC数据类型和‌C#数据类型的数据类型映射表

Windows操作系统日常操作--网络通信

Git清理本地残留的、但已经在服务器上被删除的分支

计算机毕业设计SpringBoot+Vue.js医院药品管理系统(源码+文档+PPT+讲解)

Pygame实现动画效果2-1

JavaScript数据类型转换

Pandas实现Excel的vlookup并且在指定列后面输出

STL——list的介绍和模拟实现

【新手入门】SQL注入之getshell（木马）

Java之JVM内存模型

Linux - 进程

运维Zabbix面试题及参考答案

一、数据库 MySQL 基础学习（上）

FineBI_实现求当日/月/年回款金额分析

LeetCode 2588.统计美丽子数组数目：前缀和 + 位运算(异或) + 哈希表

自动化同步多服务器数据库表结构

2025年渗透测试面试题总结-字某某动-安全研究实习生（二面）（题目+回答）