当前位置：首页 > news >正文

十步法基于Vanna打造高效便捷的 SQL 生成与业务洞察工具

news 2025/10/23 12:28:51

一、引言

二、项目背景

三、系统架构与设计

四、核心功能模块详解

五、代码逻辑解析

构建项目和数据库

项目文件

配置documents_for_quantity文件

核心应用：

1. 导入必要的库

2. 定义全局变量

3. QwenLLM 类：封装模型调用

4. MyVanna 类：结合问答与向量存储

5. 初始化问答对象

6. 加载数据和术语

7. 文件监听：动态更新术语

8. 辅助函数

9. Gradio 界面

10. 启动应用

演示效果和功能介绍

总结：

针对Vanna的讲解和基础操作参考第一篇：用了都说好！Vanna，助力高速实现Text2SQL技术_vanna 实时反馈-CSDN博客

一、引言

在数据分析工作中，编写复杂 SQL 语句以及准确理解业务术语存在困难。本项目旨在开发一款基于 Vanna的智能问答与数据分析助手，简化 SQL 编写流程，提升数据分析效率和业务洞察力。通过自然语言处理技术，实现从问题到 SQL 的自动转换，并结合业务术语管理，为用户提供更好的数据分析体验。

在数据分析领域，高效准确地从数据库中提取信息是关键任务之一。传统方法要求用户具备专业的 SQL 知识，这限制了许多非技术背景用户的需求。同时，业务术语的理解差异也给数据分析带来了障碍。

二、项目背景

为解决这一难题，我们引入了 Vanna 框架。它结合了大型语言模型的强大自然语言处理能力和数据库交互功能。通过 Vanna 框架，用户只需用自然语言提问，系统就能自动生成 SQL 查询并执行，降低了数据查询的门槛。此外，Vanna 还支持业务术语定义管理，确保了数据分析过程中的语义一致性。这使得即使没有深厚技术背景的用户，也能轻松进行复杂的数据查询和分析，极大地提升了数据分析的效率和可访问性。

三、系统架构与设计

该智能问答与数据分析助手基于 Vanna 框架构建，整体架构分为三层。

应用层：为用户提供了一个直观的 Gradio 前端界面，用户可通过输入自然语言问题发起查询请求。

逻辑层：核心是 Vanna 框架集成的 QwenLLM 模型。用户问题经模型处理后转换为 SQL 查询，同时管理业务术语定义，确保语义准确性。

数据层：连接 MySQL 数据库，负责执行生成的 SQL 查询并返回结果，为上层提供数据支持。

系统设计简洁高效，各层协同工作，实现从自然语言问题到数据库查询的流畅转换，提升了数据分析的效率和易用性。

四、核心功能模块详解

SQL 生成与执行模块：用户在前端输入自然语言问题后，系统通过 QwenLLM 模型将问题转化为 SQL 查询语句。生成的 SQL 可在前端展示，用户确认后系统将其发送至后端，后端连接数据库执行查询，并将结果返回前端展示。若执行失败，会显示错误信息。

问答与回答生成模块：系统根据执行 SQL 查询得到的结果，利用 QwenLLM 模型生成自然语言回答。模型会依据提供的查询结果构建提示词，生成回答时还会融入物品名称或单词的中文翻译，使回答更贴合用户需求和业务背景。

业务术语定义与管理模块：支持加载、更新和删除业务术语定义。初始定义从文件加载，系统提供界面供用户更新或删除术语定义。更新时，先清空原有定义再重新加载；删除时，从术语定义数据结构中移除指定术语。

文件监控与热更新模块：采用 watchdog 库监控业务术语定义文件。文件修改时，触发 FileChangeHandler 类的 on_modified 方法，重新加载文件内容并更新术语定义，确保系统使用最新的业务术语定义，无需重启即可反映修改。

图表生成模块：根据查询结果生成图表。用户选择图表类型及 X、Y 轴列后，系统使用 Plotly Express 库生成相应图表，支持柱状图、折线图等类型，以直观展示数据趋势和分布，便于用户进行数据分析和可视化。

五、代码逻辑解析

构建项目和数据库

项目文件

vanna/
├── .venv/
│ ├── etc/
│ ├── include/
│ ├── lib/
│ ├── Scripts/
│ └── share/
├── .gitignore
├── pyvenv.cfg
├── 663c7487-e2c6-4de9-995a-a465107c4a1e/
├── c771f56a-5baf-4bf1-b9c8-b1e274b5babd/
├── fc9f1301-865c-452c-b7f7-7dd3451e6cbc/
├── sahema_for_quantity.sql # DDL存储位置
├── documents_for_quantity # documentations配置文件
└── vanna_demo.py # 运行文件

另外需要单独配置MySql数据库，可以参考我的DDL：

CREATE TABLE `products` (`ProductID` int NOT NULL,`ProductName` varchar(100) NOT NULL,`Description` varchar(100) NOT NULL,`Price` decimal(10,2) NOT NULL,`StockQuantity` int NOT NULL,`Productscol` varchar(45) NOT NULL COMMENT '商品表格',PRIMARY KEY (`ProductID`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci

然后填入数据：

这里就构建好了我们所需要的业务数据库了，解释一下，数据库里最重要的就是物品名称，价格和数量。