当前位置: 首页 > news >正文

自训练NL-SQL模型

使用T5小模型在笔记本上训练 nature language to SQL/自然语言 转SQL
实测通过。

本文介绍了如何在笔记本上使用T5小模型训练自然语言转SQL的任务。主要内容包括:1) 创建Python 3.9环境并安装必要的依赖包;2) 通过Hugging Face镜像下载wikisql数据集和T5-small模型;3) 实现数据预处理函数,将自然语言问题转换为SQL查询语句;4) 优化训练过程,包括截断条件和批量处理以提高内存效率。实验表明,该方法在有限计算资源下可行,适合个人开发者和小规模项目尝试。

##############################################

创建环境 建议用python3.9

##############################################

#list all conda environment
conda env list

#deactive 现有环境
conda deactivate
conda remove --name py312_test --all

#创建一个新环境
conda create -n py39_test python=3.9
conda activate py39_test

#requirment.txt 见文章最下方

##############################################

开始安装

##############################################
#pip
pip install torch transformers pandas datasets

#curl
curl -I https://hf-mirror.com/datasets/Salesforce/wikisql

先尝试从wiki下载SQL set

import os
os.environ[“HF_ENDPOINT”] = “https://hf-mirror.com”

from datasets import load_dataset

指定版本(如 “refs/convert/parquet” 是官方维护的稳定分支)

dataset = load_dataset(
“Salesforce/wikisql”,
trust_remote_code=True,
revision=“refs/convert/parquet”
) # dataset 保存在 C:\Users\ASUS.cache\huggingface\datasets
print(dataset[“train”][0]) # 查看数据结构

install torch

pip uninstall numpy -y
pip install numpy1.26.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install torch
2.1.0 --extra-index-url https://download.pytorch.org/whl/cpu -i https://pypi.tuna.tsinghua.edu.cn/simple

import numpy as np
print(f"NumPy 版本: {np.version}“) # 应输出 1.26.0
import torch
print(f"PyTorch 版本: {torch.version}”) # 输出 2.1.0+cpu
print(f"是否为 CPU 版本: {not torch.cuda.is_available()}") # 输出 True(无 GPU 时)

#install sentencepiece
pip install sentence

相关文章:

  • webpack优化方法
  • Linux系统之----磁盘硬件
  • 【C++进阶篇】红黑树的封装(赋源码)
  • 线程池实战——数据库连接池
  • Python中字典(dict)知识详解应用
  • Vue.extend
  • CentOS7更新 GLIBC 2.25
  • 区块链可投会议CCF C--APSEC 2025 截止7.13 附录用率
  • ISO 26262-5 区分失效模式
  • 阿里千问系列:Qwen3技术报告解读(下)
  • 英语科研词汇现象及语言演变探讨
  • 用 Python 构建自动驾驶的实时通信系统:让车辆“交流”起来!
  • YOLOV8涨点技巧之空间通道协作注意力(SCCA)-应用于自动驾驶领域
  • 类欧几里得算法(floor_sum)
  • git 把一个分支A的某一个 commit 应用到另一个分支B上
  • LLM 使用本地模型 提取新生成 文本 的token ID序列
  • 使用中文作为map的可以,需要注意什么
  • 差分数组知识笔记
  • java 加密算法的简单使用
  • 医学写作人才管理策略
  • 网站地市频道建设/seoul national university
  • 做网站如何下载别人网站图片/深圳网站设计公司排行
  • 电子商务网站建设可运用的技术/网络推广外包搜索手机蛙软件
  • 做网站的商标是哪类/优化大师win7官方免费下载
  • 用vs做购物网站代码/百度下载2021新版安装
  • wordpress菜单栏移动下移/seo搜索引擎