当前位置: 首页 > news >正文

“Datawhale AI夏令营”「结构化数据的用户意图理解和知识问答挑战赛」1

前言:本篇文章是Datawhale AI夏令营2025年第2期的内容,大模型技术方向,科大讯飞「结构化数据的用户意图理解和知识问答挑战赛」的赛事项目实践。

  1. 理解用AI理解列车信息表,究竟有哪些难点和价值
  2. 具体要如何判断AI是否真的理解了列车信息表
  3. 基于列车信息表,使用大模型构建QA对

一、本次赛事目标:让大模型理解表格数据(列车信息表)

知识点提要表结构数据处理、微调数据集构造、模型蒸馏

相关知识点清单:

学习模块

核心知识点

一句话介绍

大语言模型基础

大模型 API 调用方法

学习如何通过 API 使用大语言模型,发送请求并获取结果。

Prompt 工程

掌握如何编写有效的提示词,引导模型输出期望的结果。

参数高效微调

LoRA 和合并精调的区别

了解 LoRA(低秩适配)与合并精调在模型微调中的不同原理和使用场景。

全量微调

对整个模型的所有参数进行训练,以适应特定任务或数据集。

数据集构建

pandas 的基本使用

学习使用 pandas 进行数据读写、整理和基础操作。

pandas 的数据筛选

掌握 pandas 中按条件筛选和提取数据的方法,如 loc、iloc 和布尔索引等。

赛事背景

在智慧交通平台中,乘客和调度人员需快速从庞杂的列车时刻表中获取精准信息(如检票口位置、停留时间、跨车次关联)。

传统方法依赖人工查询和分析,效率低且难以应对复杂问题。

大模型在表格理解方面已经取得了显著的进展,正在帮助用户以更直观、更高效的方式处理和解释数据。

本次赛事聚焦 铁路运输场景 ,基于真实列车时刻表数据,要求参赛者 构建能够理解表格语义、处理时间计算、跨字段推理的大模型 问答系统 ,提升信息查询自动化水平。

赛题解读

本次大赛提供了结构化数据表格(列车时刻表)作为数据集,参赛者需基于讯飞星辰MaaS平台构建一个人工智能模型。

该模型能基于给定表格中的结构化数据,结合表格内容提取信息并回答指定的问题。

赛事任务分为两个阶段:

  1. 让模型学习如何解析和表示表格数据。【生成可用于微调的QA对】

  2. 回答与表格数据对应的自然语言问题。【微调,让大模型掌握这个表格的知识并进行回答】

该模型应具备自然语言处理(NLP)能力,能够理解用户自然语言问题中的意图(如查询始发站、终到站、检票口等),以支持多种问题类型,例如:

七类问题

 赛题要点与难点

核心要点

  1. 数据预处理:时间格式标准化、缺失值处理、数据质量提升是基础。

  2. 模型选择与微调:必须支持LoRA精调,且避免使用LoRA合并精调或全量精调(可能产生额外费用)。需要平衡模型大小与性能。

  3. 评估指标优化

    • 答案准确率(AS):40%权重

    • 回答响应时长(ART):30%权重

    • 回答信息传达效率(AE):30%权重

    • 注意:响应时长和信息传达效率的得分以答案准确率为前提,若答案错误,则单条得分直接为零。

    • 由于评分指标中有30%关于模型的速度,采用更大参数量或者深度思考的模型可能会导致ART分值变低。

主要难点

  1. 复杂问题的处理

    • 多条件组合查询(如同时筛选候车厅和发车时间)。

    • 跨行数据计算(如计算不同列车运行时间并比较)。

    • 时间计算与推理(如停留时长、延误后新开点时间)。

  2. 性能优化:在保证准确率的同时,如何提升模型的响应速度和答案生成效率,找到准确率与速度之间的最佳平衡点。

  3. 数据构建挑战:由于平台限制,需要自行构建高质量、多样化的微调数据集来教会模型理解复杂的表格语义和进行推理。

http://www.dtcms.com/a/300237.html

相关文章:

  • 使用Clion开发STM32(Dap调试)
  • 基于华为ENSP的OSPF数据报文保姆级别详解(3)
  • LeetCode——1695. 删除子数组的最大得分
  • TI MSPM0蓝牙串口通信数据包制作
  • C++11 -- emplace、包装器
  • 标准库开发和寄存器开发的区别
  • nfls dp 刷题 题解
  • AutoCAD_2025下载与保姆级安装教程
  • 【安全漏洞】防范未然:如何有效关闭不必要的HTTP请求方法,保护你的Web应用
  • cursor使用方法
  • MGER作业
  • Python 面向对象基础
  • 26考研英语词汇的逻辑笔记
  • 【PCIe 总线及设备入门学习专栏 5.1.3 -- PCIe PERST# 时序要求】
  • 从治理到共情——平台伦理的乡村共建之路
  • DeepSeek-LLM模块解析
  • 多项目终端环境初始化开发环境方案
  • 【RHCSA 问答题】第 10 章 配置和保护 SSH
  • cacti漏洞CVE-2022-46169的复现
  • 界面规范2-列表上
  • NTLite Ent Version
  • 文件IO——bmp图像处理
  • GRE、MGRE实验
  • 机器学习(重学版)基础篇(概念与评估)
  • 算子推理是什么
  • GStreamer中Pipeline(管道)
  • 速通python加密之base64
  • 《C++》模板详解
  • odoo代码分析(二)
  • 一键实现推送服务:Docker部署ntfy开源通知系统指南