当前位置: 首页 > wzjs >正文

购物网站开发需要什么软件番禺人才网招聘网

购物网站开发需要什么软件,番禺人才网招聘网,竞价网站做推广方案,德清网站公司建设一、怎么进行一个自然语言to SQL评估? 1.DB——准备可用的数据表 2.准备问题集,自然语言|正确的预期SQL 3.大模型执行完成的SQL 4.Table.json——一个存储表格数据或者数据库表结构信息的 JSON 文件。当前是存储的表结构信息的,存储数据库…

一、怎么进行一个自然语言to SQL评估?

1.DB——准备可用的数据表

2.准备问题集,自然语言|正确的预期SQL

3.模型执行完成的SQL

4.Table.json——一个存储表格数据或者数据库表结构信息的 JSON 文件。当前是存储的表结构信息的,存储数据库表的元数据,例如表名、列名、列类型、主键、外键等信息。


二、获取Spider数据集,以及评估代码

https://yale-lily.github.io/spider 

个人理解:如有错误请指出

baselines\ :包含不同基线模型的代码和文档。
- nl2code\ :可能是一个将自然语言转换为代码的基线模型目录。
- seq2seq_attention_copy\ :包含序列到序列注意力复制模型的代码和脚本。
- sqlnet\ :包含 Modified SQLNet 基线模型的代码和文档。
- typesql\ :包含 Modified TypeSQL 基线模型的代码和文档。
evaluation_examples\ :包含评估示例文件。
preprocess\ :包含数据预处理的脚本和文档。
evaluation.py :用于评估模型的 Python 脚本。
process_sql.py :用于处理 SQL 查询的 Python 脚本。


三、以上调试成功后,执行命令结果

python evaluation.py --gold [gold file] --pred [predicted file] --etype [evaluation type] --db [database dir] --table [table file]arguments:[gold file]        gold.sql file where each line is `a gold SQL \t db_id`[predicted file]   predicted sql file where each line is a predicted SQL[evaluation type]  "match" for exact set matching score, "exec" for execution score, and "all" for both[database dir]     directory which contains sub-directories where each SQLite3 database is stored[table file]       table.json file which includes foreign key info of each database

[gold file] 提供了正确的 SQL 答案和对应的数据库标识,而 [predicted file] 包含了模型生成的 SQL 预测结果,二者共同用于模型评估。

[evaluation type]:这是对不同评估方式的分类。

  • -match(精确集合匹配得分):当使用 “match” 评估类型时,主要关注的是被评估对象与给定集合在元素上的精确匹配程度。例如在文本处理中,判断一段文本中的词汇集合是否与标准词汇集合完全一致,根据匹配的程度来计算得分。
  • -exec(执行得分):“exec” 评估类型侧重于对某个操作、程序或任务执行结果的评估。比如在代码执行场景下,根据代码执行是否成功、执行结果是否符合预期等方面来计算得分。
  • -all(两者兼具):选择 “all” 意味着同时考虑精确集合匹配得分和执行得分,综合这两个方面来对对象进行评估。
[table file] 指的是 一个名为 table.json 的文件,该文件包含了每个数据库的外键信息。

四、结果分析

各难度样本数量

count 行展示不同难度级别样本数量,easy250 个,medium440 个,hard174 个,extra170 个,总计 1034 个。评估指标

exact match(完全匹配准确率)

衡量预测 SQL 与标准 SQL 完全一致的比例。各难度级别分别为easy0.852medium0.720hard0.718extra0.388 ,整体为 0.697 。数值越高,完全匹配情况越好,extra难度下表现较差,说明复杂场景完全匹配难。

partial matching(部分匹配相关指标 )

  • 准确率(Accuracy):判断预测 SQL 中特定子句(如select where等 )正确的比例。如select子句在easy难度准确率 0.996 hard难度 1.000 ,反映不同难度下子句预测正确性。
  • 召回率(Recall):关注标准 SQL 中特定子句被正确预测出的比例。如where子句在medium难度召回率 0.854 ,体现对标准子句的捕捉能力。
  • F1 值(F1):综合准确率和召回率的指标。如group(no Having)子句在all难度下 F1 0.996 ,越高说明子句预测综合表现越好。

文章转载自:

http://fS7mu3H9.cffwm.cn
http://d9J1IWQm.cffwm.cn
http://FRKGvBKt.cffwm.cn
http://cYgaVA4J.cffwm.cn
http://gwnjn8Ib.cffwm.cn
http://BTvDX3vE.cffwm.cn
http://KY2ECPid.cffwm.cn
http://jB2EGeTn.cffwm.cn
http://FrO28r5v.cffwm.cn
http://I40AYRgp.cffwm.cn
http://pEz8P9M1.cffwm.cn
http://KUe92YJy.cffwm.cn
http://sSmNBamI.cffwm.cn
http://34SsbjnR.cffwm.cn
http://YcGYYIIu.cffwm.cn
http://kszsI9YI.cffwm.cn
http://uP2flkqv.cffwm.cn
http://LVGeoffZ.cffwm.cn
http://ZDJO9T09.cffwm.cn
http://hQzQzbkO.cffwm.cn
http://aNqOkjD1.cffwm.cn
http://HyfjS167.cffwm.cn
http://IQJullU8.cffwm.cn
http://CogCIWWi.cffwm.cn
http://6CcTvpLf.cffwm.cn
http://QpdOpHQv.cffwm.cn
http://9bw7iVCW.cffwm.cn
http://uSZZDunz.cffwm.cn
http://oqUqbA45.cffwm.cn
http://KaHhPclP.cffwm.cn
http://www.dtcms.com/wzjs/640234.html

相关文章:

  • 延安网站建设北京兼职做网站推广
  • 中牟高端网站建设燕郊做网站
  • 网络营销企业网站推广健康陕西app管理端
  • 企业网站栏目规划的重要性装修土巴兔
  • wordpress网站统计代码cad室内设计
  • 做结婚视频储存网站网站兼容性代码
  • .net 网站开发网络营销的特点全球性
  • 专业做网站哪家便宜深圳画册设计品牌
  • 网站建设 小程序济宁专业网站制作公司
  • 免费自己做网站手机永久免费建站网站
  • 有关于做茗茶的网站国际贸易进出口
  • 免费的网站建设有哪些公众号排名优化软件
  • 网站建设项目公告社交网站是怎么做的
  • 对网站设计的建议沈阳市建设工程信息网
  • 网站建设用什么代码自己做的网站出现左右滑动条
  • 潍坊网站外包大众网站平安建设之星
  • 长沙做网站的包吃包住4000东莞网站的建设
  • 专业网站设计流程图新手如何制作一个网页
  • 郑州正规的网站建设价格西安seo王尘宇
  • 5000做网站wordpress换域名了 登陆不了
  • 万州工程建设招投标网站设计素材网站无版权
  • 宁波咨询网站设计柳州市建设工程质量安全监督管理处网站
  • 网站开发安装湖南网站推广营销设计
  • 四川网站建设seo优化网站建设 方案下载
  • 西部数码网站管理系统定制工作服
  • 网站建设知名公司龙岗做企业网站
  • 北京通网站建设价格域名可以做网站
  • 郴州免费招聘网站网站卖掉被拿来做网站了
  • 无锡高端网站建设装修免费咨询
  • 网站建设中 显示网站互动设计方式