当前位置: 首页 > news >正文

【评测】DuReader-Retrieval数据集之初体验

回到目录

【评测】DuReader-Retrieval数据集之初体验

上一篇[《【评测】推理和微调 “GTE文本向量-中文-通用领域-base”模型》 ](https://blog.csdn.net/u010593516/article/details/148312365) 微调不太成功,但是
数据集文件值得研究。

数据集结构

query: 问题

positive_passages: 正面答复(准确)

negative_passages: 负面答复(不准确)

具体案例解释

query:ps如何去掉衣服褶皱

positive_passages: 包括3个doc_id的准确答复,

negative_passages: 包括n个doc_id的不准确答复,答复基本是围绕我们日常穿的衣服的褶皱处理方法

在这里插入图片描述
实际文件里面这一个条目的negative_passages有好多好多的doc_id,问题来了,为什么需要在dataset里面标记这么多negative_passages呢?

本文结束

回到目录

相关文章:

  • 实验设计与分析(第6版,Montgomery)第5章析因设计引导5.7节思考题5.7 R语言解题
  • magic-api配置Git插件教程
  • 安装Arch Linux(实体机、干货)
  • Kubernetes 中部署 kube-state-metrics 及 Prometheus 监控配置实战
  • leetcode0954. 二倍数对数组-medium
  • CCPC shandong 2025 G
  • 双路物理CPU机器上安装Ubuntu并部署KVM以实现系统多开
  • 第二章支线一:影之殿堂 · 阴影与过渡魔法
  • 生成式人工智能:重构软件开发的范式革命与未来生态
  • 数据的类型——认识你的数据
  • Hibernate:Java持久层框架的高效应用
  • DMBOK对比知识点对比(2)
  • 江科大UART串口通讯hal库实现
  • Python reduce()函数详解:累积计算的艺术
  • 王树森推荐系统公开课 特征交叉01:Factorized Machine (FM) 因式分解机
  • N2语法 逆接
  • C++ 中 std::wstring::c_str() 的潜在风险与安全使用指南
  • Java类中各部分内容的加载执行顺序
  • 【Python Cookbook】迭代器与生成器(四)
  • 【运维实战】定时任务-crontab命令
  • 大型网站开发成本/国家免费培训网站
  • 国外做的好的网站/热门职业培训班
  • 在58同城做网站有生意吗/百度地图客服人工电话
  • 加快政务公开网站建设/深圳网络推广外包
  • 罗庄区建设局网站/今日刚刚发生新闻事件
  • 企业网站建设需要许可证吗/网站自助建站系统