当前位置：首页 > news >正文

【评测】DuReader-Retrieval数据集之初体验

news 来源：原创 2025/5/31 16:08:46

回到目录

【评测】DuReader-Retrieval数据集之初体验

上一篇[《【评测】推理和微调 “GTE文本向量-中文-通用领域-base”模型》 ]（https://blog.csdn.net/u010593516/article/details/148312365) 微调不太成功，但是
数据集文件值得研究。

数据集结构

query: 问题

positive_passages: 正面答复（准确）

negative_passages: 负面答复(不准确)

具体案例解释

query：ps如何去掉衣服褶皱

positive_passages: 包括3个doc_id的准确答复，

negative_passages: 包括n个doc_id的不准确答复，答复基本是围绕我们日常穿的衣服的褶皱处理方法

在这里插入图片描述
实际文件里面这一个条目的negative_passages有好多好多的doc_id，问题来了，为什么需要在dataset里面标记这么多negative_passages呢？

本文结束

回到目录

实验设计与分析（第6版，Montgomery)第5章析因设计引导5.7节思考题5.7 R语言解题

magic-api配置Git插件教程

安装Arch Linux（实体机、干货）

Kubernetes 中部署 kube-state-metrics 及 Prometheus 监控配置实战

leetcode0954. 二倍数对数组-medium

CCPC shandong 2025 G

双路物理CPU机器上安装Ubuntu并部署KVM以实现系统多开

第二章支线一：影之殿堂 · 阴影与过渡魔法

生成式人工智能：重构软件开发的范式革命与未来生态

数据的类型——认识你的数据

Hibernate：Java持久层框架的高效应用

DMBOK对比知识点对比（2）

江科大UART串口通讯hal库实现

Python reduce()函数详解：累积计算的艺术

王树森推荐系统公开课特征交叉01：Factorized Machine (FM) 因式分解机

N2语法逆接

C++ 中 std::wstring::c_str() 的潜在风险与安全使用指南

Java类中各部分内容的加载执行顺序

【Python Cookbook】迭代器与生成器（四）

【运维实战】定时任务-crontab命令

大型网站开发成本/国家免费培训网站

国外做的好的网站/热门职业培训班

在58同城做网站有生意吗/百度地图客服人工电话

加快政务公开网站建设/深圳网络推广外包

罗庄区建设局网站/今日刚刚发生新闻事件

企业网站建设需要许可证吗/网站自助建站系统

【评测】DuReader-Retrieval数据集之初体验

数据集结构

query: 问题

positive_passages: 正面答复（准确）

negative_passages: 负面答复(不准确)

具体案例解释

query：ps如何去掉衣服褶皱

positive_passages: 包括3个doc_id的准确答复，

negative_passages: 包括n个doc_id的不准确答复，答复基本是围绕我们日常穿的衣服的褶皱处理方法

相关文章：