当前位置: 首页 > news >正文

数据集结构说明(Dataset)

 数据集结构说明(Dataset)

文件名作用说明内容类型适合映射到 GraphRAG 的节点/边
Instruction.json主任务输入文件,包含自然语言需求(prompt)与目标说明,是模型生成代码的输入。JSON 数组,每项含有 instruction_id, prompt, language, tags可转为节点 Prompt,与漏洞、修复等节点建立 TRIGGERS 边。
Standard.json基准场景(无投毒)的生成样本,包含模型响应、评测结果、安全检测信息。各条记录含 instruction_id, model_output, code, vuln_detected, cwe_id, fix_hint可生成 VulnerableSnippet 节点,并通过 HAS_CWE, FIXED_BY 边连接到 CWE 和 Fix 节点。
Standard_Def.json上述文件的定义文件,记录字段名、说明、统计范围,用于解析。字段描述 JSON可忽略,不用于图构建。
Poisoning_I.json / Poisoning_II.json投毒攻击实验下的样本,展示在模型输入被污染(恶意样本)时的生成结果。结构类似 Standard.json,但包含攻击信息,如 poison_trigger, malicious_payload, attack_type同样生成 VulnerableSnippet 节点,可额外建立 POISONED_BY 边(连接到 PoisonTrigger 节点)。
Poisoning_I_Def.json / Poisoning_II_Def.json投毒场景字段定义文件。定义说明可忽略。
Broken_instruct.json含错误或无效指令的任务,用于评估模型对异常输入的鲁棒性。instruction, error_type, response可用于节点 BrokenPrompt 或作为质量控制样本。
ReposVul.jsonl真实项目的漏洞函数信息,通常来自数据集 PrimeVul/DiverseVul。每行一条 JSON,含 project, file_path, function, cwe, patch_commit, vuln_code, fix_code是构建 Neo4j 图的核心:ProjectFunctionVulnerableSnippetFixSnippetCWE 节点都可以从这里提取。
Root_Causes.json手工总结的漏洞根因与修复模式,支持 RAG 检索。包含 cwe_id, root_cause, fix_pattern, example_code可建为 RootCause 节点,与 CWEFixSnippet 形成 EXPLAINS 边。
http://www.dtcms.com/a/602433.html

相关文章:

  • C语言源程序经过编译
  • 建设工程英语网站单位做网站费用怎么记账
  • 做网站需要注册什么类型的公司台州市建设施工图审图网站
  • 文献——总结
  • spring多配置文件
  • 数据结构与算法篇-Prim最小生成树算法
  • 北京网站设计制作过程网站举报后还是没封掉
  • 手机端网站需要多少钱高端网站建设上
  • 互动营销型网站建设wordpress 全站搜索
  • 配色相关网站建个企业网站备案需要多长时间
  • 山西网站建设找哪家平谷网站建设服务
  • 多模态大模型应用开发:从CLIP到GPT-4V的实战演进
  • 青岛网站建设比较好河北省正定县城乡建设网站
  • 理解BFGS算法
  • 易语言反编译技巧 | 深入解析反编译原理与实用方法
  • 家居企业网站建设讯息王者荣誉网站怎么做
  • 免费个人网站域名注册建设机械网站方案
  • 网站建设网页制作软件河南企业网站定制
  • 做网站设计图用什么软件wordpress多个菜单menu
  • 人工智能训练师证书怎么考?
  • 【RAG核心维度深度解析】评估、安全、可靠性、管理及技术方案权衡
  • 【MCP安全】MCPGuard : Automatically Detecting Vulnerabilities in MCP Servers
  • 有专门做ppt的网站有哪些wordpress评论qq
  • 自己做的网站如何包装wordpress接入微信登录
  • 单位不能建设网站网站怎么做黑链接
  • Java在线编译C语言 | 实时运行与调试工具指南
  • GPU 发展简史:图形处理到通用计算的蜕变
  • 客户要做网站建设话术网站如何提高转化率
  • 外贸平台网站有哪些网站 关键词 怎么改
  • 四、nginx的优化和location匹配规则