当前位置: 首页 > news >正文

DeepSeek+Graphrag检索增强

用于增强的文章为一篇机器学习的文章,以及本人自己的论文

对于此感兴趣的可私聊我,过多细节不便展示

实现方法

  • 图构建
    • 数据收集:收集与检索相关的各种数据,如文本、图像、元数据等。
    • 实体识别和关系抽取:从收集的数据中识别出实体(如人物、组织、产品等),并抽取它们之间的关系。例如,使用自然语言处理技术从文本中提取人物的隶属关系、产品的品牌关系等。
    • 图的构建:将识别出的实体作为节点,抽取的关系作为边,构建图结构。
  • 检索扩展
    • 基于图的关键词扩展:根据图中节点和边的信息,对用户的检索关键词进行扩展。例如,在学术图中,如果用户搜索 “深度学习”,系统可以根据图中 “深度学习” 与 “神经网络”、“卷积神经网络” 等的关联关系,将这些相关关键词也纳入检索范围。
    • 图的路径搜索:在图中搜索与检索关键词相关的路径,找到潜在的相关结果。例如,在知识图谱中,通过搜索从问题实体到答案实体的路径,找到准确的答案。
  • 模型训练
    • 图神经网络(GNN):使用 GNN 对图进行建模和学习,提取节点和边的特征表示。例如,将 GNN 应用于学术图,学习论文、作者等节点的特征,从而提高检索的准确性。
    • 排序模型:训练排序模型,根据图的信息和节点特征对检索结果进行排序。例如,使用深度学习模型,结合图的结构信息和文本特征,对检索到的论文进行排序,将最相关的论文排在前面。

graphrag/graphrag at main · microsoft/graphrag · GitHub

以下是生成的知识图谱:

相关文章:

  • 【0010】Python流程控制结构-分支结构详解
  • [machine learning] MACS、MACs、FLOPS、FLOPs
  • 第三章 指令系统
  • K8s控制器Deployment详解
  • 小程序是否支持SSE
  • 《量子潮涌下,DataWorks中AI模型训练框架的变革征途》
  • 极狐GitLab 17.9 正式发布,40+ DevSecOps 重点功能解读【二】
  • C#批量压缩并上载CSV数据文件到Box企业云盘
  • 统一数据返回格式
  • IDEA入门及常用快捷键
  • AI-Deepseek + PPT
  • 用Python之requests库调用大模型API实现多轮对话
  • Vulnhub-Hackme靶机
  • centos7服务器 Java和Hadoop安装教程,用VMware和finalshell
  • 2025东方财富笔试考什么?cata能力测评攻略|答题技巧真题分享
  • 浙江省一体化数字资源系统(IRS)介绍(七个方面展开)
  • PHP之字符串拼接
  • vscode远程ssh链接服务器
  • 内网环境下如何快速下载大模型
  • 【Python爬虫】利用代理IP爬取跨境电商AI选品分析
  • 奥迪车加油时频繁“跳枪”维修两年未解决,4S店拒退换:可延长质保
  • 人民日报评外卖平台被约谈:摒弃恶性竞争,实现行业健康发展
  • 继71路之后,上海中心城区将迎来第二条中运量公交
  • 哈马斯表示已释放一名美以双重国籍被扣押人员
  • 通辽警方侦破一起积压21年的命案:嫌疑人企图强奸遭反抗后杀人
  • 侧记|青年为何来沪创新创业?从这一天寻找答案