当前位置: 首页 > news >正文

深度学习-135-LangGraph之应用实例(四)构建RAG问答系统同时对文档进行元数据增强

文章目录

  • 1 文档处理
    • 1.1 网页内容加载
    • 1.2 文档智能分割
    • 1.3 元数据增强
      • 1.3.1 转换为Document
      • 1.3.2 增加元数据
  • 2 大语言模型
    • 2.1 一般输出
    • 2.2 结构化输出
  • 3 向量存储
  • 4 创建图
    • 4.1 可视化图
    • 4.2 调用图
  • 5 参考附录

使用langgraph构建一个智能文档检索系统。该系统能够从网页中提取信息,进行智能分段,并通过查询分析、向量检索实现精准的问答功能。

1 文档处理

1.1 网页内容加载

安装pip install beautifulsoup4。
WebBaseLoader是LangChain提供的一个强大的网页内容加载器,然后对获取到的内容进行处理,提取关心的信息。
在这里插入图片描述
(1)使用WebBaseLoader获取内容

from bs4 import BeautifulSoup
from langchain_community.document_loaders import WebBaseLoader
url = "https://gitee.com/anydev/awesome-python-cn/blob/master/README.m
http://www.dtcms.com/a/40764.html

相关文章:

  • 游戏开发微信小程序--工具箱之父
  • 基于javaweb的SSM+Maven鲜花商城管理系统设计和实现(源码+文档+部署讲解)
  • Qt for Android下QMessageBox背景黑色、文字点击闪烁
  • 深入探讨Ceph:分布式存储架构的未来
  • 类和对象——拷贝对象时的一些编译器优化
  • AI绘画软件Stable Diffusion详解教程(3):Windows系统本地化部署操作方法(通用版)
  • Mybatis的分页插件
  • 视频级虚拟试衣技术在淘宝的产品化实践
  • 【Linux基础】Linux下的C编程指南
  • HAL库之是stm32cubemx安装
  • 定义数组存储3部汽车对象(class1)
  • 解决“ReadTimeoutError:HTTPSConnectionPool”pip安装超时问题
  • win11编译pytorch cuda128版本流程
  • wav格式的音频压缩,WAV 转 MP3 VBR 体积缩减比为 13.5%、多个 MP3 格式音频合并为一个、文件夹存在则删除重建,不存在则直接建立
  • 笔记:大模型Tokens是啥?为啥大模型按Tokens收费?
  • PyQt5入门教程和简单使用
  • Pandas在爬虫中的应用:快速清洗和存储表格数据
  • 【北京迅为】itop-3568 开发板openharmony鸿蒙烧写及测试-第2章OpenHarmony v3.2-Beta4版本测试
  • js逆向常用代码
  • 使用 Polars 进行人工智能医疗数据分析(ICU数据基本测试篇)
  • 毛泽东思想“活的灵魂”
  • 黑马Java面试教程_P5_微服务
  • ISO 15118,最新版,汽车充电桩相关标准,1~22子标准
  • Postman 11.34 最新版安装与API测试入门教程(Windows平台)
  • 释放 Cursor 的全部潜能:快速生成智能 Cursor Rules
  • Linux中子线程会继承父线程对相关变量的可见性
  • redis --- 相关基础知识整理
  • RNN,LSTM,GRU三种循环网络的对比
  • 解决单元测试 mock final类报错
  • 盛京开源社区加入 GitCode,书写东北开源生态新篇章