当前位置: 首页 > news >正文

【Datawhale AI夏令营】基于多模态RAG的企业财报问答系统

文章目录

    • 学习资源
    • 数据处理流程
    • 整体架构流程

学习资源

学习者手册:https://www.datawhale.cn/activity/359/learn/206/4495

数据处理流程

原始PDF财报
多模态解析
模态拆分
文本内容
表格数据
图像/图表
文本分块
表格结构化
图像特征提取
文本嵌入
表格描述生成
图像嵌入
向量数据库

整体架构流程

数据处理流水线
文本/表格/图像向量
文本提取器
PDF解析器
表格识别器
图表检测器
文本分块
表格转结构化数据
图表描述生成
文本嵌入模型
表格描述模型
图像嵌入模型
向量数据库
用户界面
查询处理器
多模态检索引擎
向量数据库
多模态生成模型
响应生成
http://www.dtcms.com/a/323000.html

相关文章:

  • MySQL弹幕内容字段设计总结
  • Linux Makefile解析
  • 元宇宙技术如何改变社交方式?
  • MyBatis联合查询 - 注解篇
  • QT系统相关
  • gpt-oss 全量技术解读
  • Alibaba Cloud Linux 3 安装 git
  • 【Spring Boot启动流程底层源码详解】
  • kubectl get node k8s-node01 -o yaml | grep taint -B 5 -A 5
  • 如何理解SA_RESTART”被信号中断的系统调用自动重启“?
  • 腾讯COS云存储入门
  • 笔试——Day33
  • 基于遗传优化的稀疏线阵最优排布算法matlab仿真
  • Java面向对象编程(OOP)全面解析:从基础到实践
  • 关于城市农村创业的一点构想
  • 自动生成视频的AI大模型高效创作指南
  • mac安装node.js
  • 【GPT入门】第41课 Model Scope在线平台部署Llama3
  • Serper注册无反应
  • Numpy基础(通用函数)
  • 游游的数组染色
  • 洛谷 滑动窗口 /【模板】单调队列
  • 揭秘MyBatis核心类MappedStatement
  • Java异常:认识异常、异常的作用、自定义异常
  • ChatGPT 5的编程能力宣传言过其实
  • 97-基于Python的大众点评数据分析预测系统
  • 七、《Serverless架构:按毫秒计费的成本革命》--从新浪AI推理平台50%效能提升看无服务器本质
  • 数据结构——优先级队列(PriorityQueue):一文解决 Top K 问题!
  • 可视化大屏 SDK 数据结构设计:从拖拽组件到最终渲染的全链路
  • 2025-08-09 李沐深度学习13——经典卷积神经网络 (1)