当前位置：首页 > news >正文

SpringBoot+LangChain4j解析pdf文档，不使用默认解析器

news 2025/8/2 5:05:09

首先我们需要引入pdf解析器依赖

        <!--    pdf解析器依赖    --><dependency><groupId>dev.langchain4j</groupId><artifactId>langchain4j-document-parser-apache-pdfbox</artifactId><version>1.0.1-beta6</version></dependency>

然后创建一个 config 配置类，配置一个Bean

    // 构建向量数据库操作对象@Beanpublic EmbeddingStore store() {// 加载文档进内存
//        List<Document> documents = ClassPathDocumentLoader.loadDocuments("content");List<Document> documents = ClassPathDocumentLoader.loadDocuments("content", new ApachePdfBoxDocumentParser());// 构建向量数据库操作对象InMemoryEmbeddingStore store = new InMemoryEmbeddingStore();// 完成文本数据切割和向量化，存储EmbeddingStoreIngestor ingestor = EmbeddingStoreIngestor.builder().embeddingStore(store).embeddingModel(embeddingModel).build();// 调用 ingest 把 文档存进去ingestor.ingest(documents);return store;}

http://www.dtcms.com/a/309100.html

相关文章：

解决VScode加载慢、保存慢，git加载慢，windows11系统最近异常卡顿的问题

高端房产管理小程序

【Ubuntu】安装使用pyenv - Python版本管理

ORACLE函数

JVM垃圾回收算法和分代收集算法的区别

插件升级：Chat/Builder 合并，支持自定义 Agent、MCP、Rules

深度学习（鱼书）day08--误差反向传播（后三节）

Day 28：类的定义和方法

属性的运用和理解

赛博算命之八字测算事业运势的Java实现（四柱、五行、十神、流年、格局详细测算）

Redisson实现Redis分布式锁的原理

Windows和Linux的tree工具

【智能协同云图库】第七期：基于AI调用阿里云百炼大模型，实现AI图片编辑功能

渗透测试报告通常包含哪些关键内容？

redis快速部署、集成、调优

Linux通用SPI作为Master——回环测试

Redis学习-----Redis的基本数据类型

Dify版本升级实操

Edge中如何找到原IE浏览器的Internet选项

基于html,css,jquery,django,lstm,cnn,tensorflow,bert,推荐算法,mysql数据库

8月1日RED指令强制生效，您的设备准备好了吗？

uniapp 开发微信小程序，获取经纬度（uni.getLocation）并且转化详细地址（‌高德地图逆地理编码API、‌腾讯地图逆地理编码）

【华为机试】127. 单词接龙

Python match-case 模式匹配详解

【Mysql】字段隐式转换对where条件和join关联条件的影响

【Java面试题】缓存穿透

什么是doris

优化网站域名的SEO策略指南

Qt开发中的安全技术问题详解

MySQL(172)如何进行MySQL的全局变量设置？