当前位置：首页 > news >正文

巨坑Spring ai 之spring-ai-starter-vector-store-elasticsearch

news 2025/9/23 8:41:29

在使用spring ai 想构建一个rag demo被坑到想哭

软件版本

   <spring-ai-bom.version>1.0.2</spring-ai-bom.version><dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-bom</artifactId><version>${spring-ai-bom.version}</version><type>pom</type><scope>import</scope></dependency><dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-starter-vector-store-elasticsearch</artifactId><exclusions>

   /*** 1. ETL文档入库* 将pdf写入到向量库中** @return*/@GetMapping("/addDocumentToVectorDB")public List<Document> addDocumentToVectorDB() {TikaDocumentReader tikaDocumentReader = new TikaDocumentReader(resource);// 将文件中的文本分割为多组DocumentList<Document> fileDocuments = tikaDocumentReader.get();// 基于Token将多组Document进行更细化的分割List<Document> documents = tokenTransformer.apply(fileDocuments);// 存储到向量数据库中vectorStore.accept(documents);return documents;}

选择embedding模型

spring: ai:openai:embedding:options:
#           向量模型model: doubao-embedding-large-text-250515

在这里插入图片描述
如果模型选择doubao-embedding-text-240715，它默认维度是2560和elasticsearch集成，elasticsearch最大就是2048，又集成不了，恶心

在addDocumentToVectorDB中vectorStore.accept(documents)调用的实现类为ElasticsearchVectorStore
在这里插入图片描述

具体代码为

List<float[]> embeddings = this.embeddingModel.embed(documents, EmbeddingOptionsBuilder.builder().build(), this.batchingStrategy);

EmbeddingOptionsBuilder.builder().build()这部分代码没有使用到配置文件中的对模型维度的声明
在这里插入图片描述

进入这个方法中this.embeddingModel.embed(），就会发现都为空，然后就会使用模型默认的维度，太恶心了，所以只能使用维度为2048的模型，这里spring ai 设置完全没有用，完全在搞笑
在这里插入图片描述

查看全文

http://www.dtcms.com/a/395176.html

【LeetCode 每日一题】2349. 设计数字容器系统

i.MX6ULL移植内核6.6（一）修改网络驱动和LCD驱动

vue-router（vue 路由）基本使用指南（一）

酒店台账报表：押金原路退回与收支自动化指南-东方仙盟自动化

⸢ 伍-Ⅰ⸥ ⤳ 默认安全治理实践：软件供应链安全治理

LeetCode 刷题【88. 合并两个有序数组、89. 格雷编码】

《青花》歌曲,使用3D表现出意境

【Linux篇】- Ext系列文件系统

C++符号表

Pythoner 的Flask项目实践-带折叠菜单的响应式多页面应用签到墙（源码）

异常:java.lang.NoClassDefFoundError: javax/xml/bind/DatatypeConverter

Java-131 深入浅出 MySQL MyCat 深入解析 schema.xml 配置详解：逻辑库、逻辑表、数据节点全攻略

Vmware CentOS Docker Daemon配置代理

【JAVA】java多态

【AI分析进行时】大模型显存需求估算与国内开源模型实践指南

C++基础：（一）C++入门知识介绍（上）

Python项目的多语言翻译babel

python flask框架详解

基于STM32单片机的家庭医护血氧体温血压吃药监测APP系统

整合亮数据Bright Data与Dify构建自动化分析系统

Browser-Use+cpolar：企业网页操作自动化的无界解决方案

深入理解 Elasticsearch：核心原理、性能优化与高频面试题解析

【C++】Lambda表达式参数问题

数学金融方向要额外学什么课？这个专业对编程和建模能力要求高吗？

第二部分：VTK核心类详解（第54章 vtkVariantArray变体数组类）

【2025最新】ArcGIS for JS点聚合功能实现

Leecode hot100 - 114. 二叉树展开为链表基础方法到提高方法

把 iOS 混淆纳入自动化测试与 CICD 从构建、回归到灰度的工程化实战

初识Redis：解锁高性能缓存的魔法钥匙

基于传递矩阵法计算多层结构声表面波声速

在使用spring ai 想构建一个rag demo被坑到想哭

相关文章：