当前位置: 首页 > news >正文

n8n工作流自动化平台的实操:利用本地嵌入模型,完成文件内容的向量化及入库

1.成果展示

1.1n8n的工作流

 牵涉节点:FTP、Code、Milvus Vector Store、Embeddings OpenAI、Default Data Loader、Recursive Character Text Splitter

12.向量库的结果

 

2.实操过程

2.1发布本地嵌入模型服务

将bge-m3嵌入模型,发布成满足open api接口规范的服务,必须包括(v1/embeddings和v1/models)这两个接口,具体实现详见https://platform.openai.com/docs/api-reference/embeddings/create,如下图:

2.2在milvus服务创建test_n8n集合

2.2.1创建test_n8n集合,如下图: 

注:

1.必须勾选启用动态schema,否则后面会报错。 

2.维度需要和前面发布的嵌入模型维度一致。bge-m3的维度是1024。

 2.2.2创建索引,如下图: 

注:度量类型必须是L2,否则后面会报错,因为Milvus Vector Store默认是L2,如何设置成其他,还望有缘人告知。

2.3节点说明

2.3.1FTP节点:

 

Operation选择Download
Path设置为/1.txt(1.txt是提前上传的文件)。 

2.3.2code节点:

解决中文乱码问题,具体操作详见《中文乱码》

2.3.3Milvus Vector Store节点:

operation Mode:选择Insert Documents
Milvus Collection:test_n8n(对应前面创建的集合)
其他采用默认设置 

2.3.4Embeddings OpenAI节点:

 图中1对应v1/models返回的模型名称,图中2对应v1/embeddings返回的内容(向量化)

2.3.5Default Data Loader节点:

注红框1、2,其他默认就行 

2.3.6Recursive Character Text Splitter节点:

默认设置就可以 

http://www.dtcms.com/a/170684.html

相关文章:

  • 从 0 到 1:使用 Jetpack Compose 和智能自动化实现高效 Android UI 开发
  • 2025 年如何使用 Pycharm、Vscode 进行树莓派 Respberry Pi Pico 编程开发详细教程(更新中)
  • HTML学习笔记(7)
  • PHP的include和require
  • 基于STM32的心电图监测系统设计
  • 【前端】【面试】在 Vue-React 的迁移重构工作中,从状态管理角度来看,Vuex 迁移到 Redux 最大的挑战是什么,你是怎么应对的?
  • 力扣面试150题--相同的树
  • 嵌入式按键原理、中断过程与中断程序设计(键盘扫描程序)
  • 【CISCO】什么是静态路由(Static Route)?ip route 192.0.1.0 255.255.255.0 200.0.0.1
  • 高等数学同步测试卷 同济7版 试卷部分 上 做题记录 第四章 不定积分同步测试卷 B卷
  • LeetCode刷题链表
  • Spring AI 实战:第四章、Spring AI多模态之看图说话
  • Go语言实现Kafka消息队列
  • 【图书管理系统】环境介绍、设计数据库和表、配置文件、引入依赖
  • JVM——JVM是怎么实现invokedynamic的?
  • Go语言--语法基础4--基本数据类型--类型转换
  • 4个纯CSS自定义的简单而优雅的滚动条样式
  • 图片压缩与尺寸调整的便捷工具推荐
  • Qt输入控件(QInput Widgets)详解:从基础到实战
  • 【leetcode】队列 + 宽搜,树形结构层序遍历的基础与变化
  • 前端开发,文件在镜像服务器上不存在问题:Downloading binary from...Cannot download...
  • JAVA设计模式——(十)抽象工厂模式(Abstract Factory Pattern)
  • PostgreSQL 的 REINDEX 命令
  • LeetCode 2071 你可以安排的最多任务数目 题解(附带自己的错误做题思路 过了25/49)
  • 个人健康中枢的多元化AI网络革新与精准健康路径探析
  • 【数据结构】励志大厂版·初阶(复习+刷题)排序
  • linux 使用nginx部署ssl证书,将http升级为https
  • CF1000E We Need More Bosses
  • 什么是DGI数据治理框架?
  • 【Python】一直没搞懂生成器是什么。。