当前位置: 首页 > news >正文

基于n8n指定网页自动抓取解析入库工作流实战

1. 效果预览

给定华尔街见闻指定链接,自动抓取文章存储至MongoDB


2. 部署n8n

n8n可用插件非常多,并且完全免费开源

下载n8n后,执行npx n8n运行即可,如果node版本低于14会报错,请升级至20版本

3. firecrawl节点安装

3.1 其他节点介绍

第一节点用于 接收聊天输入
第二个节点用于判断是否为链接:我们可以直接拖动chatInput到蓝色字体处,然后选择正则表达式匹配url
IF 判断是否为Url
第三个节点是社区节点FireCrawl,我们首先需要安装下:

3.2 安装FireCrawl Node节点

点击

在IF节点后,我们添加FireCrawl节点,配置如下,


其中FireCrawl API配置如下, 改为自己的key

4. 格式转换节点配置


我们搜索Set, 新增字段编辑节点,将抓取的内容转为MongoDB需要保存的字段格式

5. MongoDB存储

定义好字段后,可以直接执行,在页面非常方便的看到输入与输出

http://www.dtcms.com/a/239122.html

相关文章:

  • Python学习(7) ----- Python起源
  • 【DAY43】复习日
  • JESD204B IP核接口实例,ADI的ADRV9009板卡,ZYNQ7045驱动实现2发2收。
  • Halo站点全站定时备份并通过邮箱存储备份
  • Polarctf2025夏季赛 web java ez_check
  • 基于51单片机的红外防盗及万年历仿真
  • 机器学习方法实现数独矩阵识别器
  • Redis——主从哨兵配置
  • 基于自适应虚拟谐波阬的光储VSG并网电流谐波抑制模型
  • LLMs 系列科普文(6)
  • 前后端分离开发 和 前端工程化
  • LeetCode--25.k个一组翻转链表
  • DAY 48 随机函数与广播机制
  • JavaScript 的意义
  • 知名的WordPress模板团队
  • c++ std::pair
  • vmware 设置 dns
  • Elasticsearch 常用操作命令整合 (cURL 版本)
  • 鸿蒙API自翻译
  • 从碳基羊驼到硅基LLaMA:开源大模型家族的生物隐喻与技术进化全景
  • Ollama部署下载Qwen3-Embedding(含0.6B、4B、8B等)向量模型和Qwen3-Reranker(含0.6B、4B、8B等)重排模型的方法
  • 【RAG召回】BM25算法示例
  • 智慧城市项目总体建设方案(Word700页+)
  • 楠溪江诗意传承:李文照笔下的山水印记
  • leetcode_56 合并区间
  • 十一.C++ 类 -- 面向对象思想
  • day50 随机函数与广播机制
  • 【西门子杯工业嵌入式-6-ADC采样基础】
  • CMake基础:gcc/g++编译选项详解
  • 结合三维基因建模与智能体技术打造工业软件无码平台