当前位置: 首页 > news >正文

基于n8n指定网页自动抓取解析入库工作流实战

1. 效果预览

给定华尔街见闻指定链接,自动抓取文章存储至MongoDB


2. 部署n8n

n8n可用插件非常多,并且完全免费开源

下载n8n后,执行npx n8n运行即可,如果node版本低于14会报错,请升级至20版本

3. firecrawl节点安装

3.1 其他节点介绍

第一节点用于 接收聊天输入
第二个节点用于判断是否为链接:我们可以直接拖动chatInput到蓝色字体处,然后选择正则表达式匹配url
IF 判断是否为Url
第三个节点是社区节点FireCrawl,我们首先需要安装下:

3.2 安装FireCrawl Node节点

点击

在IF节点后,我们添加FireCrawl节点,配置如下,


其中FireCrawl API配置如下, 改为自己的key

4. 格式转换节点配置


我们搜索Set, 新增字段编辑节点,将抓取的内容转为MongoDB需要保存的字段格式

5. MongoDB存储

定义好字段后,可以直接执行,在页面非常方便的看到输入与输出

相关文章:

  • Python学习(7) ----- Python起源
  • 【DAY43】复习日
  • JESD204B IP核接口实例,ADI的ADRV9009板卡,ZYNQ7045驱动实现2发2收。
  • Halo站点全站定时备份并通过邮箱存储备份
  • Polarctf2025夏季赛 web java ez_check
  • 基于51单片机的红外防盗及万年历仿真
  • 机器学习方法实现数独矩阵识别器
  • Redis——主从哨兵配置
  • 基于自适应虚拟谐波阬的光储VSG并网电流谐波抑制模型
  • LLMs 系列科普文(6)
  • 前后端分离开发 和 前端工程化
  • LeetCode--25.k个一组翻转链表
  • DAY 48 随机函数与广播机制
  • JavaScript 的意义
  • 知名的WordPress模板团队
  • c++ std::pair
  • vmware 设置 dns
  • Elasticsearch 常用操作命令整合 (cURL 版本)
  • 鸿蒙API自翻译
  • 从碳基羊驼到硅基LLaMA:开源大模型家族的生物隐喻与技术进化全景
  • 如何做关于橱柜网站/cdq百度指数
  • 成都网站建设公司湖南岚鸿/昆明网络营销公司哪家比较好
  • 网站备案升级/最新足球消息
  • ps网站轮播图怎么做的/seo快速排名案例
  • 广州安全教育平台登录账号/优化营商环境
  • 成都平台网站建设公司/百度客服在线咨询人工服务