当前位置: 首页 > news >正文

firecrawl的docker安装和api调用

记录下FireCrawl Docker部署,以及aip调用以备忘。

一、部署前准备

1. 环境要求
  • 硬件:2核CPU、4GB内存、50GB硬盘
  • 软件
    • Windows:Docker Desktop(需启用WSL2)
    • Linux:Docker + Git(Ubuntu推荐版本24.04)
  • 网络:需外网访问(国内用户建议科学上网或使用镜像源)

二、部署步骤

1. 克隆代码仓库

bash

git clone https://github.com/mendableai/firecrawl.git cd firecrawl

如果github登录不了,可以使用gitee下载

git clone https://gitee.com/JonDO/firecrawl.git

2. 配置环境变量
  • 复制示例文件

    cp apps/api/.env.example .env

3. Docker配置与启动
Ubuntu系统
  • 安装Docker

    # 添加GPG密钥与仓库 curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg echo "deb [arch= $ (dpkg --print-architecture) signed-by=/usr/share/keyrings/docker-archive-keyring.gpg] https://download.docker.com/linux/ubuntu $ (lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null sudo apt update && sudo apt install docker-ce docker-ce-cli containerd.io

  • 解决镜像下载问题
    修改/etc/docker/daemon.json添加镜像源(如华为云):
     

    { "registry-mirrors": ["https://docker.1ms.run"] }

    重启Docker服务:
    bash

    sudo systemctl restart docker

  • 构建与运行
     

    docker-compose build --no-cache # 强制重新构建 docker-compose up -d


4. 验证部署
  • 检查服务状态
     

    docker-compose ps # 查看容器运行状态

  • API测试
     

    curl -X GET http://localhost:3002/test # 返回"Hello, world!"表示成功

  • 管理界面
    浏览器访问 http://localhost:3002/admin/@/queues 查看任务队列。

三、api调用

有两种调用方式,一种是返回task_id,一种是直接返回结果。

1、返回task_id

String url = "http://192.168.1.1:3002/v1/crawl"

可以在浏览器访问 http://localhost:3002/admin/@/queues 查看任务队列。

2、直接返回结果

String url = "http://192.168.1.1:3002/v0/scrape"

调用的参考代码如下:

// var url = "http://192.168.1.1:3002/v0/scrape"
var url = "http://192.168.1.1:3002/v1/crawl"Map headers = {"Content-Type": "application/json"
}
Map requestBody = {"url": "" //爬取网址// "option": {//     "maxDepth": 3, //下转几层//     "limit": 1,  //最多爬取几页,包括base page//     // "scrapeOptions": {//     //     "formats": ["markdown","html"]//     // }//     // "keepCookies": true,//     // "headers": {//     //     "Cookie": str//     // }// }
}
var ret = http.connect(url).header(headers).body(requestBody).post().getBody()return ret

 

 

相关文章:

  • 【python】-基础语法3
  • flutter开发音乐APP(简单的音乐播放demo)
  • Android Compose 无网络状态处理全指南:从基础到高级实践
  • 家庭服务器IPV6搭建无限邮箱系统指南
  • 米壳AI:跨境电商图片翻译的“隐形革命”:当AI技术遇上全球化生意
  • 每日算法-250430
  • 高性能架构设计-分库分表
  • 2025上海车展 | 移远通信推出自研NG-eCall QuecOpen方案,助力汽车安全新标准加速落地
  • AVPro Video加载视频文件并播放,可指定视频文件的位置、路径等参数
  • 海外社交软件开发进阶:AI驱动与高可用架构的深度实践
  • 极品工具箱 1.3.7 | 多功能合一的工具箱,涵盖音乐搜索、短视频解析等特色功能
  • 电子病历高质量语料库构建方法与架构项目(临床情景理解模块篇)
  • 【综述】相位解包裹算法对比分析
  • LVGL -按键介绍 下
  • (51单片机)LCD显示红外遥控相关数据(Delay延时函数)(LCD1602教程)(Int0和Timer0外部中断教程)(IR红外遥控模块教程)
  • 大连理工大学选修课——机器学习笔记(5):EMK-Means
  • 《软件设计师》复习笔记(10.1)——算法特性、时间复杂度、递归、分治、动态规划
  • flutter 专题 六十四 在原生项目中集成Flutter
  • 应对过度处方挑战:为药物推荐任务微调大语言模型(Xiangnan He)
  • 4.29[Q]NLP-Exp2
  • 全国人大常委会关于授权国务院在中国(新疆)自由贸易试验区暂时调整适用《中华人民共和国种子法》有关规定的决定
  • 山西太原一小区发生爆炸,造成1人遇难21人受伤2人失联
  • 上汽集团一季度净利润30.2亿元,同比增长11.4%
  • 何立峰出席驻沪中央金融机构支持上海建设国际金融中心座谈会并讲话
  • 我国首部《人工智能气象应用服务办法》今天发布
  • 被算法重塑的世界,人与技术如何和谐共处