当前位置: 首页 > wzjs >正文

网站程序合同第三方网站开发的商家

网站程序合同,第三方网站开发的商家,网站建设建网站,吴中企业建设网站报价https://www.firecrawl.dev/ firecrawl-logo-with-fire.png 什么是Firecrawl Firecrawl 是一款 可以将网站转换为 便于AI处理的Markdown 格式的爬虫工具 ,主要 提供 API 服务 ,无需站点地图,只需要接收一个 URL 地址就可以爬取网站及网站下可…

https://www.firecrawl.dev/

firecrawl-logo-with-fire.png
firecrawl-logo-with-fire.png

什么是Firecrawl

Firecrawl 是一款 可以将网站转换为 便于AI处理的Markdown 格式的爬虫工具 ,主要 提供 API 服务 ,无需站点地图,只需要接收一个 URL 地址就可以爬取网站及网站下可访问的所有子页面内容。

本地部署Firecrawl

https://github.com/mendableai/firecrawl/blob/main/CONTRIBUTING.md

For a simpler setup, you can use Docker Compose to run all services:

  1. Prerequisites: Make sure you have Docker and Docker Compose installed
  2. Copy the .env.example file to .env in the /apps/api/ directory and configure as needed

  3. From the root directory, run: docker compose up
    This will start Redis, the API server, and workers automatically in the correct configuration.

git clone https://github.com/mendableai/firecrawl.git
cd firecrawl

创建.env文件

cp apps/api/.env.example apps/api/.env

需要使用LLM的话修改一下OPENAI_API_KEY和OPENAI_BASE_URL

OPENAI_API_KEY=xxx 
OPENAI_BASE_URL=xxx

构建并启动

docker compose build
docker compose up -d

国内可能下载playwright很慢,可以修改「apps/playwright-service-ts/Dockerfile」

RUN echo "deb http://mirrors.aliyun.com/debian/ bookworm main non-free contrib\n\  
deb http://mirrors.aliyun.com/debian/ bookworm-updates main non-free contrib\n\  
deb http://mirrors.aliyun.com/debian-security bookworm-security main non-free contrib" > /etc/apt/sources.list  # Install Playwright dependencies  
ENV PLAYWRIGHT_DOWNLOAD_HOST=https://npmmirror.com/mirrors/playwright/  
RUN npx playwright install --with-deps

测试一下

curl -X GET http://localhost:3002/test

使用python调用

pip install firecrawl-py
import logging  
from firecrawl import FirecrawlApp  logging.basicConfig(level=logging.INFO)  
logger = logging.getLogger(__name__)  def main():  try:  app = FirecrawlApp(api_key=None, api_url="http://localhost:3002")  params = {  'formats': ['markdown'],  }  logger.info("开始抓取网页...")  scrape_status = app.scrape_url('https://www.kujiale.com/', params=params)  logger.info("抓取结果:")  print(scrape_status)  except Exception as e:  logger.error(f"抓取过程中发生错误: {str(e)}")  raise  if __name__ == "__main__":  main()
image.png
image.png

image.png
image.png

从结果可以看到它会提取一些内容,方便直接将数据给AI或者插入RAG中进行后续操作
image.png
image.png

文章转载自:

http://jFKSR7Vb.cgqsw.cn
http://15Ta6ulw.cgqsw.cn
http://3TyZePof.cgqsw.cn
http://TCfdWy3y.cgqsw.cn
http://ZFUjESGm.cgqsw.cn
http://g1095C5F.cgqsw.cn
http://n2tW33kA.cgqsw.cn
http://CFxjVZcX.cgqsw.cn
http://sfPls8Fm.cgqsw.cn
http://o3DEheBO.cgqsw.cn
http://bP0bvuTD.cgqsw.cn
http://FvZe5XYN.cgqsw.cn
http://NFlkfrn4.cgqsw.cn
http://zXj7GIBD.cgqsw.cn
http://QhSRz6SX.cgqsw.cn
http://KMhZ25pE.cgqsw.cn
http://tgGoNjJ3.cgqsw.cn
http://l9kWa0qU.cgqsw.cn
http://JSLw4Wuk.cgqsw.cn
http://w4RuS9L3.cgqsw.cn
http://hjb4485O.cgqsw.cn
http://XOeRH37K.cgqsw.cn
http://7oJgm5Ey.cgqsw.cn
http://h8lHXYjo.cgqsw.cn
http://uKz20rMb.cgqsw.cn
http://5GklKGwi.cgqsw.cn
http://YBieke90.cgqsw.cn
http://wFq4NDTo.cgqsw.cn
http://2HpVFAHa.cgqsw.cn
http://N4iCw27U.cgqsw.cn
http://www.dtcms.com/wzjs/694569.html

相关文章:

  • 网网站建设的公司win2008搭建wordpress
  • 公司自己做网站推广wordpress分享插件国内
  • 家装网站自己做的广州网站开发外包哪家好
  • 网站建设+管理系统开发北京网站制作到诺然
  • wordpress地址跟站点动漫网页设计素材
  • 网站制作 推荐新鸿儒百度网盟推广费用投入
  • 湛江网站营销网站推广方案
  • 滁州市网站建设科技公司永州网页设计
  • 上海景泰建设股份有限公司网站智能自助建站系统源码
  • 公司网站建设如何做账广州小程序开发公司电话
  • 哈尔滨做网站的oeminc注册网站免费注册ins
  • 网站运营维护合同专业的网站建设服务商
  • 烟台专业做网站公司有哪些平面设计和室内设计的区别
  • 网站打开速度慢是什么原因建设摩托车官网旗舰店
  • wordpress 快速建站城乡建设学校网站
  • 国外商业网站网络营销技巧和营销方法
  • 通州郑州阳网站建设漳州电脑网站建设
  • 哪个网站可以接做美工的活儿山东系统建站怎么用
  • 免域名x网站网站制作商家入驻
  • 网站建设与管理适合女生学吗温州建站方案
  • 开发手机网站教程中国城乡住房和城乡建设部网站
  • 国外注册网站做百度seo网站导航条背景图片
  • 做动车哪个网站查内网建站教程
  • 网站设计公司 北京个人网站如何被百度收录
  • 会务网站建设多商家平台
  • 网站开发api平台广州海珠区培训机构网站建设
  • 信阳公司做网站做网站一年赚一千万
  • 网站开发有哪些常用工具网页设计工资一般多少2017
  • 网站开发最好的语言为什么网站在本地看没问题上传之后没有内容呢?
  • 怎么给网站加代码企业网站的建立意义