当前位置: 首页 > wzjs >正文

做网站工资怎么样网络推广服务商排名

做网站工资怎么样,网络推广服务商排名,如何修改网站模板内容,h5个人网站模板下载https://www.firecrawl.dev/ firecrawl-logo-with-fire.png 什么是Firecrawl Firecrawl 是一款 可以将网站转换为 便于AI处理的Markdown 格式的爬虫工具 ,主要 提供 API 服务 ,无需站点地图,只需要接收一个 URL 地址就可以爬取网站及网站下可…

https://www.firecrawl.dev/

firecrawl-logo-with-fire.png
firecrawl-logo-with-fire.png

什么是Firecrawl

Firecrawl 是一款 可以将网站转换为 便于AI处理的Markdown 格式的爬虫工具 ,主要 提供 API 服务 ,无需站点地图,只需要接收一个 URL 地址就可以爬取网站及网站下可访问的所有子页面内容。

本地部署Firecrawl

https://github.com/mendableai/firecrawl/blob/main/CONTRIBUTING.md

For a simpler setup, you can use Docker Compose to run all services:

  1. Prerequisites: Make sure you have Docker and Docker Compose installed
  2. Copy the .env.example file to .env in the /apps/api/ directory and configure as needed

  3. From the root directory, run: docker compose up
    This will start Redis, the API server, and workers automatically in the correct configuration.

git clone https://github.com/mendableai/firecrawl.git
cd firecrawl

创建.env文件

cp apps/api/.env.example apps/api/.env

需要使用LLM的话修改一下OPENAI_API_KEY和OPENAI_BASE_URL

OPENAI_API_KEY=xxx 
OPENAI_BASE_URL=xxx

构建并启动

docker compose build
docker compose up -d

国内可能下载playwright很慢,可以修改「apps/playwright-service-ts/Dockerfile」

RUN echo "deb http://mirrors.aliyun.com/debian/ bookworm main non-free contrib\n\  
deb http://mirrors.aliyun.com/debian/ bookworm-updates main non-free contrib\n\  
deb http://mirrors.aliyun.com/debian-security bookworm-security main non-free contrib" > /etc/apt/sources.list  # Install Playwright dependencies  
ENV PLAYWRIGHT_DOWNLOAD_HOST=https://npmmirror.com/mirrors/playwright/  
RUN npx playwright install --with-deps

测试一下

curl -X GET http://localhost:3002/test

使用python调用

pip install firecrawl-py
import logging  
from firecrawl import FirecrawlApp  logging.basicConfig(level=logging.INFO)  
logger = logging.getLogger(__name__)  def main():  try:  app = FirecrawlApp(api_key=None, api_url="http://localhost:3002")  params = {  'formats': ['markdown'],  }  logger.info("开始抓取网页...")  scrape_status = app.scrape_url('https://www.kujiale.com/', params=params)  logger.info("抓取结果:")  print(scrape_status)  except Exception as e:  logger.error(f"抓取过程中发生错误: {str(e)}")  raise  if __name__ == "__main__":  main()
image.png
image.png

image.png
image.png

从结果可以看到它会提取一些内容,方便直接将数据给AI或者插入RAG中进行后续操作
image.png
image.png
http://www.dtcms.com/wzjs/838618.html

相关文章:

  • 产品型网站案例泰安有哪些网站
  • 手机wap网站大全中企动力z邮箱
  • php外贸网站制作开源nodejs wordpress
  • 龙岗企业网站制作公司百度关键词排名推广话术
  • 西宁网站建设开发公司怎么用切片和dw做网站
  • 网站建设费用表格手机网站制作教程
  • app网站制作下载做3d效果的网站
  • 湛江网站营销wordpress模板服务器
  • 注册了网站之后怎么设计怎么做自己的网站链接
  • 快递网站策划怎么做ppt网络营销软件价格
  • 集团官方网站建设方案企业网站托管
  • 建设网站采用的网络技术成都网站设计推荐柚米
  • 做图书馆网站哪个网站的地图可以做分析图
  • 济南外贸建站农业电商网站建设ppt
  • 互联网网站建设哪里好申请公司费用
  • 免费ui网站网站手机端自适应
  • 自适应型网站建设哪家便宜济南做网站0531soso
  • 网站每年要交钱吗泉州网站seo
  • 目前网站建设主流技术架构企业网络组网设计
  • html5游戏一个网站可以优化多少关键词
  • 百度搜索网站的图片网上做的比较好的竞彩网站
  • 昆明seo网站建设费用响应式网站开发教程pdf
  • c2c的电子商务网站有哪些相亲网站上做投资的女生
  • 网站建设与网页设计制作wordpress英文主题 汉化
  • 本地wordpress站点上传汕尾网站开发
  • 网站页面设计合同wordpress标签页样式
  • 哪些网站做的比较好的网站建设尢金手指专业
  • 如何做音乐分享类网站公司网站有中文域名吗
  • 怎么在网站后台做标题的超链接成都彩票网站开发
  • 静态企业网站源码筑龙建筑网官网