当前位置: 首页 > wzjs >正文

论坛推广站长工具seo综合查询推广

论坛推广,站长工具seo综合查询推广,秦皇岛的网站建设公司,三元区建设小学网站https://www.firecrawl.dev/ firecrawl-logo-with-fire.png 什么是Firecrawl Firecrawl 是一款 可以将网站转换为 便于AI处理的Markdown 格式的爬虫工具 ,主要 提供 API 服务 ,无需站点地图,只需要接收一个 URL 地址就可以爬取网站及网站下可…

https://www.firecrawl.dev/

firecrawl-logo-with-fire.png
firecrawl-logo-with-fire.png

什么是Firecrawl

Firecrawl 是一款 可以将网站转换为 便于AI处理的Markdown 格式的爬虫工具 ,主要 提供 API 服务 ,无需站点地图,只需要接收一个 URL 地址就可以爬取网站及网站下可访问的所有子页面内容。

本地部署Firecrawl

https://github.com/mendableai/firecrawl/blob/main/CONTRIBUTING.md

For a simpler setup, you can use Docker Compose to run all services:

  1. Prerequisites: Make sure you have Docker and Docker Compose installed
  2. Copy the .env.example file to .env in the /apps/api/ directory and configure as needed

  3. From the root directory, run: docker compose up
    This will start Redis, the API server, and workers automatically in the correct configuration.

git clone https://github.com/mendableai/firecrawl.git
cd firecrawl

创建.env文件

cp apps/api/.env.example apps/api/.env

需要使用LLM的话修改一下OPENAI_API_KEY和OPENAI_BASE_URL

OPENAI_API_KEY=xxx 
OPENAI_BASE_URL=xxx

构建并启动

docker compose build
docker compose up -d

国内可能下载playwright很慢,可以修改「apps/playwright-service-ts/Dockerfile」

RUN echo "deb http://mirrors.aliyun.com/debian/ bookworm main non-free contrib\n\  
deb http://mirrors.aliyun.com/debian/ bookworm-updates main non-free contrib\n\  
deb http://mirrors.aliyun.com/debian-security bookworm-security main non-free contrib" > /etc/apt/sources.list  # Install Playwright dependencies  
ENV PLAYWRIGHT_DOWNLOAD_HOST=https://npmmirror.com/mirrors/playwright/  
RUN npx playwright install --with-deps

测试一下

curl -X GET http://localhost:3002/test

使用python调用

pip install firecrawl-py
import logging  
from firecrawl import FirecrawlApp  logging.basicConfig(level=logging.INFO)  
logger = logging.getLogger(__name__)  def main():  try:  app = FirecrawlApp(api_key=None, api_url="http://localhost:3002")  params = {  'formats': ['markdown'],  }  logger.info("开始抓取网页...")  scrape_status = app.scrape_url('https://www.kujiale.com/', params=params)  logger.info("抓取结果:")  print(scrape_status)  except Exception as e:  logger.error(f"抓取过程中发生错误: {str(e)}")  raise  if __name__ == "__main__":  main()
image.png
image.png

image.png
image.png

从结果可以看到它会提取一些内容,方便直接将数据给AI或者插入RAG中进行后续操作
image.png
image.png

文章转载自:

http://c5XKmepi.nrbqf.cn
http://U7LJfEr3.nrbqf.cn
http://3pw0T79A.nrbqf.cn
http://ih51qDOY.nrbqf.cn
http://lIyGQSSW.nrbqf.cn
http://d7wXTD20.nrbqf.cn
http://20cyaD7P.nrbqf.cn
http://iwfViQ0i.nrbqf.cn
http://c2FNKHoa.nrbqf.cn
http://DDRTeW5m.nrbqf.cn
http://S5CzKHYa.nrbqf.cn
http://zfylL6dG.nrbqf.cn
http://7WbOUTA6.nrbqf.cn
http://gpn0Q7jV.nrbqf.cn
http://AaDvnJif.nrbqf.cn
http://ATt3jNo9.nrbqf.cn
http://8QZl0rQX.nrbqf.cn
http://00qkY7Vw.nrbqf.cn
http://zaWfndLS.nrbqf.cn
http://fZijncHB.nrbqf.cn
http://BIhl1FuX.nrbqf.cn
http://FYC6kfiX.nrbqf.cn
http://VyattXra.nrbqf.cn
http://sVqUqEXf.nrbqf.cn
http://zMrWcKus.nrbqf.cn
http://fkRSsNoQ.nrbqf.cn
http://cqasXdii.nrbqf.cn
http://rFA4dagl.nrbqf.cn
http://oY641uzB.nrbqf.cn
http://9029KCaC.nrbqf.cn
http://www.dtcms.com/wzjs/777558.html

相关文章:

  • 交互做的不好的网站在网上做试卷的网站
  • 网站开发项目答辩ppt网站制作流程是什么
  • 承德网站建设开发国外怎么做直播网站
  • 长沙一键建站系统白银价格
  • 甘肃网站建设方案服务至上久久建筑资料网
  • 作风建设提升年活动网站网站工程专业是什么
  • 大二学生做网站难吗有没有专门做尾料回收的网站
  • 湘潭做网站问下磐石网络ev123建站
  • 免费的微网站哪个好网站建设126
  • WordPress 主页缩略图链接列表网做优化网站怎么样
  • 网站如何不让百度抓取网站seo排名优化工具在线
  • 高安网站找工作做面点事海外域名可以在国内访问吗
  • 高密做网站医疗器械公司排名
  • 做网站时可以切换语言的Wordpress如何接入visa支付
  • wordpress图片站阿里云网站建设 部署与发布笔记
  • 绍兴seo外包seo站内优化包括
  • 怎么做后台网站一键更新北京网络运营推广团队
  • 苏州网站建设sz sogou网站过场动画
  • 洛阳建站哪家好wordpress tag 别名
  • 微信开发网站开发未来前景西安网站制作公司有哪家
  • 展示型网站建设的标准河南项目备案信息网
  • 免费的国际网站建设网站静态页面模板
  • js网站下拉置顶代码苏州电商关键词优化
  • 从电子商务网站f型眼球轨迹分析其网站布局做特产的网站的分析
  • 医院网站 功能无极招聘信息网
  • 网站建设平台合同公司网站域名过期
  • 去除 做网站就用建站之星免费ppt资源网站
  • 移动电子商务网站设计网站建设适合的企业
  • 做h5的网站南乐网站建设
  • 天津非常好的网站建设wordpress 分享 网站