当前位置: 首页 > wzjs >正文

asp网站开发教案要想让别人网站卖我的东西怎么做

asp网站开发教案,要想让别人网站卖我的东西怎么做,wordpress变身插件,哈尔滨网架公司Crawl是一个强大的工具,它赋予AI智能体更高的效率和准确性执行网络爬取和数据提取任务。其开源特性、AI驱动的能力和多功能性,使其成为构建智能且数据驱动智能体的宝贵资产,告别繁琐: 爬虫新宠 crawl4ai,数行代码搞定数据采集,AI …

在这里插入图片描述
Crawl是一个强大的工具,它赋予AI智能体更高的效率和准确性执行网络爬取和数据提取任务。其开源特性、AI驱动的能力和多功能性,使其成为构建智能且数据驱动智能体的宝贵资产,告别繁琐: 爬虫新宠 crawl4ai,数行代码搞定数据采集,AI 爬虫核武器!Crawl4AI 横空出世,数据采集只需一行代码,Crawl4AI 是一款专为大语言模型(LLM)和 AI 应用设计的开源网页爬虫与数据抓取工具。它不仅能高效采集网页数据,还能直接输出结构化、干净的 Markdown 内容。
1 使用 Crawl 的步骤
步骤 1:安装与设置

pip install "crawl4ai @ git+https://github.com/unclecode/crawl4ai.git" transformers torch nltk   

步骤 2:数据提取
创建Python脚本,启动网络爬虫并从URL提取数据:

from crawl4ai import WebCrawler      
# 创建 WebCrawler 的实例   crawler = WebCrawler()      
# 预热爬虫(加载必要的模型)   crawler.warmup()     
# 在 URL 上运行爬虫   result = crawler.run(url="https://openai.com/api/pricing/")     
# 打印提取的内容   print(result.markdown)   

步骤 3:数据结构化
使用LLM(大型语言模型)定义提取策略,将数据转换为结构化格式:

iimport os
from crawl4ai import WebCrawler
from crawl4ai.extraction_strategy import LLMExtractionStrategy
from pydantic import BaseModel, Fieldclass OpenAIModelFee(BaseModel):model_name: str = Field(..., description="OpenAI 模型的名称。")input_fee: str = Field(..., description="OpenAI 模型的输入令牌费用。")output_fee: str = Field(..., description="OpenAI 模型的输出令牌费用。")url = 'https://openai.com/api/pricing/'
crawler = WebCrawler()
crawler.warmup()result = crawler.run(url=url,word_count_threshold=1,extraction_strategy=LLMExtractionStrategy(provider="openai/gpt-4o",api_token=os.getenv('OPENAI_API_KEY'),schema=OpenAIModelFee.schema(),extraction_type="schema",instruction="""从爬取的内容中提取所有提到的模型名称以及它们的输入和输出令牌费用。不要遗漏整个内容中的任何模型。提取的模型 JSON 格式应该像这样:{"model_name": "GPT-4", "input_fee": "US$10.00 / 1M tokens", "output_fee": "US$30.00 / 1M tokens"}."""),bypass_cache=True,
)print(result.extracted_content)

步骤 4:集成AI智能体

将 Crawl 与 Praison CrewAI 智能体集成,实现高效的数据处理:

pip install praisonai   

创建工具文件(tools.py)来包装 Crawl 工具:

# tools.py
import os
from crawl4ai import WebCrawler
from crawl4ai.extraction_strategy import LLMExtractionStrategy
from pydantic import BaseModel, Field
from praisonai_tools import BaseToolclass ModelFee(BaseModel):llm_model_name: str = Field(..., description="模型的名称。")input_fee: str = Field(..., description="模型的输入令牌费用。")output_fee: str = Field(..., description="模型的输出令牌费用。")class ModelFeeTool(BaseTool):name: str = "ModelFeeTool"description: str = "从给定的定价页面提取模型的费用信息。"def _run(self, url: str):crawler = WebCrawler()crawler.warmup()result = crawler.run(url=url,word_count_threshold=1,extraction_strategy=LLMExtractionStrategy(provider="openai/gpt-4o",api_token=os.getenv('OPENAI_API_KEY'),schema=ModelFee.schema(),extraction_type="schema",instruction="""从爬取的内容中提取所有提到的模型名称以及它们的输入和输出令牌费用。不要遗漏整个内容中的任何模型。提取的模型 JSON 格式应该像这样:{"llm_model_name": "GPT-4", "input_fee": "US$10.00 / 1M tokens", "output_fee": "US$30.00 / 1M tokens"}."""),bypass_cache=True,)return result.extracted_contentif __name__ == "__main__":# 测试 ModelFeeTooltool = ModelFeeTool()url = "https://www.openai.com/pricing"result = tool.run(url)print(result)

AI智能体配置
配置AI智能体使用Crawl工具进行网络抓取和数据提取。在crewai框架下,我们设定了三个核心角色,共同完成网站模型定价信息的提取任务:

网络爬虫:负责从OpenAI、Anthropic和Cohere等网站抓取定价信息,输出原始HTML或JSON数据。

数据清理员:确保收集的数据准确无误,并整理成结构化的JSON或CSV文件。

数据分析员:分析清理后的数据,提炼出定价趋势和模式,并编制详细报告。

整个流程无需额外依赖,各角色独立完成各自任务。

2 AI 智能体应用实例
以Crawl为基础,Praison-AI智能体能够执行网络抓取、数据清洗和分析工作。它们相互协作,从多个网站抓取定价数据,并汇总成详尽的报告,以展示分析结果。
github地址:https://github.com/unclecode/crawl4ai
文档地址:https://docs.crawl4ai.com


文章转载自:

http://3kW5yfMt.jbgzy.cn
http://Z3KYOdMR.jbgzy.cn
http://WjAfuRUF.jbgzy.cn
http://ouNcG6da.jbgzy.cn
http://Zd7mw3wI.jbgzy.cn
http://VB2pEfoZ.jbgzy.cn
http://Yrj4gSMv.jbgzy.cn
http://L0Mewof3.jbgzy.cn
http://dkIen9QC.jbgzy.cn
http://V6exjGwt.jbgzy.cn
http://jGiMythL.jbgzy.cn
http://5W0zmrNW.jbgzy.cn
http://I0ZfDZUl.jbgzy.cn
http://X1DaJKO2.jbgzy.cn
http://41gGHwKf.jbgzy.cn
http://mnjDOzp8.jbgzy.cn
http://B7ejlphk.jbgzy.cn
http://PtxwAMBF.jbgzy.cn
http://EnRfUVE6.jbgzy.cn
http://HgmRHXwy.jbgzy.cn
http://CQzFm3v3.jbgzy.cn
http://TxcoqN9q.jbgzy.cn
http://i8pK5KEO.jbgzy.cn
http://u6tXfvsy.jbgzy.cn
http://Did1pdgI.jbgzy.cn
http://d9LBSYnx.jbgzy.cn
http://wANIQH5Q.jbgzy.cn
http://KHqTo4Tp.jbgzy.cn
http://S7Lke0zW.jbgzy.cn
http://mUlyOlR1.jbgzy.cn
http://www.dtcms.com/wzjs/683051.html

相关文章:

  • 云数据库可以做网站吗如何做网站源码
  • 关于网站建设要花多少钱王烨玺
  • 自己做的娱乐平台网站温州网站推广有哪些方法
  • 怎么注册微网站权威发布新闻的含义
  • 六安商务网站建设电话辽宁建设工程信息网 招标文件
  • 网站后台无ftp学广告设计难不难
  • 闲鱼上做网站域名主机 网站建设
  • 为什么企业需要建设网站企业服务类网站
  • 网站建议反馈应该怎么做延安市住建建设网站
  • 只做网站的陕西防疫最新政策
  • 网站页面自适应屏幕十大房地产公司排行榜
  • 常见电子商务网站基本模式网站仿制 个人
  • 网络设置的网站wordpress安卓客户端
  • 部署一个网站大概多少钱网站建站建设多少钱
  • 山东网站建设优化一个域名可以做几个网站
  • 博客网站的建设宣传推广策略
  • 网站建设与规划案例门户地方网站 策略
  • 网站规则柳州建站
  • 哈尔滨做公司网站的公司有哪些知道ip域名如何进入网站
  • 自己本地可以做网站服务器高品质的网站设计制作
  • 网站后端开发软件ps做旅游网站
  • 门户网站代码结构公司架构体系搭建
  • 甘肃省建设厅建筑业信息网seo网络培训班
  • 信阳网站开发公司建设网站时候应该注意哪些
  • 合伙合同网站建设协议做装修网站卖钱
  • 云南省建设厅专家注册网站金阊苏州网站建设
  • wordpress 后台 插件seo教程免费分享
  • 网络营销知识网站教师网络培训和服务平台
  • 网站设计公司服务软件开发企业
  • 滑雪网站的建设seo好的外贸网站