当前位置: 首页 > news >正文

browser-use开源程序使 AI 代理可以访问网站,自动完成特定的指定任务,告诉您的计算机该做什么,它就会完成它。

一、软件介绍

文末提供程序和源码下载

      browser-use开源程序使 AI 代理可以访问网站,自动完成特定的指定任务,浏览器使用是将AI代理与浏览器连接的最简单方法。告诉您的计算机该做什么,它就会完成它。

二、快速开始

使用 pip (Python>=3.11):

pip install browser-use
Install Playwright:  安装 Playwright:

playwright install chromium
Spin up your agent:  启动您的代理:

from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio
from dotenv import load_dotenv
load_dotenv()

async def main():
    agent = Agent(
        task="Compare the price of gpt-4o and DeepSeek-V3",
        llm=ChatOpenAI(model="gpt-4o"),
    )
    await agent.run()

asyncio.run(main())
Add your API keys for the provider you want to use to your .env file.
将要使用的提供程序的 API 密钥添加到 .env 文件中。

OPENAI_API_KEY=
ANTHROPIC_API_KEY=
AZURE_ENDPOINT=
AZURE_OPENAI_API_KEY=
GEMINI_API_KEY=
DEEPSEEK_API_KEY=

 使用 UI 进行测试

简单地运行 gradio 示例:

uv pip install gradio
python examples/ui/gradio_demo.py

三、演示

任务 :将杂货添加到购物车,然后结帐。

提示:将我最新的 LinkedIn 关注者添加到 Salesforce 中的潜在客户中。

提示 :阅读我的简历并找到 ML 工作,将它们保存到一个文件中,然后在新的标签页中开始申请它们,如果你需要帮助,就问我。

提示 :在 Google Docs 中写一封信给我爸爸,感谢他所做的一切,并将文档保存为 PDF

提示 :在 Hugging face 上查找具有 cc-by-sa-4.0 许可证的模型,并按点赞数排序,将前 5 名保存到文件中

四、其他

Agent  代理
 Improve agent memory (summarize, compress, RAG, etc.)
改进代理内存(summarize、compress、RAG 等)
 Enhance planning capabilities (load website specific context)
增强规划功能(加载网站特定上下文)
 Reduce token consumption (system prompt, DOM state)
减少 Token 消耗(系统提示符、DOM 状态)
DOM Extraction  DOM 提取
 Improve extraction for datepickers, dropdowns, special elements
改进日期选择器、下拉列表、特殊元素的提取
 Improve state representation for UI elements
改进 UI 元素的状态表示
Rerunning tasks  重新运行任务
 LLM as fallback  LLM作为 fallback
 Make it easy to define workflow templates where LLM fills in the details
轻松定义工作流模板,其中LLM填写详细信息
 Return playwright script from the agent
从代理处返回 playwauthor 脚本
Datasets  数据
 Create datasets for complex tasks
为复杂任务创建数据集
 Benchmark various models against each other
将各种模型相互进行基准测试
 Fine-tuning models for specific tasks
针对特定任务微调模型
User Experience  用户体验
 Human-in-the-loop execution
人机交互执行
 Improve the generated GIF quality
提高生成的 GIF 质量
 Create various demos for tutorial execution, job application, QA testing, social media, etc.
为教程执行、工作申请、QA 测试、社交媒体等创建各种演示。

五、软件下载

夸克网盘分享

本文信息来源于GitHub作者地址:https://github.com/browser-use/browser-use

相关文章:

  • 大模型论文:Improving Language Understanding by Generative Pre-Training
  • windterm终端软件使用
  • React-Markdown 组件底层实现原理详解
  • 服务异常挂掉问题:java invoked oom-killer
  • 数字三角形(dfs+动态规划)通过率未达100%
  • 第三次PID状态机
  • 评价区动态加载是怎么实现的?
  • 【AI学习】初步了解Gradio
  • Motionface MFvector照片一键转矢量工具使用教程
  • LeetCode算法题(Go语言实现)_34
  • 排序扩展-文件递归排序(外排序)
  • [ERROR] Some problems were encountered while processing the POMs
  • 鸿蒙开发_ARKTS快速入门_语法说明_组件声明_组件手册查看---纯血鸿蒙HarmonyOS5.0工作笔记010
  • 1631. 最小体力消耗路径
  • Quartz 数据持久化 接入MySQL数据库 数据不丢失 数据入库
  • 人工智能通识速览(Part4. 评估指标)
  • Android WiFi协议之P2P介绍与实践
  • git功能点管理
  • Redis 与 MongoDB 对比分析
  • Stable Diffusion XL、SD3 与 Flux 模型常用优化器总结
  • 自然资源部:适应存量时代城市更新发展,严控增量盘活存量
  • 专访《风雪夜归人》导演闫锐:在舞台上表现什么是真正的活着
  • 体坛联播|利物浦三轮不胜,孙颖莎/王楚钦晋级混双八强
  • 山西晋城一网红徒步野游线路据传发生驴友坠崖,当地已宣布封路
  • 习近平:坚持科学决策民主决策依法决策,高质量完成“十五五”规划编制工作
  • 李洋谈美国黑帮电影与黑帮文化