当前位置: 首页 > news >正文

轻松实现浏览器自动化——AI浏览器自动化框架Stagehand

The AI Browser Automation Framework

Stagehand

项目简介

The AI Browser Automation Framework 是一个先进的浏览器自动化工具,它结合了自然语言处理和传统编程,让开发者能够高效、灵活地执行网页自动化任务。通过选择使用代码或自然语言,Stagehand使得在生产环境中进行浏览器自动化变得更加简单和高效。

为什么选择Stagehand?

在现有的浏览器自动化工具中,如Selenium、Playwright或Puppeteer,往往需要编写较低级的代码,或者使用高层代理,这在生产中可能会带来不可预测性。Stagehand则通过灵活的代码与自然语言的选择,为开发者提供了更便捷的自动化解决方案。

  1. 编程与自然语言的灵活选择:在面对陌生页面时,可以使用AI辅助导航,而当知道具体操作时,则可以直接使用代码。

  2. 动作预览与缓存:Stagehand允许你在运行之前预览AI动作,并支持缓存可重复的动作,从而节省时间和费用。

  3. 一行代码集成计算机使用模型:Stagehand提供了一行代码将先进的计算机使用模型与浏览器集成,简化了复杂操作的实现。

使用示例

下面是一个使用Stagehand构建浏览器自动化的示例:

// 使用Playwright的功能在页面对象上
const page = stagehand.page;
await page.goto("https://github.com/browserbase");// 使用act()执行单个动作
await page.act("click on the stagehand repo");// 使用计算机使用代理处理较大操作
const agent = stagehand.agent({provider: "openai",model: "computer-use-preview",
});
await agent.execute("Get to the latest PR");// 使用extract()从页面中读取数据
const { author, title } = await page.extract({instruction: "extract the author and title of the PR",schema: z.object({author: z.string().describe("The username of the PR author"),title: z.string().describe("The title of the PR"),}),
});

开始使用Stagehand

开始使用Stagehand只需一行代码,或者查看我们的快速入门指南获取更多信息:

npx create-browser-app

Watch Anirudh demo create-browser-app to create a Stagehand project!

从源代码构建并运行

请按照以下步骤从源代码构建并运行Stagehand:

git clone https://github.com/browserbase/stagehand.git
cd stagehand
pnpm install
pnpm playwright install
pnpm run build
pnpm run example # 运行位于./examples/example.ts的空白脚本
pnpm run example 2048 # 运行./examples/2048.ts中的2048示例

Stagehand在您拥有LLM提供商的API密钥和Browserbase凭证时表现最佳。要将这些添加到您的项目中,请运行:

cp .env.example .env
nano .env # 编辑.env文件以添加API密钥

同类项目对比

在浏览器自动化领域,除了Stagehand,还有一些同类工具,如Selenium、Playwright和Puppeteer等。这些工具各有特点:

  • Selenium:一个支持多种编程语言的开源框架,能与不同浏览器配合使用,适用于自动化测试。
  • Playwright:由微软开发,提供强大的支持,允许多种浏览器的自动化,但通常需要更多的手动编写代码。
  • Puppeteer:主要为Chrome设计的Node库,允许控制Chrome浏览器,适合需要在浏览器中执行全栈测试的场景。

与这些工具相比,Stagehand通过自然语言与代码的灵活组合,提升了用户的操作效率与体验,是一个更加智能化的选择。

通过使用Stagehand,开发者不仅可以提升工作效率,还能大幅降低在复杂项目中可能面临的挑战。如果您在网页自动化需求中寻求更高效的解决方案,可尝试Stagehand,体验AI与编程的完美结合。

http://www.dtcms.com/a/321248.html

相关文章:

  • 力扣 hot100 Day69
  • 使用 PicGo 与 GitHub 搭建高效图床,并结合 Local Images Plus 备份原图
  • 杂谈 001 · VScode / Copilot 25.08 更新
  • 供电架构之供电构型分类
  • 浪漫沙迦2|浪漫沙加2 七英雄的复仇 送修改器(Romancing SaGa 2)免安装中文版
  • 机器视觉任务(目标检测、实例分割、姿态估计、多目标跟踪、单目标跟踪、图像分类、单目深度估计)常用算法及公开数据集分享
  • excel 导出
  • 【vue】Vue 重要基础知识清单
  • Numpy科学计算与数据分析:Numpy广播机制入门与实践
  • 使用FinTSB框架进行金融时间序列预测的完整指南
  • 算法提升之-启发式并查集
  • 剪映里面导入多张照片,p图后如何再导出多张照片?
  • VScode 文件标签栏多行显示
  • QML中显示二级界面的三种方式
  • 【Git】企业级使用
  • electron自定义国内镜像
  • 静电释放场景误报率↓78%!陌讯多模态融合算法在工业检测的落地优化
  • 【unity实战】用unity实现一个简易的战斗飞机控制器
  • BUG调试案例十七:ENC424J600以太网掉线问题案例
  • uniapp瀑布流最简单的实现方法
  • SonarQube 扫描多个微服务模块
  • 【51单片机2个按键控制流水灯转向】2022-10-25
  • 移动端开发中类似腾讯Bugly的产品推荐与比较-5款APP异常最终产品推荐-卓伊凡|bigniu
  • springBoot集成minio并实现文件的上传下载
  • 华为网路设备学习-28(BGP协议 三)路由策略
  • 怎么实现对三菱PLC的远程调试和PLC远程维护?
  • 【世纪龙科技】数智重构车身实训-汽车车身测量虚拟实训软件
  • 矩阵中的最长递增路径-记忆化搜索
  • 【ESP32-menuconfig(1) -- Build Type及Bootloader config】
  • Vue 项目安全设置方案:XSS/CSRF 防护指南