今天要推荐的是 Vercel Labs 开源的 agent-browser,这是一个完全使用 Rust 编写的原生浏览器自动化 CLI 工具,专为 AI Agent 场景打造,Star 数已突破 28000+。
项目简介
agent-browser 是一款面向 AI Agent 的浏览器自动化命令行工具,与传统基于 Node.js 的 Playwright/Puppeteer 不同,它是一款独立的原生 Rust 二进制文件,安装即可运行,无需依赖 Node 或浏览器环境。它通过 Chrome for Testing 自动下载 Chrome,或者自动检测已有的 Playwright、Chrome 等安装,零配置开箱即用。
核心特色
1. 原生 Rust,性能卓越:二进制文件无需运行时,开机即用,执行速度极快。
2. 多种安装方式:支持 npm 全局安装、Homebrew、Cargo 源码编译,或者直接下载预编译二进制。
3. 智能元素引用:通过快照(snapshot)获取无障碍树(accessibility tree),每个元素有唯一引用编号(如 @e2),AI 可以直接用引用操作元素,无需写 CSS 选择器。
4. 兼容传统选择器:同时支持 CSS 选择器、XPath、role+name 等传统定位方式。
5. 全局安装自动升级:支持 agent-browser upgrade,自动识别安装方式并升级。
安装步骤
方式一:npm 全局安装(推荐)
npm install -g agent-browser agent-browser install
方式二:Homebrew(macOS)
brew install agent-browser agent-browser install
方式三:Cargo 源码编译
cargo install agent-browser agent-browser install
Linux 用户需要安装系统依赖:
agent-browser install --with-deps
使用方法
基础操作流程:
agent-browser open example.com # 打开网页 agent-browser snapshot # 获取无障碍树 agent-browser click @e2 # 通过引用点击 agent-browser fill @e3 "test@example.com" # 填充表单 agent-browser screenshot page.png # 截图 agent-browser close # 关闭浏览器
带标注的截图:
agent-browser screenshot --annotate
这会生成一张带数字标签的截图,每个数字对应一个可交互元素,方便 AI 理解页面结构。
传统选择器方式也支持:
agent-browser click "#submit" agent-browser fill "#email" "test@example.com" agent-browser find role button click --name "Submit"
适用场景
agent-browser 非常适合以下场景:
1. AI Agent 浏览器任务:作为 AI Agent 的执行层,让大模型通过自然语言控制浏览器完成网页操作、数据采集、表单填写等任务。
2. 自动化测试:轻量级浏览器自动化脚本,比 Playwright 更简单直接。
3. 数据采集:定时抓取网页数据,配合截图记录页面状态。
4. 无头浏览器操作:在服务器环境运行,无需显示器,支持完整浏览器功能。
开源协议
agent-browser 采用 Apache-2.0 开源协议,可以免费使用、修改和分发。
服务支持:如有兴趣不会搭建,可以联系微信:WRYD6166,开源项目搭建10-50元。









暂无评论内容