# Agent Browser:Vercel 开源 AI 浏览器自动化 CLI,让 AI 智能体操控网页
## 项目简介
**Agent Browser** 是由 Vercel Labs 开发的开源浏览器自动化 CLI 工具,专为 AI 智能体设计,GitHub 已获得超过 28000 颗星。它让 AI 智能体可以通过命令行操控真实浏览器,完成网页导航、表单填写、内容提取、截图等操作,是 AI 时代浏览器自动化的全新选择。
GitHub:https://github.com/vercel-labs/agent-browser
Stars:28711 | 语言:Rust | 协议:Apache-2.0
## 核心特点
### Rust 编写,性能卓越
Agent Browser 采用 Rust 语言编写,对标 Puppeteer 和 Playwright 的功能,但运行效率更高、内存占用更低。Rust 的内存安全特性也让它在长时间运行场景下更加稳定。
###专为 AI 智能体设计
与传统的浏览器自动化工具不同,Agent Browser 从一开始就是为 AI 智能体打造的:
– **流式输出**:支持实时流式日志输出,方便 AI 感知操作进度
– **可编程接口**:简洁的 CLI 和 API,AI 易于调用
– **状态感知**:自动维护浏览器状态,AI 无需关心底层细节
– **截图理解**:内置截图和内容提取,AI 可直接理解页面内容
### 完整的浏览器支持
– 支持 Chrome/Chromium 内核
– 支持 JavaScript 执行
– 支持 Cookie 和 Session 管理
– 支持多标签页管理
– 支持浏览器扩展
### 轻量级 CLI
不需要复杂的依赖安装,一条命令即可启动浏览器进行自动化操作。
## 安装步骤
### 前提条件
– Rust 工具链(用于源码编译)
– 或直接下载预编译二进制(推荐)
### 方法一:下载预编译版本(推荐)
前往 GitHub Releases 下载对应平台的二进制文件:
“`bash
# macOS (Apple Silicon)
curl -fsSL https://github.com/vercel-labs/agent-browser/releases/latest/download/agent-browser-macos-arm64 -o /usr/local/bin/agent-browser
chmod +x /usr/local/bin/agent-browser
# macOS (Intel)
curl -fsSL https://github.com/vercel-labs/agent-browser/releases/latest/download/agent-browser-macos-x64 -o /usr/local/bin/agent-browser
chmod +x /usr/local/bin/agent-browser
# Linux
curl -fsSL https://github.com/vercel-labs/agent-browser/releases/latest/download/agent-browser-linux -o /usr/local/bin/agent-browser
chmod +x /usr/local/bin/agent-browser
# Windows
# 下载 .exe 文件并添加到 PATH
“`
### 方法二:源码编译
“`bash
# 安装 Rust
curl –proto ‘=https’ –tlsv1.2 -sSf https://sh.rustup.rs | sh
# 克隆源码
git clone https://github.com/vercel-labs/agent-browser.git
cd agent-browser
# 编译
cargo build –release
# 二进制文件在 target/release/agent-browser
“`
### 方法三:npm 全局安装
“`bash
npm install -g @vercel/agent-browser
“`
## 使用方法
### 基本命令
Agent Browser 提供直观的子命令结构:
“`bash
# 启动浏览器
agent-browser launch
# 导航到指定页面
agent-browser navigate “https://www.example.com”
# 截取当前页面截图
agent-browser screenshot –output page.png
# 提取页面文本内容
agent-browser extract –text
# 在页面中执行 JavaScript
agent-browser evaluate “document.title”
“`
### 交互式操作
“`bash
# 点击页面元素(通过 CSS 选择器)
agent-browser click “#submit-button”
# 填写表单
agent-browser fill –selector “input[name=email]” –value “test@example.com”
# 提交表单
agent-browser submit “#login-form”
# 等待元素出现
agent-browser wait –selector “.result-content” –timeout 5000
# 滚动页面
agent-browser scroll –direction down –amount 3
“`
### 高级用法
“`bash
# 多标签页管理
agent-browser tabs list # 列出所有标签页
agent-browser tabs new “https://example.com” # 打开新标签页
agent-browser tabs switch 2 # 切换到第2个标签页
# Cookie 管理
agent-browser cookie set –name token –value abc123
agent-browser cookie list
# 开发者工具协议
agent-browser devtools connect # 连接 DevTools 协议
“`
### 作为库使用
Agent Browser 也可作为 Rust 库集成到其他项目中:
“`toml
# Cargo.toml
[dependencies]
agent-browser = { git = “https://github.com/vercel-labs/agent-browser” }
“`
“`rust
use agent_browser::{Browser, BrowserConfig};
#[tokio::main]
async fn main() -> Result<(), Box
let browser = Browser::new(BrowserConfig::default()).await?;
let page = browser.new_page().await?;
page.goto(“https://example.com”).await?;
let title = page.title().await?;
println!(“Page title: {}”, title);
page.screenshot(“screenshot.png”).await?;
browser.close().await?;
Ok(())
}
“`
## AI 智能体集成
Agent Browser 最核心的使用场景是作为 AI 智能体的”眼睛和手”:
“`python
# Python 示例:让 AI 智能体操控浏览器
import subprocess
def ai_browser_action(action: str, params: dict):
cmd = [“agent-browser”, action]
for k, v in params.items():
cmd.extend([f”–{k}”, str(v)])
result = subprocess.run(cmd, capture_output=True, text=True)
return result.stdout
# AI 调用示例
result = ai_browser_action(“navigate”, {“url”: “https://github.com”})
result = ai_browser_action(“extract”, {“text”: True})
result = ai_browser_action(“screenshot”, {“output”: “github_home.png”})
“`
在 AI 智能体中使用时,Agent Browser 可以让 AI:
– 自动搜索网页内容
– 填写并提交网页表单
– 从网页提取结构化数据
– 截取页面截图供视觉分析
– 执行复杂的网页操作序列
## 适用场景
### AI 智能体网页操作
需要 AI 智能体操作网页(如自动发帖、数据采集、表单提交等)的场景,Agent Browser 是目前最轻量的选择。
### 网页测试自动化
替代 Selenium/Puppeteer/Playwright 进行网页自动化测试,Rust 性能更优。
### 数据采集
从需要 JavaScript 渲染的动态网页中提取数据。
### 截图服务
提供网页截图服务,支持各种分辨率和设备模拟。
## 与 Playwright / Puppeteer 对比
| 特性 | Agent Browser | Playwright | Puppeteer |
|——|————–|————|———–|
| 性能 | ★★★★★ | ★★★☆☆ | ★★★☆☆ |
| 内存占用 | 低 | 中 | 中 |
| AI 友好度 | ★★★★★ | ★★★☆☆ | ★★★☆☆ |
| 安装便捷性 | ★★★★★ | ★★★☆☆ | ★★★☆☆ |
| 语言绑定 | Rust/Python/JS | 多语言 | Node.js |
| 社区生态 | 新兴 | 成熟 | 成熟 |
## 开源协议
Agent Browser 采用 Apache-2.0 开源协议,可以免费商用。
## 总结
Agent Browser 是 Vercel 面向 AI 时代打造的浏览器自动化工具,Rust 编写带来出色的性能,简洁的 CLI 设计让 AI 智能体可以轻松操控浏览器完成各种网页操作。相比传统浏览器自动化工具,它更轻量、更 AI 友好,是 AI 应用中网页自动化场景的优质选择。
服务支持:如有兴趣不会搭建,可以联系微信:WRYD6166,开源项目搭建10-50元。









暂无评论内容