Agent Browser:Vercel 开源 AI 浏览器自动化 CLI,让 AI 智能体操控网页

# Agent Browser:Vercel 开源 AI 浏览器自动化 CLI,让 AI 智能体操控网页

## 项目简介

**Agent Browser** 是由 Vercel Labs 开发的开源浏览器自动化 CLI 工具,专为 AI 智能体设计,GitHub 已获得超过 28000 颗星。它让 AI 智能体可以通过命令行操控真实浏览器,完成网页导航、表单填写、内容提取、截图等操作,是 AI 时代浏览器自动化的全新选择。

GitHub:https://github.com/vercel-labs/agent-browser
Stars:28711 | 语言:Rust | 协议:Apache-2.0

## 核心特点

### Rust 编写,性能卓越
Agent Browser 采用 Rust 语言编写,对标 Puppeteer 和 Playwright 的功能,但运行效率更高、内存占用更低。Rust 的内存安全特性也让它在长时间运行场景下更加稳定。

###专为 AI 智能体设计
与传统的浏览器自动化工具不同,Agent Browser 从一开始就是为 AI 智能体打造的:

– **流式输出**:支持实时流式日志输出,方便 AI 感知操作进度
– **可编程接口**:简洁的 CLI 和 API,AI 易于调用
– **状态感知**:自动维护浏览器状态,AI 无需关心底层细节
– **截图理解**:内置截图和内容提取,AI 可直接理解页面内容

### 完整的浏览器支持
– 支持 Chrome/Chromium 内核
– 支持 JavaScript 执行
– 支持 Cookie 和 Session 管理
– 支持多标签页管理
– 支持浏览器扩展

### 轻量级 CLI
不需要复杂的依赖安装,一条命令即可启动浏览器进行自动化操作。

## 安装步骤

### 前提条件
– Rust 工具链(用于源码编译)
– 或直接下载预编译二进制(推荐)

### 方法一:下载预编译版本(推荐)
前往 GitHub Releases 下载对应平台的二进制文件:
“`bash
# macOS (Apple Silicon)
curl -fsSL https://github.com/vercel-labs/agent-browser/releases/latest/download/agent-browser-macos-arm64 -o /usr/local/bin/agent-browser
chmod +x /usr/local/bin/agent-browser

# macOS (Intel)
curl -fsSL https://github.com/vercel-labs/agent-browser/releases/latest/download/agent-browser-macos-x64 -o /usr/local/bin/agent-browser
chmod +x /usr/local/bin/agent-browser

# Linux
curl -fsSL https://github.com/vercel-labs/agent-browser/releases/latest/download/agent-browser-linux -o /usr/local/bin/agent-browser
chmod +x /usr/local/bin/agent-browser

# Windows
# 下载 .exe 文件并添加到 PATH
“`

### 方法二:源码编译
“`bash
# 安装 Rust
curl –proto ‘=https’ –tlsv1.2 -sSf https://sh.rustup.rs | sh

# 克隆源码
git clone https://github.com/vercel-labs/agent-browser.git
cd agent-browser

# 编译
cargo build –release

# 二进制文件在 target/release/agent-browser
“`

### 方法三:npm 全局安装
“`bash
npm install -g @vercel/agent-browser
“`

## 使用方法

### 基本命令

Agent Browser 提供直观的子命令结构:

“`bash
# 启动浏览器
agent-browser launch

# 导航到指定页面
agent-browser navigate “https://www.example.com”

# 截取当前页面截图
agent-browser screenshot –output page.png

# 提取页面文本内容
agent-browser extract –text

# 在页面中执行 JavaScript
agent-browser evaluate “document.title”
“`

### 交互式操作

“`bash
# 点击页面元素(通过 CSS 选择器)
agent-browser click “#submit-button”

# 填写表单
agent-browser fill –selector “input[name=email]” –value “test@example.com”

# 提交表单
agent-browser submit “#login-form”

# 等待元素出现
agent-browser wait –selector “.result-content” –timeout 5000

# 滚动页面
agent-browser scroll –direction down –amount 3
“`

### 高级用法

“`bash
# 多标签页管理
agent-browser tabs list # 列出所有标签页
agent-browser tabs new “https://example.com” # 打开新标签页
agent-browser tabs switch 2 # 切换到第2个标签页

# Cookie 管理
agent-browser cookie set –name token –value abc123
agent-browser cookie list

# 开发者工具协议
agent-browser devtools connect # 连接 DevTools 协议
“`

### 作为库使用

Agent Browser 也可作为 Rust 库集成到其他项目中:
“`toml
# Cargo.toml
[dependencies]
agent-browser = { git = “https://github.com/vercel-labs/agent-browser” }
“`

“`rust
use agent_browser::{Browser, BrowserConfig};

#[tokio::main]
async fn main() -> Result<(), Box> {
let browser = Browser::new(BrowserConfig::default()).await?;
let page = browser.new_page().await?;

page.goto(“https://example.com”).await?;
let title = page.title().await?;
println!(“Page title: {}”, title);

page.screenshot(“screenshot.png”).await?;
browser.close().await?;
Ok(())
}
“`

## AI 智能体集成

Agent Browser 最核心的使用场景是作为 AI 智能体的”眼睛和手”:

“`python
# Python 示例:让 AI 智能体操控浏览器
import subprocess

def ai_browser_action(action: str, params: dict):
cmd = [“agent-browser”, action]
for k, v in params.items():
cmd.extend([f”–{k}”, str(v)])

result = subprocess.run(cmd, capture_output=True, text=True)
return result.stdout

# AI 调用示例
result = ai_browser_action(“navigate”, {“url”: “https://github.com”})
result = ai_browser_action(“extract”, {“text”: True})
result = ai_browser_action(“screenshot”, {“output”: “github_home.png”})
“`

在 AI 智能体中使用时,Agent Browser 可以让 AI:
– 自动搜索网页内容
– 填写并提交网页表单
– 从网页提取结构化数据
– 截取页面截图供视觉分析
– 执行复杂的网页操作序列

## 适用场景

### AI 智能体网页操作
需要 AI 智能体操作网页(如自动发帖、数据采集、表单提交等)的场景,Agent Browser 是目前最轻量的选择。

### 网页测试自动化
替代 Selenium/Puppeteer/Playwright 进行网页自动化测试,Rust 性能更优。

### 数据采集
从需要 JavaScript 渲染的动态网页中提取数据。

### 截图服务
提供网页截图服务,支持各种分辨率和设备模拟。

## 与 Playwright / Puppeteer 对比

| 特性 | Agent Browser | Playwright | Puppeteer |
|——|————–|————|———–|
| 性能 | ★★★★★ | ★★★☆☆ | ★★★☆☆ |
| 内存占用 | 低 | 中 | 中 |
| AI 友好度 | ★★★★★ | ★★★☆☆ | ★★★☆☆ |
| 安装便捷性 | ★★★★★ | ★★★☆☆ | ★★★☆☆ |
| 语言绑定 | Rust/Python/JS | 多语言 | Node.js |
| 社区生态 | 新兴 | 成熟 | 成熟 |

## 开源协议

Agent Browser 采用 Apache-2.0 开源协议,可以免费商用。

## 总结

Agent Browser 是 Vercel 面向 AI 时代打造的浏览器自动化工具,Rust 编写带来出色的性能,简洁的 CLI 设计让 AI 智能体可以轻松操控浏览器完成各种网页操作。相比传统浏览器自动化工具,它更轻量、更 AI 友好,是 AI 应用中网页自动化场景的优质选择。


服务支持:如有兴趣不会搭建,可以联系微信:WRYD6166,开源项目搭建10-50元。

© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容