AI 代理如何学会控制浏览器?Vibium 就是答案。这是一个专为 AI 代理设计的浏览器自动化框架,让 AI 能够像人一样浏览网页、填写表单、点击按钮、截图——全部通过简单的 CLI 命令完成。
项目介绍
Vibium 不仅仅是一个浏览器自动化工具,更是 AI 代理的”浏览器技能包”。它基于 WebDriver BiDi 标准(非私有协议),轻量高效,单二进制文件仅约 10MB,无需任何运行时依赖。安装后 AI 代理即可掌握完整的浏览器自动化能力。
核心特色
- AI 原生设计:作为技能安装后,AI 代理立即掌握全部浏览器操作能力
- 零配置:一条命令安装,浏览器自动下载,开箱即用
- 标准协议:基于 WebDriver BiDi,不依赖任何大厂私有协议
- 轻量小巧:单文件约 10MB,无额外运行时依赖
- 多语言支持:提供 JS/TS、Python、Java 客户端库以及 CLI 和 MCP 服务器
- 灵活部署:可作为 CLI 技能、MCP 服务器或库集成到项目中
安装方法
通过 npm 全局安装(推荐):
npm install -g vibium
第一条命令会安装 Vibium 二进制文件并自动下载 Chrome。
为 AI 代理添加技能:
npx skills add https://github.com/VibiumDev/vibium --skill vibe-check
Docker 运行:
docker run -p 9222:9222 vibiumdev/vibium
基本使用方法
CLI 快速参考:
# 导航到指定 URL
vibium go https://example.com
# 截图当前页面
vibium screenshot
# 获取页面快照(可访问性树)
vibium snapshot
# 点击元素
vibium click "提交按钮"
# 填写表单
vibium fill "username" "myuser"
vibium fill "password" "mypass"
作为 Python 库使用:
from vibium import Browser
browser = Browser()
page = browser.go("https://example.com")
page.fill("input[name='q']", "search term")
page.click('[type="submit"]')
browser.close()
适用场景
- AI 代理的网页自动化操作
- 网页数据采集和抓取
- 自动化测试(替代 Selenium/Playwright)
- 定时任务中的网页操作
- MCP 服务器集成,为 AI 提供网页访问能力
开源协议
Vibium 采用 Apache 2.0 许可证开源。
服务支持:如有兴趣不会搭建,可以联系微信:WRYD6166,开源项目搭建10-50元。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END








暂无评论内容