Vibium:让 AI 代理真正看见网页的浏览器自动化框架

AI 代理如何学会控制浏览器?Vibium 就是答案。这是一个专为 AI 代理设计的浏览器自动化框架,让 AI 能够像人一样浏览网页、填写表单、点击按钮、截图——全部通过简单的 CLI 命令完成。

项目介绍

Vibium 不仅仅是一个浏览器自动化工具,更是 AI 代理的”浏览器技能包”。它基于 WebDriver BiDi 标准(非私有协议),轻量高效,单二进制文件仅约 10MB,无需任何运行时依赖。安装后 AI 代理即可掌握完整的浏览器自动化能力。

核心特色

  • AI 原生设计:作为技能安装后,AI 代理立即掌握全部浏览器操作能力
  • 零配置:一条命令安装,浏览器自动下载,开箱即用
  • 标准协议:基于 WebDriver BiDi,不依赖任何大厂私有协议
  • 轻量小巧:单文件约 10MB,无额外运行时依赖
  • 多语言支持:提供 JS/TS、Python、Java 客户端库以及 CLI 和 MCP 服务器
  • 灵活部署:可作为 CLI 技能、MCP 服务器或库集成到项目中

安装方法

通过 npm 全局安装(推荐)

npm install -g vibium

第一条命令会安装 Vibium 二进制文件并自动下载 Chrome。

为 AI 代理添加技能

npx skills add https://github.com/VibiumDev/vibium --skill vibe-check

Docker 运行

docker run -p 9222:9222 vibiumdev/vibium

基本使用方法

CLI 快速参考

# 导航到指定 URL
vibium go https://example.com

# 截图当前页面
vibium screenshot

# 获取页面快照(可访问性树)
vibium snapshot

# 点击元素
vibium click "提交按钮"

# 填写表单
vibium fill "username" "myuser"
vibium fill "password" "mypass"

作为 Python 库使用

from vibium import Browser

browser = Browser()
page = browser.go("https://example.com")
page.fill("input[name='q']", "search term")
page.click('[type="submit"]')
browser.close()

适用场景

  • AI 代理的网页自动化操作
  • 网页数据采集和抓取
  • 自动化测试(替代 Selenium/Playwright)
  • 定时任务中的网页操作
  • MCP 服务器集成,为 AI 提供网页访问能力

开源协议

Vibium 采用 Apache 2.0 许可证开源。


服务支持:如有兴趣不会搭建,可以联系微信:WRYD6166,开源项目搭建10-50元。

© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容