vercel-labs推出的agent-browser(https://github.com/vercel-labs/agent-browser)是一个专为AI Agent设计的浏览器自动化CLI工具,使用Rust语言开发,性能极强且原生支持命令行操作。
为什么需要它
传统浏览器自动化工具如Selenium、Puppeteer、Playwright更面向人类用户界面,而agent-browser完全面向AI Agent:它提供简洁CLI接口,AI Agent只需通过命令即可控制浏览器执行各种操作,包括网页导航、截图、点击、填表、提取内容等。
这个工具的定位是让AI Agent能够像人类一样使用浏览器,是LLM Agent能力的重要扩展。
安装方法
npm install -g agent-browser
agent-browser install
# 或者 Homebrew
brew install agent-browser
agent-browser install
# 或者 Rust
cargo install agent-browser
agent-browser install
基本使用
# 打开网页
agent-browser open https://www.example.com
# 截图
agent-browser screenshot --url https://www.example.com --output page.png
# 执行JavaScript
agent-browser evaluate --url https://www.example.com --script "document.title"
# 点击元素
agent-browser click --selector "button.submit"
# 填表
agent-browser fill --selector "input[name=email]" --value "test@example.com"
进阶用法
agent-browser支持管道式操作,可以串联多个命令实现复杂工作流。支持无头模式(headless),适合服务器环境运行。可以用console子命令实时查看页面JS日志,方便调试AI Agent行为。
适用场景
最适合:为AI Agent赋予网页浏览和操作能力、自动化测试Web应用、从网页批量采集数据、自动填写和提交表单、监控网站变化。比传统爬虫更灵活,能处理需要JS渲染的现代Web应用。
开源协议
采用MIT开源协议,由Vercel Labs维护。
服务支持:如有兴趣不会搭建,可以联系微信:WRYD6166,开源项目搭建10-50元。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END









暂无评论内容