在AI快速发展的今天,让AI自动完成网页操作已经成为现实。browser-use 是一个令人惊叹的开源项目,它能够将任何大语言模型连接到浏览器,实现真正的网页自动化操作。目前该项目已获得超过87,000颗GitHub星标,是AI浏览器自动化领域最受欢迎的工具之一。
项目介绍
browser-use 的核心理念是「让AI代理像人类一样使用浏览器」。它通过视觉理解和DOM分析,让AI能够看到网页内容、理解页面结构,并执行点击、输入、滚动等操作。与传统的网页爬虫不同,browser-use 不需要预先定义爬取规则,AI可以自主决策如何与网页交互。
该项目的设计充分考虑了开发者的使用体验,提供了简洁优雅的Python API,让开发者可以在几分钟内就开始使用。
核心特性
browser-use 具备多项强大功能:支持所有主流浏览器(Chrome、Firefox等);与OpenAI、Anthropic、Google Gemini等主流LLM无缝集成;提供云端版本,无需配置本地环境,开箱即用;支持MCP扩展;内置反检测机制,模拟真实用户行为;支持截图、DOM提取等调试功能。
安装步骤
browser-use 要求Python 3.11或更高版本。使用 uv 包管理器安装最为便捷:
uv init
uv add browser-use
uvx browser-use install
也可以使用传统pip安装:pip install browser-use
快速上手
安装完成后,只需几行Python代码就可以让AI操控浏览器:
from browser_use import Agent, Browser, ChatBrowserUse
import asyncio
async def main():
browser = Browser()
agent = Agent(
task="帮我搜索 GitHub 上最火的开源项目",
llm=ChatBrowserUse(),
browser=browser,
)
result = await agent.run()
print(result)
asyncio.run(main())
AI会自动打开浏览器、访问GitHub、执行搜索并返回结果。整个过程无需人工干预。
配置API密钥
在项目根目录创建 .env 文件配置API密钥:
BROWSER_USE_API_KEY=your-key
ANTHROPIC_API_KEY=your-key
进阶用法
如果不想配置本地浏览器环境,可以使用云端版本,获得更好的隐身模式和更稳定的自动化体验:
browser = Browser(use_cloud=True)
agent = Agent(task="你的任务", browser=browser)
browser-use 还提供了专门的Agent提示词,可以让Cursor、Claude Code等编程助手直接操控浏览器。
使用场景
browser-use 的应用场景非常广泛:自动化测试Web应用;数据采集;表单自动填写;社交媒体管理;竞品网站内容监控。
开源协议
browser-use 采用 MIT 开源协议,允许自由使用、修改和商业化。
服务支持:如有兴趣不会搭建,可以联系微信:WRYD6166,开源项目搭建10-50元。












暂无评论内容