agent-browser:专为AI Agent构建的无头浏览器自动化CLI，通过原生Rust架构提供紧凑的文本输出和快速命令执行。

产品概览

什么是agent-browser?

agent-browser是一个专为AI Agent和运行其中的编程助手（包括Claude Code、Cursor、GitHub Copilot、OpenAI Codex和Google Gemini）构建的浏览器自动化命令行工具。它输出紧凑的无障碍树而不是原始HTML或JSON，大幅减少token消耗，同时通过基于引用的元素选择系统为Agent提供对网页的确定性控制。该工具基于客户端-守护进程架构构建：原生Rust CLI以近乎瞬时的速度处理命令解析，而持久化的Node.js守护进程管理底层的Playwright浏览器实例。拥有50多个命令，涵盖导航、表单交互、截图、网络检查和存储，agent-browser为跨macOS、Linux和Windows的自动化Agent工作流提供全周期浏览器控制优化。

主要功能

●

基于引用的元素选择

快照命令返回紧凑的无障碍树，其中每个元素都带有唯一的引用（例如 @e1），实现确定性、无需重新查询的交互，避免歧义。

●

Token高效输出

基于文本的无障碍树输出每个快照大约使用200-400个token，相比完整DOM输出的3000-5000个token，保持Agent上下文窗口精简。

●

原生Rust CLI性能

命令解析由原生Rust二进制文件处理，启动瞬间完成，持久化的Node.js守护进程在后台管理Playwright浏览器实例。

●

50+浏览器命令

全面的命令集涵盖页面导航、表单填写、点击、截图、网络监控和存储管理，实现端到端浏览器控制。

●

多会话支持

同时运行多个隔离的浏览器实例，每个实例都有独立的认证状态，支持并行Agent任务或多账户工作流。

●

跨平台兼容性

提供macOS（ARM64和x64）、Linux（ARM64和x64）和Windows（x64）的原生二进制文件，npm回退确保广泛的环境覆盖。

1. 什么是agent-browser？⌄

一个专为AI Agent设计的无头浏览器自动化CLI。它为Agent提供确定性的浏览器控制，同时通过紧凑的文本输出保持较低的token使用量。

2. 如何安装？⌄

在任何平台上运行`npm install -g agent-browser`，在macOS上运行`brew install agent-browser`，或通过`npx agent-browser open example.com`无需安装即可试用。

3. 基于引用的选择比CSS选择器好在哪里？⌄

引用是从实时无障碍树快照中分配的，因此它们指向确切的元素而无需重新查询DOM。这更快并且消除了选择器不匹配错误。

4. 它与哪些AI编程工具兼容？⌄

Claude Code、Cursor、GitHub Copilot、OpenAI Codex、Google Gemini、opencode，以及任何能够运行shell命令的Agent。

5. 为什么token效率很重要？⌄

完整的DOM转储每页可能消耗3000-5000个token。agent-browser的文本快照使用200-400个token，直接减少每个浏览步骤的延迟和API成本。

6. 我可以同时运行多个浏览器会话吗？⌄

是的。agent-browser支持多个隔离会话，具有独立的认证状态，适用于并行任务或多账户场景。

7. 它在Windows上工作吗？⌄

是的。提供macOS（ARM64/x64）、Linux（ARM64/x64）和Windows（x64）的原生二进制文件。

agent-browser网站分析

agent-browser流量与排名

481

月访问量

00:00:00

平均访问时长

分类排名

0.39%

用户跳出率

流量趋势：Feb 2026 - Apr 2026

agent-browser主要用户地区

● 🇺🇸 US: 99.99%

● Others: 0.01%