openclaw browser
管理 OpenClaw 的浏览器控制面并执行浏览器操作(生命周期、配置文件、标签页、快照、截图、导航、输入、状态模拟和调试)。
相关:
- 浏览器工具 + API:Browser tool
常用标志
--url <gatewayWsUrl>:Gateway WebSocket URL(默认取配置)。--token <token>:Gateway 令牌(如需要)。--timeout <ms>:请求超时时间(毫秒)。--expect-final:等待最终的 Gateway 响应。--browser-profile <name>:选择浏览器配置文件(默认取配置)。--json:机器可读输出(在支持时)。
快速开始(本地)
browser({ action: "doctor" }) 执行相同的就绪检查。
快速排障
如果start 失败并提示 not reachable after start,请先排查 CDP 就绪状态。如果 start 和 tabs 成功,但 open 或 navigate 失败,则浏览器控制平面是健康的,失败通常是导航 SSRF 策略所致。
最小执行序列:
生命周期
doctor --deep会增加一次实时快照探测。当基础 CDP 就绪状态正常,但你想确认当前标签页是否可被检查时,它很有用。- 对于
attachOnly和远程 CDP 配置文件,openclaw browser stop会关闭当前控制会话并清除临时模拟覆盖,即使 OpenClaw 并未亲自启动浏览器进程也是如此。 - 对于本地托管配置文件,
openclaw browser stop会停止启动的浏览器进程。 openclaw browser start --headless仅对该次启动请求生效,并且只在 OpenClaw 启动本地托管浏览器时生效。它不会重写browser.headless或配置文件配置,并且对于已在运行的浏览器没有效果。- 在没有
DISPLAY或WAYLAND_DISPLAY的 Linux 主机上,本地托管配置文件会自动以无头模式运行,除非OPENCLAW_BROWSER_HEADLESS=0、browser.headless=false或browser.profiles.<name>.headless=false明确要求可见浏览器。
如果命令缺失
如果openclaw browser 是未知命令,请检查 ~/.openclaw/openclaw.json 中的 plugins.allow。
当存在 plugins.allow 时,除非配置中已经有根级 browser 块,否则需要显式列出内置的 browser 插件:
browser 块,例如 browser.enabled=true 或 browser.profiles.<name>,也会在受限的插件允许列表下激活内置 browser 插件。
相关:Browser tool
配置文件
配置文件是命名的浏览器路由配置。实际使用中:openclaw:启动或连接到由 OpenClaw 专用管理的 Chrome 实例(隔离的用户数据目录)。user:通过 Chrome DevTools MCP 控制你现有的已登录 Chrome 会话。- 自定义 CDP 配置文件:指向本地或远程 CDP 端点。
标签页
tabs 先返回 suggestedTargetId,然后返回稳定的 tabId(如 t1)、可选标签以及原始 targetId。代理应将 suggestedTargetId 传回 focus、close、快照和操作。你可以使用 open --label、tab new --label 或 tab label 分配标签;标签、tab id、原始 target id 和唯一的 target-id 前缀都可接受。请求字段仍名为 targetId 以保持兼容,但它接受这些标签页引用。请将原始 target id 视为诊断句柄,而不是持久的代理记忆。当 Chromium 在导航或表单提交期间替换底层原始 target 时,OpenClaw 会在能够证明匹配时,将稳定的 tabId/标签附加到替换后的标签页。原始 target id 仍然会变化;优先使用 suggestedTargetId。
快照 / 截图 / 操作
快照:--full-page仅用于整页捕获;它不能与--ref或--element组合使用。existing-session/user配置文件支持整页截图和来自快照输出的--ref截图,但不支持 CSS--element截图。--labels会在截图上叠加当前快照 ref。snapshot --urls会将发现的链接目标附加到 AI 快照中,以便代理可以直接选择导航目标,而不是仅凭链接文本猜测。
evaluate --fn 接受函数源代码、表达式或语句体。语句体会被包装为 async 函数,因此想要返回值时请使用 return。当页面侧函数可能需要比默认 evaluate 超时更长的时间时,请使用 evaluate --timeout-ms <ms>。
动作响应会在动作触发页面替换后返回当前原始 targetId,前提是 OpenClaw 能证明替换后的标签页。脚本仍应在长期工作流中存储并传递 suggestedTargetId/标签。
文件 + 对话框辅助:
/tmp/openclaw/downloads,或配置的临时根目录)。当代理需要等待特定文件并返回其路径时,请使用 waitfordownload 或 download;这些显式等待器负责接管下一次下载。上传接受来自 OpenClaw 临时 uploads 根目录和 OpenClaw 管理的 inbound media 的文件,包括 media://inbound/<id> 和 sandbox 相对的 media/inbound/<id> 引用。嵌套 media 引用、路径穿越和任意本地路径仍会被拒绝。当操作打开模态对话框时,操作响应会返回 blockedByDialog 和 browserState.dialogs.pending;请传入 --dialog-id 直接应答。OpenClaw 之外处理的对话框会出现在 browserState.dialogs.recent 中。
状态和存储
视口 + 模拟:调试
通过 MCP 使用现有 Chrome
使用内置的user 配置文件,或创建你自己的 existing-session 配置文件:
- 基于快照的操作使用 ref,而不是 CSS 选择器
- 当调用方省略
timeoutMs时,browser.actionTimeoutMs会将受支持的act请求的默认超时时间设为 60000 ms;单次调用的timeoutMs仍然优先。 click仅支持左键点击type不支持slowly=truepress不支持delayMshover、scrollintoview、drag、select、fill和evaluate不接受单次调用的超时覆盖select仅支持一个值wait --load networkidle不受支持- 文件上传需要
--ref/--input-ref,不支持 CSS--element,且当前一次只支持一个文件 - 对话框钩子不支持
--timeout - 截图支持整页捕获和
--ref,但不支持 CSS--element responsebody、下载拦截、PDF 导出和批量操作仍需要托管浏览器或原始 CDP 配置文件
远程浏览器控制(node host 代理)
如果 Gateway 运行在与浏览器不同的机器上,请在安装了 Chrome/Brave/Edge/Chromium 的机器上运行 node host。Gateway 会将浏览器操作代理到该 node(不需要单独的浏览器控制服务器)。 使用gateway.nodes.browser.mode 控制自动路由,若连接了多个 node,则使用 gateway.nodes.browser.node 固定到特定 node。
安全与远程设置:Browser tool、Remote access、Tailscale、Security