Skip to main content

Documentation Index

Fetch the complete documentation index at: https://openclaw.zhcndoc.com/llms.txt

Use this file to discover all available pages before exploring further.

如需快速开始、QA 运行器、单元/集成套件以及 Docker 流程,请参见 测试。本页涵盖 实时(联网)测试 套件:模型矩阵、CLI 后端、ACP 和媒体提供商实时测试,以及 凭据处理。

实时:本地配置文件冒烟命令

在临时实时检查前先加载 ~/.profile,以便提供商密钥和本地工具 路径与当前 shell 保持一致:
source ~/.profile
安全的媒体冒烟测试:
pnpm openclaw infer tts convert --local --json \
  --text "OpenClaw live smoke." \
  --output /tmp/openclaw-live-smoke.mp3
安全的语音通话就绪冒烟测试:
pnpm openclaw voicecall setup --json
pnpm openclaw voicecall smoke --to "+15555550123"
voicecall smoke 默认是干运行,除非同时提供 --yes。仅在你 有意发起真实通知电话时才使用 --yes。对于 Twilio、Telnyx 和 Plivo,成功的就绪检查需要一个公开的 webhook URL;本地回环/私有 回退方案按设计会被拒绝。

实时:Android 节点能力扫描

  • 测试:src/gateway/android-node.capabilities.live.test.ts
  • 脚本:pnpm android:test:integration
  • 目标:调用已连接 Android 节点当前声明的每一个命令,并断言命令契约行为。
  • 范围:
    • 预置条件/手动设置(该套件不会安装/运行/配对应用)。
    • 针对所选 Android 节点逐个命令进行 gateway node.invoke 验证。
  • 必需的前置设置:
    • Android 应用已连接并与 gateway 配对。
    • 应用保持在前台。
    • 对于你期望通过的能力,已授予权限/采集同意。
  • 可选目标覆盖:
    • OPENCLAW_ANDROID_NODE_IDOPENCLAW_ANDROID_NODE_NAME
    • OPENCLAW_ANDROID_GATEWAY_URL / OPENCLAW_ANDROID_GATEWAY_TOKEN / OPENCLAW_ANDROID_GATEWAY_PASSWORD
  • Android 完整设置详情:Android App

实时:模型冒烟(配置文件密钥)

实时测试分为两层,以便隔离故障:
  • “直接模型”告诉我们提供商/模型在给定密钥下是否能正常回答。
  • “gateway 冒烟”告诉我们该模型的完整 gateway+agent 流水线是否工作正常(会话、历史、工具、沙箱策略等)。

第 1 层:直接模型补全(无 gateway)

  • Test: src/agents/models.profiles.live.test.ts
  • Goal:
    • 枚举发现的模型
    • 使用 getApiKeyForModel 选择你拥有凭据的模型
    • 对每个模型运行一次小型补全(必要时包含定向回归)
  • How to enable:
    • pnpm test:live(如果直接调用 Vitest,则使用 OPENCLAW_LIVE_TEST=1
  • Set OPENCLAW_LIVE_MODELS=modern(或 allmodern 的别名)以实际运行此套件;否则它会跳过,以保持 pnpm test:live 聚焦于 gateway 冒烟
  • How to select models:
    • OPENCLAW_LIVE_MODELS=modern 运行现代白名单(Opus/Sonnet 4.6+、GPT-5.2 + Codex、Gemini 3、DeepSeek V4、GLM 4.7、MiniMax M2.7、Grok 4.3)
    • OPENCLAW_LIVE_MODELS=all 是现代白名单的别名
    • OPENCLAW_LIVE_MODELS="openai/gpt-5.5,openai-codex/gpt-5.5,anthropic/claude-opus-4-6,..."(逗号白名单)
    • Modern/all 扫描默认采用经过筛选的高信号上限;将 OPENCLAW_LIVE_MAX_MODELS=0 设为完整现代扫描,或设置为正数以使用更小的上限。
    • 完整扫描使用 OPENCLAW_LIVE_TEST_TIMEOUT_MS 作为整个直接模型测试超时。默认:60 分钟。
    • 直接模型探测默认以 20 路并行运行;设置 OPENCLAW_LIVE_MODEL_CONCURRENCY 可覆盖。
  • How to select providers:
    • OPENCLAW_LIVE_PROVIDERS="google,google-antigravity,google-gemini-cli"(逗号白名单)
  • Where keys come from:
    • 默认:配置文件存储和环境变量回退
    • 设置 OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1 以仅强制使用配置文件存储
  • Why this exists:
    • 将“提供商 API 已损坏 / 密钥无效”与“gateway agent 流水线已损坏”分离
    • 包含小型、隔离的回归(例如:OpenAI Responses/Codex Responses 推理回放 + 工具调用流程)

第 2 层:Gateway + 开发 agent 冒烟(即“@openclaw”实际执行的内容)

  • Test: src/gateway/gateway-models.profiles.live.test.ts
  • Goal:
    • 在进程内启动 gateway
    • 创建/修补一个 agent:dev:* 会话(每次运行覆盖模型)
    • 遍历具有密钥的模型并断言:
      • “有意义”的响应(无工具)
      • 一个真实的工具调用可正常工作(read 探测)
      • 可选的额外工具探测(exec+read 探测)
      • OpenAI 回归路径(仅工具调用 → 后续跟进)保持可用
  • Probe details (so you can explain failures quickly):
    • read probe: 测试会在工作区写入一个 nonce 文件,并要求 agent read 它,然后把 nonce 回显回来。
    • exec+read probe: 测试要求 agent exec 将 nonce 写入临时文件,然后再 read 回来。
    • image probe: 测试附加一个生成的 PNG(猫 + 随机代码),并期望模型返回 cat <CODE>
    • Implementation reference: src/gateway/gateway-models.profiles.live.test.tssrc/gateway/live-image-probe.ts
  • How to enable:
    • pnpm test:live(如果直接调用 Vitest,则使用 OPENCLAW_LIVE_TEST=1
  • How to select models:
    • 默认:现代白名单(Opus/Sonnet 4.6+、GPT-5.2 + Codex、Gemini 3、DeepSeek V4、GLM 4.7、MiniMax M2.7、Grok 4.3)
    • OPENCLAW_LIVE_GATEWAY_MODELS=all 是现代白名单的别名
    • 或设置 OPENCLAW_LIVE_GATEWAY_MODELS="provider/model"(或逗号列表)以缩小范围
    • Modern/all gateway 扫描默认采用经过筛选的高信号上限;将 OPENCLAW_LIVE_GATEWAY_MAX_MODELS=0 设为完整现代扫描,或设置为正数以使用更小的上限。
  • How to select providers (avoid “OpenRouter everything”):
    • OPENCLAW_LIVE_GATEWAY_PROVIDERS="google,google-antigravity,google-gemini-cli,openai,anthropic,zai,minimax"(逗号白名单)
  • Tool + image probes are always on in this live test:
    • read probe + exec+read probe(工具压力测试)
    • image probe 在模型声明支持图像输入时运行
    • Flow (high level):
      • 测试生成一个带有“CAT”+ 随机代码的微型 PNG(src/gateway/live-image-probe.ts
      • 通过 agentattachments: [{ mimeType: "image/png", content: "<base64>" }] 发送
      • Gateway 将附件解析为 images[]src/gateway/server-methods/agent.ts + src/gateway/chat-attachments.ts
      • 内嵌 agent 将多模态用户消息转发给模型
      • 断言:回复包含 cat + 该代码(OCR 容错:允许轻微错误)
要查看你机器上可以测试的内容(以及精确的 provider/model id),请运行:
openclaw models list
openclaw models list --json

实时:CLI 后端冒烟(Claude、Codex、Gemini 或其他本地 CLI)

  • 测试:src/gateway/gateway-cli-backend.live.test.ts
  • 目标:使用本地 CLI 后端验证 Gateway + agent 流水线,而不触碰你的默认配置。
  • 各后端特定的冒烟默认值位于所属扩展的 cli-backend.ts 定义中。
  • 启用:
    • pnpm test:live(如果直接调用 Vitest,则使用 OPENCLAW_LIVE_TEST=1
    • OPENCLAW_LIVE_CLI_BACKEND=1
  • 默认值:
    • 默认提供商/模型:claude-cli/claude-sonnet-4-6
    • 命令/参数/图像行为来自所属 CLI 后端插件元数据。
  • 覆盖项(可选):
    • OPENCLAW_LIVE_CLI_BACKEND_MODEL="codex-cli/gpt-5.5"
    • OPENCLAW_LIVE_CLI_BACKEND_COMMAND="/full/path/to/codex"
    • OPENCLAW_LIVE_CLI_BACKEND_ARGS='["exec","--json","--color","never","--sandbox","read-only","--skip-git-repo-check"]'
    • OPENCLAW_LIVE_CLI_BACKEND_IMAGE_PROBE=1 发送真实图片附件(路径会注入到提示词中)。Docker 配方默认关闭,除非明确请求。
    • OPENCLAW_LIVE_CLI_BACKEND_IMAGE_ARG="--image" 通过 CLI 参数而不是提示词注入来传递图片文件路径。
    • OPENCLAW_LIVE_CLI_BACKEND_IMAGE_MODE="repeat"(或 "list")用于在设置了 IMAGE_ARG 时控制图片参数的传递方式。
    • OPENCLAW_LIVE_CLI_BACKEND_RESUME_PROBE=1 发送第二轮并验证恢复流程。
    • OPENCLAW_LIVE_CLI_BACKEND_MODEL_SWITCH_PROBE=1 在所选模型支持切换目标时,启用 Claude Sonnet -> Opus 同会话连续性探测。Docker 配方默认关闭,以保证整体可靠性。
    • OPENCLAW_LIVE_CLI_BACKEND_MCP_PROBE=1 启用 MCP/工具回环探测。Docker 配方默认关闭,除非明确请求。
示例:
OPENCLAW_LIVE_CLI_BACKEND=1 \
  OPENCLAW_LIVE_CLI_BACKEND_MODEL="codex-cli/gpt-5.5" \
  pnpm test:live src/gateway/gateway-cli-backend.live.test.ts
廉价的 Gemini MCP 配置冒烟测试:
OPENCLAW_LIVE_TEST=1 \
  pnpm test:live src/agents/cli-runner/bundle-mcp.gemini.live.test.ts
这不会要求 Gemini 生成响应。它会写入 OpenClaw 赋予 Gemini 的相同系统 设置,然后运行 gemini --debug mcp list,以证明已保存的 transport: "streamable-http" 服务已被规范化为 Gemini 的 HTTP MCP 形状,并且可以连接到本地 streamable-HTTP MCP 服务器。 Docker 配方:
pnpm test:docker:live-cli-backend
单提供商 Docker 配方:
pnpm test:docker:live-cli-backend:claude
pnpm test:docker:live-cli-backend:claude-subscription
pnpm test:docker:live-cli-backend:codex
pnpm test:docker:live-cli-backend:gemini
说明:
  • Docker 运行器位于 scripts/test-live-cli-backend-docker.sh
  • 它在仓库 Docker 镜像内以非 root 的 node 用户运行实时 CLI 后端冒烟测试。
  • 它从所属扩展解析 CLI 冒烟元数据,然后将匹配的 Linux CLI 包(@anthropic-ai/claude-code@openai/codex@google/gemini-cli)安装到 OPENCLAW_DOCKER_CLI_TOOLS_DIR 下的可写缓存前缀中(默认:~/.cache/openclaw/docker-cli-tools)。
  • pnpm test:docker:live-cli-backend:claude-subscription 需要通过 ~/.claude/.credentials.json 中的 claudeAiOauth.subscriptionType 或来自 claude setup-tokenCLAUDE_CODE_OAUTH_TOKEN 提供可移植的 Claude Code 订阅 OAuth。它首先在 Docker 中证明直接的 claude -p 可用,然后在不保留 Anthropic API key 环境变量的情况下运行两次 Gateway CLI 后端轮次。此订阅通道默认禁用 Claude 的 MCP/工具和图像探测,因为 Claude 当前会将第三方应用使用路由到额外使用计费,而不是正常的订阅计划限制。
  • 这个实时 CLI 后端冒烟现在对 Claude、Codex 和 Gemini 执行相同的端到端流程:文本轮次、图像分类轮次,然后通过 gateway CLI 验证 MCP cron 工具调用。
  • Claude 的默认冒烟还会将会话从 Sonnet 修补到 Opus,并验证恢复后的会话仍记得早先的一条备注。

Live: ACP 绑定冒烟测试(/acp spawn ... --bind here

  • 测试:src/gateway/gateway-acp-bind.live.test.ts
  • 目标:使用一个真实的 ACP 代理验证真实的 ACP conversation-bind 流程:
    • 发送 /acp spawn <agent> --bind here
    • 原地绑定一个合成的消息通道会话
    • 在同一个会话上发送一次正常的后续消息
    • 验证该后续消息落入已绑定的 ACP 会话转录中
  • 启用:
    • pnpm test:live src/gateway/gateway-acp-bind.live.test.ts
    • OPENCLAW_LIVE_ACP_BIND=1
  • 默认值:
    • Docker 中的 ACP 代理:claude,codex,gemini
    • 直接执行 pnpm test:live ... 时的 ACP 代理:claude
    • 合成通道:Slack DM 风格的会话上下文
    • ACP 后端:acpx
  • 覆盖项:
    • OPENCLAW_LIVE_ACP_BIND_AGENT=claude
    • OPENCLAW_LIVE_ACP_BIND_AGENT=codex
    • OPENCLAW_LIVE_ACP_BIND_AGENT=droid
    • OPENCLAW_LIVE_ACP_BIND_AGENT=gemini
    • OPENCLAW_LIVE_ACP_BIND_AGENT=opencode
    • OPENCLAW_LIVE_ACP_BIND_AGENTS=claude,codex,gemini
    • OPENCLAW_LIVE_ACP_BIND_AGENT_COMMAND='npx -y @agentclientprotocol/claude-agent-acp@<version>'
    • OPENCLAW_LIVE_ACP_BIND_CODEX_MODEL=gpt-5.5
    • OPENCLAW_LIVE_ACP_BIND_OPENCODE_MODEL=opencode/kimi-k2.6
    • OPENCLAW_LIVE_ACP_BIND_REQUIRE_TRANSCRIPT=1
    • OPENCLAW_LIVE_ACP_BIND_REQUIRE_CRON=1
    • OPENCLAW_LIVE_ACP_BIND_PARENT_MODEL=openai/gpt-5.5
  • 说明:
    • 该测试线使用网关的 chat.send 接口,并通过仅管理员可用的合成起始路由字段,让测试可以附加消息通道上下文,而无需伪装成外部投递。
    • OPENCLAW_LIVE_ACP_BIND_AGENT_COMMAND 未设置时,测试会使用内置 acpx 插件中所选 ACP harness 代理的内建代理注册表。
    • 默认情况下,绑定后的会话 cron MCP 创建是尽力而为,因为外部 ACP harness 可能在绑定/图像证明通过后取消 MCP 调用;将 OPENCLAW_LIVE_ACP_BIND_REQUIRE_CRON=1 可使该绑定后的 cron 探针变为严格检查。
示例:
OPENCLAW_LIVE_ACP_BIND=1 \
  OPENCLAW_LIVE_ACP_BIND_AGENT=claude \
  pnpm test:live src/gateway/gateway-acp-bind.live.test.ts
Docker 配方:
pnpm test:docker:live-acp-bind
单代理 Docker 配方:
pnpm test:docker:live-acp-bind:claude
pnpm test:docker:live-acp-bind:codex
pnpm test:docker:live-acp-bind:droid
pnpm test:docker:live-acp-bind:gemini
pnpm test:docker:live-acp-bind:opencode
Docker 说明:
  • Docker 运行器位于 scripts/test-live-acp-bind-docker.sh
  • 默认情况下,它会按顺序对聚合的实时 CLI 代理运行 ACP 绑定冒烟测试:claudecodex,然后是 gemini
  • 使用 OPENCLAW_LIVE_ACP_BIND_AGENTS=claudeOPENCLAW_LIVE_ACP_BIND_AGENTS=codexOPENCLAW_LIVE_ACP_BIND_AGENTS=droidOPENCLAW_LIVE_ACP_BIND_AGENTS=geminiOPENCLAW_LIVE_ACP_BIND_AGENTS=opencode 可缩小矩阵范围。
  • 它会加载 ~/.profile,将匹配的 CLI 认证材料转存到容器中,然后在缺失时安装所需的实时 CLI(@anthropic-ai/claude-code@openai/codex、通过 https://app.factory.ai/cli 的 Factory Droid、@google/gemini-cliopencode-ai)。ACP 后端本身是官方 acpx 插件中的嵌入式 acpx/runtime 包。
  • Droid Docker 变体会暂存 ~/.factory 作为设置,转发 FACTORY_API_KEY,并要求该 API key,因为本地 Factory OAuth/keyring 认证无法移植到容器中。它使用 ACPX 内置的 droid exec --output-format acp 注册表项。
  • OpenCode Docker 变体是一个严格的单代理回归通道。它在加载 ~/.profile 后,会根据 OPENCLAW_LIVE_ACP_BIND_OPENCODE_MODEL(默认 opencode/kimi-k2.6)写入临时的 OPENCODE_CONFIG_CONTENT 默认模型,并且 pnpm test:docker:live-acp-bind:opencode 需要一个已绑定的助手转录,而不是接受通用的绑定后跳过。
  • 直接的 acpx CLI 调用仅是用于在 Gateway 之外对比行为的手动/绕过路径。Docker ACP 绑定冒烟测试的是 OpenClaw 内嵌的 acpx 运行时后端。

Live: Codex app-server harness 冒烟测试

  • 目标:通过正常的 gateway agent 方法验证插件拥有的 Codex harness:
    • 加载捆绑的 codex 插件
    • 选择 OPENCLAW_AGENT_RUNTIME=codex
    • openai/gpt-5.5 发送首个 gateway agent 回合,并强制使用 Codex harness
    • 向同一个 OpenClaw 会话发送第二个回合,并验证 app-server 线程可以恢复
    • 通过同一条 gateway 命令路径运行 /codex status/codex models
    • 可选地运行两个经过 Guardian 审核的升级 shell 探针:一个应被批准的良性命令,以及一个应被拒绝的伪造密钥上传,这样 agent 会反问
  • 测试:src/gateway/gateway-codex-harness.live.test.ts
  • 启用:OPENCLAW_LIVE_CODEX_HARNESS=1
  • 默认模型:openai/gpt-5.5
  • 可选图像探针:OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=1
  • 可选 MCP/工具探针:OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=1
  • 可选 Guardian 探针:OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=1
  • 该 smoke 使用 agentRuntime.id: "codex",因此损坏的 Codex harness 不会通过静默回退到 PI 而侥幸通过。
  • 认证:来自本地 Codex 订阅登录的 Codex app-server 认证。Docker smoke 在适用时也可以提供 OPENAI_API_KEY 用于非 Codex 探针,并可选复制 ~/.codex/auth.json~/.codex/config.toml
本地配方:
source ~/.profile
OPENCLAW_LIVE_CODEX_HARNESS=1 \
  OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=1 \
  OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=1 \
  OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=1 \
  OPENCLAW_LIVE_CODEX_HARNESS_MODEL=openai/gpt-5.5 \
  pnpm test:live -- src/gateway/gateway-codex-harness.live.test.ts
Docker 配方:
source ~/.profile
pnpm test:docker:live-codex-harness
Docker 说明:
  • Docker runner 位于 scripts/test-live-codex-harness-docker.sh
  • 它会 source 挂载的 ~/.profile,传递 OPENAI_API_KEY,在存在时复制 Codex CLI 认证文件,将 @openai/codex 安装到可写的挂载 npm 前缀中,准备源码树,然后只运行 Codex-harness live 测试。
  • Docker 默认启用图像、MCP/工具和 Guardian 探针。若需要更窄的调试运行,可设置 OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=0OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=0OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=0
  • Docker 使用相同的显式 Codex runtime 配置,因此旧别名或 PI 回退不会掩盖 Codex harness 回归。

推荐的 live 配方

范围窄、明确的 allowlist 最快也最不容易出问题:
  • 单模型,直接调用(无网关):
    • OPENCLAW_LIVE_MODELS="openai/gpt-5.5" pnpm test:live src/agents/models.profiles.live.test.ts
  • 单模型,网关冒烟:
    • OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
  • 跨多个提供方的工具调用:
    • OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5,openai-codex/gpt-5.5,anthropic/claude-opus-4-6,google/gemini-3-flash-preview,deepseek/deepseek-v4-flash,zai/glm-5.1,minimax/MiniMax-M2.7" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
  • Google 重点(Gemini API key + Antigravity):
    • Gemini(API key):OPENCLAW_LIVE_GATEWAY_MODELS="google/gemini-3-flash-preview" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
    • Antigravity(OAuth):OPENCLAW_LIVE_GATEWAY_MODELS="google-antigravity/claude-opus-4-6-thinking,google-antigravity/gemini-3-pro-high" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
  • Google 自适应思考冒烟:
    • 如果本地密钥存放在 shell 配置中:source ~/.profile
    • Gemini 3 动态默认值:pnpm openclaw qa manual --provider-mode live-frontier --model google/gemini-3.1-pro-preview --alt-model google/gemini-3.1-pro-preview --message '/think adaptive Reply exactly: GEMINI_ADAPTIVE_OK' --timeout-ms 180000
    • Gemini 2.5 动态预算:pnpm openclaw qa manual --provider-mode live-frontier --model google/gemini-2.5-flash --alt-model google/gemini-2.5-flash --message '/think adaptive Reply exactly: GEMINI25_ADAPTIVE_OK' --timeout-ms 180000
说明:
  • google/... 使用 Gemini API(API key)。
  • google-antigravity/... 使用 Antigravity OAuth 桥接(Cloud Code Assist 风格的代理端点)。
  • google-gemini-cli/... 使用你机器上的本地 Gemini CLI(独立的认证 + 工具差异)。
  • Gemini API 与 Gemini CLI:
    • API:OpenClaw 通过 HTTP 调用 Google 托管的 Gemini API(API key / 配置文件认证);这也是大多数用户所说的“Gemini”。
    • CLI:OpenClaw 会调用本地的 gemini 二进制;它有自己的认证,并且行为可能不同(流式/工具支持/版本偏差)。

Live: 模型矩阵(我们覆盖什么)

没有固定的“CI 模型列表”(live 是按需启用的),但以下是建议在带有密钥的开发机上定期覆盖的推荐模型。

现代冒烟集合(工具调用 + 图像)

这是我们希望持续可用的“常见模型”运行集:
  • OpenAI(非 Codex):openai/gpt-5.5
  • OpenAI Codex OAuth:openai-codex/gpt-5.5
  • Anthropic:anthropic/claude-opus-4-6(或 anthropic/claude-sonnet-4-6
  • Google(Gemini API):google/gemini-3.1-pro-previewgoogle/gemini-3-flash-preview(避免较旧的 Gemini 2.x 模型)
  • Google(Antigravity):google-antigravity/claude-opus-4-6-thinkinggoogle-antigravity/gemini-3-flash
  • DeepSeek:deepseek/deepseek-v4-flashdeepseek/deepseek-v4-pro
  • Z.AI(GLM):zai/glm-5.1
  • MiniMax:minimax/MiniMax-M2.7
使用工具 + 图像运行网关冒烟测试: OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5,openai-codex/gpt-5.5,anthropic/claude-opus-4-6,google/gemini-3.1-pro-preview,google/gemini-3-flash-preview,google-antigravity/claude-opus-4-6-thinking,google-antigravity/gemini-3-flash,deepseek/deepseek-v4-flash,zai/glm-5.1,minimax/MiniMax-M2.7" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts

基线:工具调用(Read + 可选 Exec)

每个提供方家族至少选一个:
  • OpenAI:openai/gpt-5.5
  • Anthropic:anthropic/claude-opus-4-6(或 anthropic/claude-sonnet-4-6
  • Google:google/gemini-3-flash-preview(或 google/gemini-3.1-pro-preview
  • DeepSeek:deepseek/deepseek-v4-flash
  • Z.AI(GLM):zai/glm-5.1
  • MiniMax:minimax/MiniMax-M2.7
可选的额外覆盖(有则更好):
  • xAI: xai/grok-4.3 (or latest available)
  • Mistral: mistral/… (pick one “tools” capable model you have enabled)
  • Cerebras: cerebras/… (if you have access)
  • LM Studio: lmstudio/… (local; tool calling depends on API mode)

视觉:图像发送(附件 → 多模态消息)

OPENCLAW_LIVE_GATEWAY_MODELS 中至少包含一个支持图像的模型(Claude/Gemini/OpenAI 的视觉能力变体等),以覆盖图像探针。

聚合器 / 备用网关

如果你启用了相关密钥,我们也支持通过以下方式测试:
  • OpenRouter:openrouter/...(数百个模型;使用 openclaw models scan 查找支持工具 + 图像的候选项)
  • OpenCode:opencode/... 用于 Zen,opencode-go/... 用于 Go(通过 OPENCODE_API_KEY / OPENCODE_ZEN_API_KEY 认证)
你还可以在 live 矩阵中包含的更多提供方(如果你有凭据/配置):
  • 内置:openaiopenai-codexanthropicgooglegoogle-vertexgoogle-antigravitygoogle-gemini-clizaiopenrouteropencodeopencode-goxaigroqcerebrasmistralgithub-copilot
  • 通过 models.providers(自定义端点):minimax(云/API),以及任何 OpenAI/Anthropic 兼容代理(LM Studio、vLLM、LiteLLM 等)
不要在文档中硬编码“所有模型”。权威列表是你机器上 discoverModels(...) 返回的内容,再加上可用的密钥。

凭据(切勿提交)

Live 测试发现凭据的方式与 CLI 相同。实际影响:
  • 如果 CLI 可用,live 测试应能找到相同的密钥。
  • 如果某个 live 测试说“no creds”,请用调试 openclaw models list / 模型选择时相同的方法来排查。
  • 每个代理的 auth 配置文件:~/.openclaw/agents/<agentId>/agent/auth-profiles.json(这就是 live 测试里所说的 “profile keys”)
  • 配置:~/.openclaw/openclaw.json(或 OPENCLAW_CONFIG_PATH)
  • 旧版状态目录:~/.openclaw/credentials/(在存在时会复制到 staging 的 live home 中,但不是主 profile-key 存储)
  • 默认情况下,Live 本地运行会把当前配置、每个代理的 auth-profiles.json 文件、旧版 credentials/ 以及受支持的外部 CLI auth 目录复制到临时测试 home 中;staged live home 会跳过 workspace/sandboxes/,并且会去掉 agents.*.workspace / agentDir 路径覆盖,以便探测不会碰到你真实主机上的工作区。
如果你想依赖环境变量中的密钥(例如在你的 ~/.profile 中导出的),请在 source ~/.profile 之后运行本地测试,或者使用下面的 Docker 运行器(它们可以把 ~/.profile 挂载到容器中)。

Deepgram live(音频转录)

  • 测试:extensions/deepgram/audio.live.test.ts
  • 启用:DEEPGRAM_API_KEY=... DEEPGRAM_LIVE_TEST=1 pnpm test:live extensions/deepgram/audio.live.test.ts

BytePlus 编码计划 live

  • 测试:extensions/byteplus/live.test.ts
  • 启用:BYTEPLUS_API_KEY=... BYTEPLUS_LIVE_TEST=1 pnpm test:live extensions/byteplus/live.test.ts
  • 可选模型覆盖:BYTEPLUS_CODING_MODEL=ark-code-latest

ComfyUI 工作流媒体 live

  • 测试:extensions/comfy/comfy.live.test.ts
  • 启用:OPENCLAW_LIVE_TEST=1 COMFY_LIVE_TEST=1 pnpm test:live -- extensions/comfy/comfy.live.test.ts
  • 范围:
    • 测试内置的 comfy 图像、视频和 music_generate 路径
    • 除非 plugins.entries.comfy.config.<capability> 已配置,否则会跳过每项能力
    • 在更改 comfy 工作流提交、轮询、下载或插件注册后很有用

图像生成 live

  • 测试:test/image-generation.runtime.live.test.ts
  • 命令:pnpm test:live test/image-generation.runtime.live.test.ts
  • Harness:pnpm test:live:media image
  • 范围:
    • 枚举每个已注册的图像生成 provider 插件
    • 在探测前,从你的登录 shell(~/.profile)加载缺失的 provider 环境变量
    • 默认优先使用 live/env API key 而不是已存储的 auth 配置文件,因此 auth-profiles.json 中过期的测试密钥不会掩盖真实的 shell 凭据
    • 跳过没有可用 auth/profile/model 的 provider
    • 通过共享图像生成运行时运行每个已配置的 provider:
      • <provider>:generate
      • 当 provider 声明支持编辑时运行 <provider>:edit
  • 当前覆盖的内置 provider:
    • deepinfra
    • fal
    • google
    • minimax
    • openai
    • openrouter
    • vydra
    • xai
  • 可选缩小范围:
    • OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS="openai,google,openrouter,xai"
    • OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS="deepinfra"
    • OPENCLAW_LIVE_IMAGE_GENERATION_MODELS="openai/gpt-image-2,google/gemini-3.1-flash-image-preview,openrouter/google/gemini-3.1-flash-image-preview,xai/grok-imagine-image"
    • OPENCLAW_LIVE_IMAGE_GENERATION_CASES="google:flash-generate,google:pro-edit,openrouter:generate,xai:default-generate,xai:default-edit"
  • 可选认证行为:
    • OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1 以强制使用 profile 存储认证并忽略仅环境变量覆盖
对于随 CLI 一起发布的路径,在 provider/runtime live 测试通过后,再增加一个 infer 冒烟测试:
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_INFER_CLI_TEST=1 pnpm test:live -- test/image-generation.infer-cli.live.test.ts
openclaw infer image providers --json
openclaw infer image generate \
  --model google/gemini-3.1-flash-image-preview \
  --prompt "最小化的平面测试图像:白色背景上的一个蓝色方块,不要文字。" \
  --output ./openclaw-infer-image-smoke.png \
  --json
这覆盖了 CLI 参数解析、config/default-agent 解析、捆绑插件激活、共享的图像生成 runtime,以及 live provider 请求。插件依赖应在 runtime 加载之前就已存在。

音乐生成 live

  • 测试:extensions/music-generation-providers.live.test.ts
  • 启用:OPENCLAW_LIVE_TEST=1 pnpm test:live -- extensions/music-generation-providers.live.test.ts
  • Harness:pnpm test:live:media music
  • 范围:
    • 测试共享的内置音乐生成 provider 路径
    • 目前覆盖 Google 和 MiniMax
    • 在探测前,从你的登录 shell(~/.profile)加载 provider 环境变量
    • 默认优先使用 live/env API key 而不是已存储的 auth 配置文件,因此 auth-profiles.json 中过期的测试密钥不会掩盖真实的 shell 凭据
    • 跳过没有可用 auth/profile/model 的 provider
    • 在可用时运行所有声明的运行时模式:
      • 使用仅 prompt 输入的 generate
      • 当 provider 声明 capabilities.edit.enabled 时运行 edit
    • 当前共享通道覆盖:
      • googlegenerateedit
      • minimaxgenerate
      • comfy:单独的 Comfy live 文件,不属于这次共享扫描
  • 可选缩小范围:
    • OPENCLAW_LIVE_MUSIC_GENERATION_PROVIDERS="google,minimax"
    • OPENCLAW_LIVE_MUSIC_GENERATION_MODELS="google/lyria-3-clip-preview,minimax/music-2.6"
  • 可选认证行为:
    • OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1 以强制使用 profile 存储认证并忽略仅环境变量覆盖

视频生成 live

  • 测试:extensions/video-generation-providers.live.test.ts
  • 启用:OPENCLAW_LIVE_TEST=1 pnpm test:live -- extensions/video-generation-providers.live.test.ts
  • Harness:pnpm test:live:media video
  • 范围:
    • 测试共享的内置视频生成 provider 路径
    • 默认使用适合发布的冒烟路径:非 FAL provider、每个 provider 一次 text-to-video 请求、一个一秒钟的 lobster 提示词,以及来自 OPENCLAW_LIVE_VIDEO_GENERATION_TIMEOUT_MS 的每个 provider 操作上限(默认 180000
    • 默认跳过 FAL,因为 provider 端队列延迟可能主导发布耗时;传入 --video-providers falOPENCLAW_LIVE_VIDEO_GENERATION_PROVIDERS="fal" 可显式运行它
    • 在探测前,从你的登录 shell(~/.profile)加载 provider 环境变量
    • 默认优先使用 live/env API key 而不是已存储的 auth 配置文件,因此 auth-profiles.json 中过期的测试密钥不会掩盖真实的 shell 凭据
    • 跳过没有可用 auth/profile/model 的 provider
    • 默认只运行 generate
    • 设定 OPENCLAW_LIVE_VIDEO_GENERATION_FULL_MODES=1 也会在可用时运行声明的变换模式:
      • 当 provider 声明 capabilities.imageToVideo.enabled 且所选 provider/model 在共享扫描中接受基于 buffer 的本地图像输入时,运行 imageToVideo
      • 当 provider 声明 capabilities.videoToVideo.enabled 且所选 provider/model 在共享扫描中接受基于 buffer 的本地视频输入时,运行 videoToVideo
    • 当前在共享扫描中已声明但跳过的 imageToVideo provider:
      • vydra,因为内置的 veo3 仅支持文本,且内置的 kling 需要远程图片 URL
    • Vydra 的特定 provider 覆盖:
      • OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_VYDRA_VIDEO=1 pnpm test:live -- extensions/vydra/vydra.live.test.ts
      • 该文件默认运行 veo3 的 text-to-video,以及一个使用远程图片 URL fixture 的 kling 通道
    • 当前 videoToVideo 的 live 覆盖:
      • 仅在所选模型为 runway/gen4_aleph 时运行 runway
    • 当前在共享扫描中已声明但跳过的 videoToVideo provider:
      • alibabaqwenxai,因为这些路径当前需要远程 http(s) / MP4 参考 URL
      • google,因为当前共享的 Gemini/Veo 通道使用本地 buffer 输入,而该路径在共享扫描中不被接受
      • openai,因为当前共享通道缺少 org 特定的视频 inpaint/remix 访问保证
  • 可选缩小范围:
    • OPENCLAW_LIVE_VIDEO_GENERATION_PROVIDERS="deepinfra,google,openai,runway"
    • OPENCLAW_LIVE_VIDEO_GENERATION_MODELS="google/veo-3.1-fast-generate-preview,openai/sora-2,runway/gen4_aleph"
    • OPENCLAW_LIVE_VIDEO_GENERATION_SKIP_PROVIDERS="" 以包含默认扫描中的每个 provider,包括 FAL
    • OPENCLAW_LIVE_VIDEO_GENERATION_TIMEOUT_MS=60000 以降低每个 provider 操作上限,进行更激进的冒烟运行
  • 可选认证行为:
    • OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1 以强制使用 profile 存储认证并忽略仅环境变量覆盖

媒体 live harness

  • 命令:pnpm test:live:media
  • 目的:
    • 通过一个仓库原生入口点运行共享的图像、音乐和视频 live 套件
    • 自动从 ~/.profile 加载缺失的 provider 环境变量
    • 默认自动将每个套件缩小到当前具有可用认证的 provider
    • 复用 scripts/test-live.mjs,因此心跳和静默模式行为保持一致
  • 示例:
    • pnpm test:live:media
    • pnpm test:live:media image video --providers openai,google,minimax
    • pnpm test:live:media video --video-providers openai,runway --all-providers
    • pnpm test:live:media music --quiet

相关

  • 测试 — 单元、集成、QA 和 Docker 套件