NVIDIA - OpenClaw 中文文档

NVIDIA 提供一个 OpenAI 兼容的 API，地址为 https://integrate.api.nvidia.com/v1，可免费使用开源模型。使用来自 build.nvidia.com 的 API key 进行认证。OpenClaw 默认将 NVIDIA 提供方设置为 Nemotron 3 Ultra，这是 NVIDIA 的 550B 总参数 / 55B 激活推理模型，适用于长上下文的 agentic 工作。

入门指南

获取你的 API key

在 build.nvidia.com 创建一个 API key。

导出 key 并运行初始化

export NVIDIA_API_KEY="nvapi-..."
openclaw onboard --auth-choice nvidia-api-key

设置 NVIDIA 模型

openclaw models set nvidia/nvidia/nemotron-3-ultra-550b-a55b

如果你使用 --nvidia-api-key 而不是环境变量，值会进入 shell 历史记录和 ps 输出。尽可能优先使用 NVIDIA_API_KEY 环境变量。

对于非交互式设置，你也可以直接传入 key：

openclaw onboard --auth-choice nvidia-api-key --nvidia-api-key "nvapi-..."

配置示例

{
  env: { NVIDIA_API_KEY: "nvapi-..." },
  models: {
    providers: {
      nvidia: {
        baseUrl: "https://integrate.api.nvidia.com/v1",
        api: "openai-completions",
      },
    },
  },
  agents: {
    defaults: {
      model: { primary: "nvidia/nvidia/nemotron-3-ultra-550b-a55b" },
    },
  },
}

精选目录

当配置了 NVIDIA API key 时，OpenClaw 的初始化和模型选择流程会尝试从 https://assets.ngc.nvidia.com/products/api-catalog/featured-models.json 获取 NVIDIA 的公开精选模型目录，并将排序后的结果缓存 24 小时。来自 build.nvidia.com 的新精选模型因此会在初始化和模型选择界面中出现，而无需等待 OpenClaw 发布新版本。当实时数据可用时，返回的第一个模型会作为 NVIDIA 初始化期间显示的默认选项。该获取过程对 assets.ngc.nvidia.com 使用固定的 HTTPS 主机策略。如果未配置 NVIDIA API key，或者该公开目录不可用或格式错误，OpenClaw 会回退到内置目录和下面的内置默认项。

Nemotron 3 Ultra

Nemotron 3 Ultra 是 OpenClaw 中默认的 NVIDIA 模型。NVIDIA 对 nvidia/nemotron-3-ultra-550b-a55b 的构建页面将其列为可用的免费端点，且上下文规格为 1M tokens。内置目录记录的最大输出为 16,384 tokens，以匹配 NVIDIA 当前针对该托管端点的 OpenAI 兼容示例请求。当你需要最高能力的 NVIDIA 默认模型时，请使用 Ultra。若想使用更小的 Nemotron 3 选项，请保留 Super；或者在上下文长度、延迟或行为更合适时，选择 NVIDIA 目录中托管的第三方模型。内置的 Ultra 行默认发送 chat_template_kwargs.enable_thinking: false 和 force_nonempty_content: true，以便正常聊天输出保留在可见答案中，而不是暴露推理文本。

内置回退目录

模型引用	名称	上下文	最大输出	备注
`nvidia/nvidia/nemotron-3-ultra-550b-a55b`	NVIDIA Nemotron 3 Ultra 550B	1,000,000	16,384	默认
`nvidia/nvidia/nemotron-3-super-120b-a12b`	NVIDIA Nemotron 3 Super 120B	262,144	8,192	精选回退
`nvidia/moonshotai/kimi-k2.5`	Kimi K2.5	262,144	8,192	精选回退
`nvidia/minimaxai/minimax-m2.7`	Minimax M2.7	196,608	8,192	精选回退
`nvidia/z-ai/glm-5.1`	GLM 5.1	202,752	8,192	精选回退
`nvidia/minimaxai/minimax-m2.5`	MiniMax M2.5	196,608	8,192	已弃用，升级兼容
`nvidia/z-ai/glm5`	GLM-5	202,752	8,192	已弃用，升级兼容

高级配置

自动启用行为

当设置了 NVIDIA_API_KEY 环境变量时，该提供方会自动启用。除了该 key 之外，不需要显式的提供方配置。

目录与定价

当配置了 NVIDIA 认证时，OpenClaw 会优先使用 NVIDIA 的公开精选模型目录，并将其缓存 24 小时。内置回退目录是静态的，并保留了已弃用但仍随发行版提供的引用，以便升级兼容。由于 NVIDIA 目前为列出的模型提供免费 API 访问，源码中的成本默认值为 0。

OpenAI 兼容端点

NVIDIA 使用标准的 /v1 completions 端点。任何 OpenAI 兼容的工具都应该可以直接使用 NVIDIA 的 base URL。

Nemotron 3 Ultra 推理参数

NVIDIA 的 Ultra 示例请求使用 chat_template_kwargs.enable_thinking 和 reasoning_budget 来控制推理输出。OpenClaw 内置的 Ultra 行默认禁用模板推理，以用于正常聊天。如果你需要启用 NVIDIA 的推理输出，或者强制设置其他 NVIDIA 特定请求字段，请按模型设置参数，并将提供方级别的覆盖限定在 NVIDIA 模型上：

{
  agents: {
    defaults: {
      models: {
        "nvidia/nvidia/nemotron-3-ultra-550b-a55b": {
          params: {
            chat_template_kwargs: { enable_thinking: true },
            extra_body: { reasoning_budget: 16384 },
          },
        },
      },
    },
  },
}

params.extra_body 是最终的 OpenAI 兼容请求体覆盖，因此只应将其用于 NVIDIA 为所选端点文档化的字段。

缓慢的自定义提供方响应

某些由 NVIDIA 托管的自定义模型，在发出首个响应块之前，可能会比默认模型的空闲看门狗花费更长时间。对于自定义的 NVIDIA 提供方条目，应提高提供方超时时间，而不是提高整个 agent 运行时超时时间：

{
  models: {
    providers: {
      "custom-integrate-api-nvidia-com": {
        baseUrl: "https://integrate.api.nvidia.com/v1",
        api: "openai-completions",
        apiKey: "NVIDIA_API_KEY",
        timeoutSeconds: 300,
      },
    },
  },
  agents: {
    defaults: {
      models: {
        "custom-integrate-api-nvidia-com/meta/llama-3.1-70b-instruct": {
          params: { thinking: "off" },
        },
      },
    },
  },
}

NVIDIA 模型目前可免费使用。请查看 build.nvidia.com 以获取最新的可用性和速率限制详情。

模型选择

选择提供方、模型引用和故障转移行为。

配置参考

agents、models 和 providers 的完整配置参考。

​入门指南

​配置示例

​精选目录

​Nemotron 3 Ultra

​内置回退目录

​高级配置

​相关内容

模型选择

配置参考

入门指南

配置示例

精选目录

Nemotron 3 Ultra

内置回退目录

高级配置

相关内容