Skip to main content
NVIDIA 提供一个 OpenAI 兼容的 API,地址为 https://integrate.api.nvidia.com/v1,可免费使用 开源模型。使用来自 build.nvidia.com 的 API key 进行认证。OpenClaw 默认将 NVIDIA 提供方设置为 Nemotron 3 Ultra,这是 NVIDIA 的 550B 总参数 / 55B 激活推理模型,适用于长上下文的 agentic 工作。

入门指南

1

获取你的 API key

build.nvidia.com 创建一个 API key。
2

导出 key 并运行初始化

export NVIDIA_API_KEY="nvapi-..."
openclaw onboard --auth-choice nvidia-api-key
3

设置 NVIDIA 模型

openclaw models set nvidia/nvidia/nemotron-3-ultra-550b-a55b
如果你使用 --nvidia-api-key 而不是环境变量,值会进入 shell 历史记录和 ps 输出。尽可能优先使用 NVIDIA_API_KEY 环境变量。
对于非交互式设置,你也可以直接传入 key:
openclaw onboard --auth-choice nvidia-api-key --nvidia-api-key "nvapi-..."

配置示例

{
  env: { NVIDIA_API_KEY: "nvapi-..." },
  models: {
    providers: {
      nvidia: {
        baseUrl: "https://integrate.api.nvidia.com/v1",
        api: "openai-completions",
      },
    },
  },
  agents: {
    defaults: {
      model: { primary: "nvidia/nvidia/nemotron-3-ultra-550b-a55b" },
    },
  },
}

精选目录

当配置了 NVIDIA API key 时,OpenClaw 的初始化和模型选择流程会尝试从 https://assets.ngc.nvidia.com/products/api-catalog/featured-models.json 获取 NVIDIA 的公开精选模型目录,并将排序后的结果缓存 24 小时。来自 build.nvidia.com 的新精选模型因此会在初始化和模型选择界面中出现,而无需等待 OpenClaw 发布新版本。当实时数据可用时,返回的第一个模型会作为 NVIDIA 初始化期间显示的默认选项。 该获取过程对 assets.ngc.nvidia.com 使用固定的 HTTPS 主机策略。如果未配置 NVIDIA API key,或者该公开目录不可用或格式错误,OpenClaw 会回退到内置目录和下面的内置默认项。

Nemotron 3 Ultra

Nemotron 3 Ultra 是 OpenClaw 中默认的 NVIDIA 模型。NVIDIA 对 nvidia/nemotron-3-ultra-550b-a55b 的构建页面将其列为可用的免费端点,且上下文规格为 1M tokens。内置目录记录的最大输出为 16,384 tokens,以匹配 NVIDIA 当前针对该托管端点的 OpenAI 兼容示例请求。 当你需要最高能力的 NVIDIA 默认模型时,请使用 Ultra。若想使用更小的 Nemotron 3 选项,请保留 Super;或者在上下文长度、延迟或行为更合适时,选择 NVIDIA 目录中托管的第三方模型。内置的 Ultra 行默认发送 chat_template_kwargs.enable_thinking: falseforce_nonempty_content: true,以便正常聊天输出保留在可见答案中,而不是暴露推理文本。

内置回退目录

模型引用名称上下文最大输出备注
nvidia/nvidia/nemotron-3-ultra-550b-a55bNVIDIA Nemotron 3 Ultra 550B1,000,00016,384默认
nvidia/nvidia/nemotron-3-super-120b-a12bNVIDIA Nemotron 3 Super 120B262,1448,192精选回退
nvidia/moonshotai/kimi-k2.5Kimi K2.5262,1448,192精选回退
nvidia/minimaxai/minimax-m2.7Minimax M2.7196,6088,192精选回退
nvidia/z-ai/glm-5.1GLM 5.1202,7528,192精选回退
nvidia/minimaxai/minimax-m2.5MiniMax M2.5196,6088,192已弃用,升级兼容
nvidia/z-ai/glm5GLM-5202,7528,192已弃用,升级兼容

高级配置

当设置了 NVIDIA_API_KEY 环境变量时,该提供方会自动启用。 除了该 key 之外,不需要显式的提供方配置。
当配置了 NVIDIA 认证时,OpenClaw 会优先使用 NVIDIA 的公开精选模型目录,并将其缓存 24 小时。内置回退目录是静态的,并保留了已弃用但仍随发行版提供的引用,以便升级兼容。由于 NVIDIA 目前为列出的模型提供免费 API 访问,源码中的成本默认值为 0
NVIDIA 使用标准的 /v1 completions 端点。任何 OpenAI 兼容的 工具都应该可以直接使用 NVIDIA 的 base URL。
NVIDIA 的 Ultra 示例请求使用 chat_template_kwargs.enable_thinkingreasoning_budget 来控制推理输出。OpenClaw 内置的 Ultra 行默认禁用模板推理,以用于正常聊天。如果你需要启用 NVIDIA 的推理输出,或者强制设置其他 NVIDIA 特定请求字段,请按模型设置参数,并将提供方级别的覆盖限定在 NVIDIA 模型上:
{
  agents: {
    defaults: {
      models: {
        "nvidia/nvidia/nemotron-3-ultra-550b-a55b": {
          params: {
            chat_template_kwargs: { enable_thinking: true },
            extra_body: { reasoning_budget: 16384 },
          },
        },
      },
    },
  },
}
params.extra_body 是最终的 OpenAI 兼容请求体覆盖,因此只应将其用于 NVIDIA 为所选端点文档化的字段。
某些由 NVIDIA 托管的自定义模型,在发出首个响应块之前,可能会比默认模型的空闲看门狗花费更长时间。对于自定义的 NVIDIA 提供方条目,应提高提供方超时时间,而不是提高整个 agent 运行时超时时间:
{
  models: {
    providers: {
      "custom-integrate-api-nvidia-com": {
        baseUrl: "https://integrate.api.nvidia.com/v1",
        api: "openai-completions",
        apiKey: "NVIDIA_API_KEY",
        timeoutSeconds: 300,
      },
    },
  },
  agents: {
    defaults: {
      models: {
        "custom-integrate-api-nvidia-com/meta/llama-3.1-70b-instruct": {
          params: { thinking: "off" },
        },
      },
    },
  },
}
NVIDIA 模型目前可免费使用。请查看 build.nvidia.com 以获取最新的可用性和 速率限制详情。

相关内容

模型选择

选择提供方、模型引用和故障转移行为。

配置参考

agents、models 和 providers 的完整配置参考。