https://integrate.api.nvidia.com/v1,可免费使用
开源模型。使用来自
build.nvidia.com 的 API key 进行认证。OpenClaw
默认将 NVIDIA 提供方设置为 Nemotron 3 Ultra,这是 NVIDIA 的 550B 总参数 / 55B
激活推理模型,适用于长上下文的 agentic 工作。
入门指南
对于非交互式设置,你也可以直接传入 key:配置示例
精选目录
当配置了 NVIDIA API key 时,OpenClaw 的初始化和模型选择流程会尝试从https://assets.ngc.nvidia.com/products/api-catalog/featured-models.json 获取 NVIDIA 的公开精选模型目录,并将排序后的结果缓存 24 小时。来自 build.nvidia.com 的新精选模型因此会在初始化和模型选择界面中出现,而无需等待 OpenClaw 发布新版本。当实时数据可用时,返回的第一个模型会作为 NVIDIA 初始化期间显示的默认选项。
该获取过程对 assets.ngc.nvidia.com 使用固定的 HTTPS 主机策略。如果未配置
NVIDIA API key,或者该公开目录不可用或格式错误,OpenClaw 会回退到内置目录和下面的内置默认项。
Nemotron 3 Ultra
Nemotron 3 Ultra 是 OpenClaw 中默认的 NVIDIA 模型。NVIDIA 对nvidia/nemotron-3-ultra-550b-a55b 的构建页面将其列为可用的免费端点,且上下文规格为 1M tokens。内置目录记录的最大输出为 16,384 tokens,以匹配 NVIDIA 当前针对该托管端点的 OpenAI 兼容示例请求。
当你需要最高能力的 NVIDIA 默认模型时,请使用 Ultra。若想使用更小的 Nemotron 3 选项,请保留 Super;或者在上下文长度、延迟或行为更合适时,选择 NVIDIA 目录中托管的第三方模型。内置的 Ultra 行默认发送 chat_template_kwargs.enable_thinking: false 和 force_nonempty_content: true,以便正常聊天输出保留在可见答案中,而不是暴露推理文本。
内置回退目录
| 模型引用 | 名称 | 上下文 | 最大输出 | 备注 |
|---|---|---|---|---|
nvidia/nvidia/nemotron-3-ultra-550b-a55b | NVIDIA Nemotron 3 Ultra 550B | 1,000,000 | 16,384 | 默认 |
nvidia/nvidia/nemotron-3-super-120b-a12b | NVIDIA Nemotron 3 Super 120B | 262,144 | 8,192 | 精选回退 |
nvidia/moonshotai/kimi-k2.5 | Kimi K2.5 | 262,144 | 8,192 | 精选回退 |
nvidia/minimaxai/minimax-m2.7 | Minimax M2.7 | 196,608 | 8,192 | 精选回退 |
nvidia/z-ai/glm-5.1 | GLM 5.1 | 202,752 | 8,192 | 精选回退 |
nvidia/minimaxai/minimax-m2.5 | MiniMax M2.5 | 196,608 | 8,192 | 已弃用,升级兼容 |
nvidia/z-ai/glm5 | GLM-5 | 202,752 | 8,192 | 已弃用,升级兼容 |
高级配置
自动启用行为
自动启用行为
当设置了
NVIDIA_API_KEY 环境变量时,该提供方会自动启用。
除了该 key 之外,不需要显式的提供方配置。目录与定价
目录与定价
当配置了 NVIDIA 认证时,OpenClaw 会优先使用 NVIDIA 的公开精选模型目录,并将其缓存 24 小时。内置回退目录是静态的,并保留了已弃用但仍随发行版提供的引用,以便升级兼容。由于 NVIDIA 目前为列出的模型提供免费 API 访问,源码中的成本默认值为
0。OpenAI 兼容端点
OpenAI 兼容端点
NVIDIA 使用标准的
/v1 completions 端点。任何 OpenAI 兼容的
工具都应该可以直接使用 NVIDIA 的 base URL。Nemotron 3 Ultra 推理参数
Nemotron 3 Ultra 推理参数
NVIDIA 的 Ultra 示例请求使用
chat_template_kwargs.enable_thinking
和 reasoning_budget 来控制推理输出。OpenClaw 内置的 Ultra 行默认禁用模板推理,以用于正常聊天。如果你需要启用 NVIDIA 的推理输出,或者强制设置其他 NVIDIA 特定请求字段,请按模型设置参数,并将提供方级别的覆盖限定在 NVIDIA 模型上:params.extra_body 是最终的 OpenAI 兼容请求体覆盖,因此只应将其用于 NVIDIA 为所选端点文档化的字段。缓慢的自定义提供方响应
缓慢的自定义提供方响应
某些由 NVIDIA 托管的自定义模型,在发出首个响应块之前,可能会比默认模型的空闲看门狗花费更长时间。对于自定义的 NVIDIA 提供方条目,应提高提供方超时时间,而不是提高整个 agent 运行时超时时间:
相关内容
模型选择
选择提供方、模型引用和故障转移行为。
配置参考
agents、models 和 providers 的完整配置参考。