NVIDIA
NVIDIA 提供了一个 OpenAI 兼容的 API,地址为https://integrate.api.nvidia.com/v1,支持 Nemotron 和 NeMo 模型。使用来自 NVIDIA NGC 的 API 密钥进行身份验证。
CLI 设置
导出密钥一次,然后运行引导并设置 NVIDIA 模型:--token,请记住它会出现在 shell 历史记录和 ps 输出中;尽可能优先使用环境变量。
配置片段
模型 ID
nvidia/llama-3.1-nemotron-70b-instruct(默认)meta/llama-3.3-70b-instructnvidia/mistral-nemo-minitron-8b-8k-instruct
注意事项
- OpenAI 兼容的
/v1端点;使用来自 NVIDIA NGC 的 API 密钥。 - 当设置了
NVIDIA_API_KEY时,提供商会自动启用;使用静态默认值(131,072 令牌上下文窗口,最大 4,096 令牌)。