openai-completions 提供方家族连接到 SGLang,并自动发现可用模型。
| Property | Value |
|---|---|
| Provider id | sglang |
| Plugin | bundled, enabledByDefault: true |
| Auth env var | SGLANG_API_KEY(如果服务器没有认证,则任意非空值均可) |
| Onboarding flag | --auth-choice sglang |
| API | OpenAI-compatible (openai-completions) |
| Default base URL | http://127.0.0.1:30000/v1 |
| Default model placeholder | sglang/Qwen/Qwen3-8B |
| Streaming usage | Yes (supportsStreamingUsage: true) |
| Pricing | 标记为外部免费(modelPricing.external: false) |
SGLANG_API_KEY 时 自动发现 SGLang 中可用的模型。若你同时配置了自定义的 SGLang base URL,请在 agents.defaults.models 中使用 sglang/* 以保持动态发现。参见下方 模型发现(隐式提供方)。
入门
启动 SGLang
使用兼容 OpenAI 的服务器启动 SGLang。你的基础 URL 应暴露
/v1 端点(例如 /v1/models、/v1/chat/completions)。SGLang
通常运行在:http://127.0.0.1:30000/v1
模型发现(隐式提供方)
当设置了SGLANG_API_KEY(或存在认证配置文件)并且你没有
定义 models.providers.sglang 时,OpenClaw 将查询:
GET http://127.0.0.1:30000/v1/models
如果你显式设置了
models.providers.sglang,OpenClaw 默认会使用你声明的模型。当你希望 OpenClaw 查询该已配置提供方的 /models 端点并包含所有已公布的 SGLang 模型时,请在 agents.defaults.models 中添加 "sglang/*": {}。显式配置(手动模型)
在以下情况下使用显式配置:- SGLang 运行在不同的主机/端口上。
- 你想固定
contextWindow/maxTokens的值。 - 你的服务器需要真实的 API 密钥(或者你想控制请求头)。
高级配置
代理式行为
代理式行为
SGLang 被视为一个代理式的、兼容 OpenAI 的
/v1 后端,而不是
原生 OpenAI 端点。| Behavior | SGLang |
|---|---|
| 仅 OpenAI 请求整形 | 不适用 |
service_tier、Responses 的 store、prompt-cache 提示 | 不发送 |
| 兼容推理的负载整形 | 不适用 |
隐藏的归因请求头(originator、version、User-Agent) | 在自定义 SGLang 基础 URL 上不会注入 |
故障排查
故障排查
服务器不可访问确认服务器正在运行并且有响应:认证错误如果请求因认证错误失败,请设置一个与
你的服务器配置匹配的真实
SGLANG_API_KEY,或者在
models.providers.sglang 下显式配置该提供方。相关内容
模型选择
选择提供方、模型引用和故障切换行为。
配置参考
完整的配置模式,包括提供方条目。