OpenClaw 随附一个内置的Documentation Index
Fetch the complete documentation index at: https://openclaw.zhcndoc.com/llms.txt
Use this file to discover all available pages before exploring further.
xai 提供方插件,用于 Grok 模型。
快速开始
OpenClaw 使用 xAI Responses API 作为捆绑的 xAI 传输层。相同的
XAI_API_KEY 也可用于支持 Grok 的 web_search、一等公民 x_search,
以及远程 code_execution。
如果你在 plugins.entries.xai.config.webSearch.apiKey 下存储了 xAI 密钥,
内置的 xAI 模型提供方也会将该密钥作为回退使用。
将 plugins.entries.xai.config.webSearch.baseUrl 设置为通过运维方的 xAI Responses 代理路由 Grok 的
web_search,并且默认情况下也路由 x_search。
code_execution 调优位于 plugins.entries.xai.config.codeExecution 下。内置目录
OpenClaw 默认包含以下 xAI 模型家族:| 家族 | 模型 ID |
|---|---|
| Grok 3 | grok-3, grok-3-fast, grok-3-mini, grok-3-mini-fast |
| Grok 4.3 | grok-4.3 |
| Grok 4 | grok-4, grok-4-0709 |
| Grok 4 Fast | grok-4-fast, grok-4-fast-non-reasoning |
| Grok 4.1 Fast | grok-4-1-fast, grok-4-1-fast-non-reasoning |
| Grok 4.20 Beta | grok-4.20-beta-latest-reasoning, grok-4.20-beta-latest-non-reasoning |
| Grok Code | grok-code-fast-1 |
grok-4* 和 grok-code-fast* ID 具有相同的 API 结构时,该插件也会向前解析它们。
OpenClaw 功能覆盖
内置插件将 xAI 当前公开的 API 面映射到 OpenClaw 共享的提供方和工具契约上。那些不符合共享契约的能力 (例如流式 TTS 和实时语音)不会暴露出来——请参见下表。| xAI 能力 | OpenClaw 接口 | 状态 |
|---|---|---|
| 聊天 / Responses | xai/<model> 模型提供方 | 是 |
| 服务端网页搜索 | web_search 提供方 grok | 是 |
| 服务端 X 搜索 | x_search 工具 | 是 |
| 服务端代码执行 | code_execution 工具 | 是 |
| 图像 | image_generate | 是 |
| 视频 | video_generate | 是 |
| 批量文本转语音 | messages.tts.provider: "xai" / tts | 是 |
| 流式 TTS | — | 不暴露;OpenClaw 的 TTS 契约返回完整音频缓冲区 |
| 批量语音转文本 | tools.media.audio / 媒体理解 | 是 |
| 流式语音转文本 | Voice Call streaming.provider: "xai" | 是 |
| 实时语音 | — | 目前未暴露;需要不同的会话/WebSocket 契约 |
| 文件 / 批处理 | 仅通用模型 API 兼容性 | 不是 OpenClaw 的一等公民工具 |
OpenClaw 使用 xAI 的 REST 图像/视频/TTS/STT API 来进行媒体生成、语音和批量转录,
使用 xAI 的流式 STT WebSocket 来进行实时语音通话转录,并使用 Responses API 来支持模型、
搜索和代码执行工具。需要不同 OpenClaw 契约的功能,例如 Realtime 语音会话,
会在这里作为上游能力进行文档说明,而不是隐藏的插件行为。
快速模式映射
/fast on 或 agents.defaults.models["xai/<model>"].params.fastMode: true
会将原生 xAI 请求重写如下:
| 源模型 | 快速模式目标 |
|---|---|
grok-3 | grok-3-fast |
grok-3-mini | grok-3-mini-fast |
grok-4 | grok-4-fast |
grok-4-0709 | grok-4-fast |
旧版兼容别名
旧版别名仍会规范化为内置的标准 ID:| 旧别名 | 标准 ID |
|---|---|
grok-4-fast-reasoning | grok-4-fast |
grok-4-1-fast-reasoning | grok-4-1-fast |
grok-4.20-reasoning | grok-4.20-beta-latest-reasoning |
grok-4.20-non-reasoning | grok-4.20-beta-latest-non-reasoning |
功能
网页搜索
网页搜索
内置的
grok 网页搜索提供方也会使用 XAI_API_KEY:视频生成
视频生成
内置的
xai 插件通过共享的
video_generate 工具注册视频生成功能。- 默认视频模型:
xai/grok-imagine-video - 模式:文本转视频、图像转视频、参考图像生成、远程 视频编辑,以及远程视频扩展
- 宽高比:
1:1、16:9、9:16、4:3、3:4、3:2、2:3 - 分辨率:
480P、720P - 时长:生成/图像转视频时为 1-15 秒,使用
reference_image角色时为 1-10 秒,扩展时为 2-10 秒 - 参考图像生成:将每个提供的图像的
imageRoles设置为reference_image;xAI 最多接受 7 张此类图像
有关共享工具参数、提供方选择和故障转移行为,请参见视频生成。
图像生成
图像生成
内置的
xai 插件通过共享的
image_generate 工具注册图像生成功能。- 默认图像模型:
xai/grok-imagine-image - 额外模型:
xai/grok-imagine-image-pro - 模式:文本转图像和参考图像编辑
- 参考输入:一个
image或最多五个images - 宽高比:
1:1、16:9、9:16、4:3、3:4、2:3、3:2 - 分辨率:
1K、2K - 数量:最多 4 张图像
b64_json 图像响应,以便生成的媒体可以
通过常规的频道附件路径进行存储和传递。本地参考图像会被转换为 data URL;远程 http(s) 参考会直接传递。要将 xAI 用作默认图像提供方:xAI 还记录了
quality、mask、user,以及额外的原生比例
如 1:2、2:1、9:20 和 20:9。OpenClaw 目前仅转发共享的跨提供方图像控制项;
不支持的仅原生参数不会通过 image_generate 暴露。文本转语音
文本转语音
内置的
xai 插件通过共享的 tts
提供方接口注册文本转语音功能。- 音色:
eve、ara、rex、sal、leo、una - 默认音色:
eve - 格式:
mp3、wav、pcm、mulaw、alaw - 语言:BCP-47 代码或
auto - 速度:提供方原生速度覆盖
- 不支持原生 Opus 语音便笺格式
OpenClaw 使用 xAI 的批量
/v1/tts 端点。xAI 也提供通过 WebSocket 的流式 TTS,
但 OpenClaw 的语音提供方契约当前要求在返回回复前先获得完整音频缓冲区。语音转文本
语音转文本
内置的 语言可以通过共享的音频媒体配置或逐次转录请求提供。共享的 OpenClaw
接口接受提示词提示,但 xAI REST STT 集成只会转发文件、模型和
语言,因为这些与当前公开的 xAI 端点能很好地对应。
xai 插件通过 OpenClaw 的
媒体理解转录接口注册批量语音转文本功能。- 默认模型:
grok-stt - 端点:xAI REST
/v1/stt - 输入路径:multipart 音频文件上传
- 当传入音频转录使用
tools.media.audio时由 OpenClaw 支持,包括 Discord 语音频道片段和 频道音频附件
流式语音转文本
流式语音转文本
内置的 提供方专属配置位于
xai 插件还为实时语音通话音频注册了一个实时转录提供方。- 端点:xAI WebSocket
wss://api.x.ai/v1/stt - 默认编码:
mulaw - 默认采样率:
8000 - 默认 endpointing:
800ms - 中间转录:默认启用
plugins.entries.voice-call.config.streaming.providers.xai 下。支持的
键有 apiKey、baseUrl、sampleRate、encoding(pcm、mulaw 或
alaw)、interimResults、endpointingMs 和 language。该流式提供方用于 Voice Call 的实时转录路径。
Discord 语音当前会录制短片段,并改用批量
tools.media.audio 转录路径。x_search 配置
x_search 配置
内置的 xAI 插件将
x_search 暴露为一个 OpenClaw 工具,用于通过 Grok 搜索
X(原 Twitter)内容。配置路径:plugins.entries.xai.config.xSearch| 键 | 类型 | 默认值 | 说明 |
|---|---|---|---|
enabled | boolean | — | 启用或禁用 x_search |
model | string | grok-4-1-fast | 用于 x_search 请求的模型 |
baseUrl | string | — | xAI Responses 基础 URL 覆盖 |
inlineCitations | boolean | — | 在结果中包含行内引用 |
maxTurns | number | — | 最大对话轮数 |
timeoutSeconds | number | — | 请求超时时间(秒) |
cacheTtlMinutes | number | — | 缓存存活时间(分钟) |
代码执行配置
代码执行配置
内置的 xAI 插件将
code_execution 暴露为一个 OpenClaw 工具,用于
在 xAI 沙箱环境中远程执行代码。配置路径:plugins.entries.xai.config.codeExecution| 键 | 类型 | 默认值 | 说明 |
|---|---|---|---|
enabled | boolean | true(如果密钥可用) | 启用或禁用代码执行 |
model | string | grok-4-1-fast | 用于代码执行请求的模型 |
maxTurns | number | — | 最大对话轮数 |
timeoutSeconds | number | — | 请求超时时间(秒) |
这是远程 xAI 沙箱执行,不是本地
exec。已知限制
已知限制
- 目前仅支持 API 密钥认证。OpenClaw 还没有 xAI OAuth 或设备码流程。
grok-4.20-multi-agent-experimental-beta-0304在常规 xAI 提供方路径上不受支持, 因为它需要与标准 OpenClaw xAI 传输层不同的上游 API 面。- xAI Realtime 语音尚未作为 OpenClaw 提供方注册。它需要比批量 STT 或 流式转录更不同的双向语音会话契约。
- xAI 图像的
quality、图像mask以及额外的仅原生宽高比在共享的image_generate工具具备相应的 跨提供方控制之前不会暴露。
高级说明
高级说明
- OpenClaw 会在共享运行器路径上自动应用 xAI 特定的工具 schema 和工具调用兼容性修复。
- 原生 xAI 请求默认
tool_stream: true。将agents.defaults.models["xai/<model>"].params.tool_stream设为false可 禁用它。 - 捆绑的 xAI 包装器会在发送原生 xAI 请求之前移除不受支持的严格工具 schema 标志和 推理负载键。
web_search、x_search和code_execution作为 OpenClaw 工具暴露。OpenClaw 会在每个工具请求中启用其所需的特定 xAI 内置能力,而不是把所有原生工具都附加到每一轮聊天中。- Grok 的
web_search会读取plugins.entries.xai.config.webSearch.baseUrl。x_search会读取plugins.entries.xai.config.xSearch.baseUrl,然后 回退到 Grok 网页搜索基础 URL。 x_search和code_execution由捆绑的 xAI 插件负责,而不是硬编码到核心模型运行时中。code_execution是远程 xAI 沙箱执行,不是本地exec。
在线测试
xAI 媒体路径由单元测试和可选的在线套件覆盖。在线 命令会在探测XAI_API_KEY 之前,从你的登录 shell 中加载密钥,包括 ~/.profile。
相关
模型选择
选择提供商、模型引用和故障转移行为。
视频生成
共享的视频工具参数和提供商选择。
所有提供商
更广泛的提供商概览。
故障排除
常见问题及修复方法。