OpenClaw 的 Google Meet 参与者支持——该插件的设计是显式的:Documentation Index
Fetch the complete documentation index at: https://openclaw.zhcndoc.com/llms.txt
Use this file to discover all available pages before exploring further.
- 它只会加入明确的
https://meet.google.com/...URL。 - 它可以通过 Google Meet API 创建一个新的 Meet 空间,然后加入返回的 URL。
realtime语音是默认模式。- 当需要更深层的推理或工具时,实时语音可以回调到完整的 OpenClaw 代理。
- 代理通过
mode选择加入行为:使用realtime进行实时监听/回话,或使用transcribe在不通过实时语音桥接的情况下加入/控制浏览器。 - 身份验证从个人 Google OAuth 或已经登录的 Chrome 配置文件开始。
- 没有自动的同意提示播报。
- 默认的 Chrome 音频后端是
BlackHole 2ch。 - Chrome 可以在本地运行,也可以在配对的节点主机上运行。
- Twilio 接受拨入号码以及可选的 PIN 或 DTMF 序列;它不能直接拨打 Meet URL。
- CLI 命令是
googlemeet;meet保留给更广泛的代理电话会议工作流。
快速开始
安装本地音频依赖并配置一个后端实时语音提供商。OpenAI 是默认选项;Google Gemini Live 也可与realtime.provider: "google" 一起使用:
blackhole-2ch 会安装 BlackHole 2ch 虚拟音频设备。Homebrew 的安装程序要求在 macOS 显示该设备之前重启:
--mode transcribe 检查相同传输;该模式会跳过实时音频前提条件,
因为它不会通过桥接监听或发言:
voice-call 插件、Twilio 凭据和公共 webhook 暴露是否已准备就绪。将任何 ok: false 检查视为该传输和模式的阻塞条件,然后再让代理加入。脚本或机器可读输出请使用 openclaw googlemeet setup --json。在代理尝试加入之前,可使用 --transport chrome、--transport chrome-node 或 --transport twilio 预检特定传输。
对于 Twilio,当默认传输是 Chrome 时,始终显式预检该传输:
voice-call 连接、Twilio 凭据或不可达的 webhook 暴露。
加入会议:
google_meet 工具加入:
google_meet 工具在非 macOS 主机上仍然可用,用于 artifact、calendar、setup、transcribe、Twilio 和 chrome-node 工作流。由于捆绑的实时 Chrome 音频路径当前依赖 macOS BlackHole 2ch,因此本地 Chrome 实时操作在这些主机上会被阻止。在 Linux 上,请使用 mode: "transcribe"、Twilio 拨入,或使用 macOS 的 chrome-node 主机来进行实时 Chrome 参与。
创建一个新会议并加入它:
SpaceConfig.accessType:
OPEN 允许任何拥有 Meet URL 的人无需敲门即可加入。TRUSTED 允许宿主组织的受信任用户、受邀请的外部用户和拨入用户无需敲门即可加入。RESTRICTED 将免敲门访问限制为受邀者。这些设置仅适用于官方 Google Meet API 创建路径,因此必须配置 OAuth 凭据。
如果你在此选项可用之前已经对 Google Meet 完成了身份验证,请在将 meetings.space.settings 作用域添加到你的 Google OAuth 同意屏幕后,重新运行 openclaw googlemeet auth login --json。
仅创建 URL 而不加入:
googlemeet create 有两条路径:
- API 创建:在已配置 Google Meet OAuth 凭据时使用。这是最可预测的路径,并且不依赖浏览器 UI 状态。
- 浏览器回退:在缺少 OAuth 凭据时使用。OpenClaw 会使用固定的 Chrome 节点,打开
https://meet.google.com/new,等待 Google 重定向到真实的会议代码 URL,然后返回该 URL。此路径要求节点上的 OpenClaw Chrome 配置文件已经登录 Google。浏览器自动化会处理 Meet 自己首次运行时的麦克风提示;该提示不被视为 Google 登录失败。 加入和创建流程也会尝试在打开新标签页之前复用现有的 Meet 标签页。匹配会忽略无害的 URL 查询字符串,例如authuser,因此代理重试时应聚焦已打开的会议,而不是创建第二个 Chrome 标签页。
source 字段(api 或 browser),以便代理说明使用了哪条路径。create 默认会加入新会议,并返回 joined: true 以及加入会话。若只想生成 URL,请在 CLI 上使用 create --no-join,或向工具传入 "join": false。
或者告诉代理:“创建一个 Google Meet,用实时语音加入,并把链接发给我。” 代理应调用带有 action: "create" 的 google_meet,然后共享返回的 meetingUri。
"mode": "transcribe"。这不会启动双工实时模型桥接,不需要 BlackHole 或 SoX,也不会在会议中回话。此模式下的 Chrome 加入也会避免 OpenClaw 的麦克风/摄像头权限授予,并避免 Meet 的 Use microphone 路径。如果 Meet 显示音频选择中间页,自动化会尝试无麦克风路径,否则会报告人工操作,而不是打开本地麦克风。在 transcribe 模式下,受管的 Chrome 传输还会尽力安装 Meet 字幕观察器。googlemeet status --json 和 googlemeet doctor 会显示 captioning、captionsEnabledAttempted、transcriptLines、lastCaptionAt、lastCaptionSpeaker、lastCaptionText 以及简短的 recentTranscript 尾部信息,以便操作人员判断浏览器是否已加入通话,以及 Meet 字幕是否正在产出文本。
当你需要一个是/否探测时,请使用 openclaw googlemeet test-listen <meet-url> --transport chrome-node:它会以 transcribe 模式加入,等待新的字幕或转录变化,并返回 listenVerified、listenTimedOut、人工操作字段以及最新的字幕健康状态。
在实时会话期间,google_meet 状态会包含浏览器和音频桥健康信息,例如 inCall、manualActionRequired、providerConnected、realtimeReady、audioInputActive、audioOutputActive、最后输入/输出时间戳、字节计数器以及桥接关闭状态。如果出现安全的 Meet 页面提示,浏览器自动化会在可处理时予以处理。登录、主持人接纳以及浏览器/操作系统权限提示会以人工操作的形式报告,并附带原因和消息,供代理转述。受管的 Chrome 会话只有在浏览器健康状态报告 inCall: true 后才会输出介绍语或测试短语;否则状态会报告 speechReady: false,并且语音尝试会被阻止,而不是假装代理已经在会议中发言。
本地 Chrome 加入通过已登录的 OpenClaw 浏览器配置文件进行。实时模式需要 BlackHole 2ch 作为 OpenClaw 使用的麦克风/扬声器路径。要获得干净的双工音频,请使用分离的虚拟设备或类似 Loopback 的图形;单个 BlackHole 设备足以用于首次冒烟测试,但可能会回声。
本地网关 + Parallels Chrome
你不需要在 macOS 虚拟机内拥有完整的 OpenClaw Gateway 或模型 API 密钥,只是为了让该虚拟机拥有 Chrome。先在本地运行 Gateway 和代理,然后在虚拟机中运行节点主机。只需在虚拟机中启用捆绑插件一次,这样节点就会公布 Chrome 命令: 运行位置说明:- Gateway 主机:OpenClaw Gateway、代理工作区、模型/API 密钥、实时提供商,以及 Google Meet 插件配置。
- Parallels macOS 虚拟机:OpenClaw CLI/节点主机、Google Chrome、SoX、BlackHole 2ch,以及已登录 Google 的 Chrome 配置文件。
- 虚拟机中不需要:Gateway 服务、代理配置、OpenAI/GPT 密钥或模型提供商设置。
BlackHole 2ch:
<gateway-host> 是局域网 IP 且你未使用 TLS,那么除非你为该受信任的私有网络显式允许,否则节点会拒绝明文 WebSocket:
OPENCLAW_ALLOW_INSECURE_PRIVATE_WS=1 是进程环境变量,不是 openclaw.json 设置。openclaw node install 会在安装命令中存在该变量时把它存入 LaunchAgent 环境。
在 Gateway 主机上批准该节点:
googlemeet.chrome 和浏览器能力/browser.proxy:
transport: "chrome-node" 的 google_meet 工具。
要进行一次单命令冒烟测试,创建或复用一个会话、说出一个已知短语并打印会话健康状态:
manualActionRequired: true,并附带 manualActionReason 和 manualActionMessage。代理应停止重试加入,报告该精确消息以及当前的 browserUrl/browserTitle,并且仅在手动浏览器操作完成后再重试。
如果省略了 chromeNode.node,只有在恰好一个已连接节点同时公布 googlemeet.chrome 和浏览器控制时,OpenClaw 才会自动选择。如果连接了多个可用节点,请将 chromeNode.node 设为节点 id、显示名称或远程 IP。
常见故障检查:
Configured Google Meet node ... is not usable: offline:固定节点已被 Gateway 识别,但不可用。代理应将该节点视为诊断状态,而不是可用的 Chrome 主机,并报告设置阻塞,而不是在用户未要求的情况下回退到其他传输方式。No connected Google Meet-capable node:在虚拟机中启动openclaw node run,批准配对,并确保在虚拟机中运行了openclaw plugins enable google-meet和openclaw plugins enable browser。同时确认 Gateway 主机允许这两个节点命令,使用gateway.nodes.allowCommands: ["googlemeet.chrome", "browser.proxy"]。BlackHole 2ch audio device not found:在被检查的主机上安装blackhole-2ch,并在使用本地 Chrome 音频前重启。BlackHole 2ch audio device not found on the node:在虚拟机中安装blackhole-2ch并重启虚拟机。- Chrome 打开了但无法加入:在虚拟机内登录浏览器配置文件,或者保持
chrome.guestName用于访客加入。访客自动加入通过节点浏览器代理使用 OpenClaw 浏览器自动化;确保节点浏览器配置指向你想使用的配置文件,例如browser.defaultProfile: "user"或一个命名的现有会话配置文件。 - 重复的 Meet 标签页:保持
chrome.reuseExistingTab: true启用。OpenClaw 会在打开新标签页之前激活同一 Meet URL 的现有标签页,而浏览器会议创建也会在打开另一个标签页前复用一个正在进行中的https://meet.google.com/new或 Google 账号提示标签页。 - 没有音频:在 Meet 中,将麦克风/扬声器路由通过 OpenClaw 使用的虚拟音频设备路径;对于干净的双工音频,请使用分离的虚拟设备或 Loopback 风格的路由。
安装说明
Chrome 实时默认方案使用两个外部工具:sox:命令行音频工具。该插件使用明确的 CoreAudio 设备命令,为默认的 24 kHz PCM16 音频桥提供支持。blackhole-2ch:macOS 虚拟音频驱动。它会创建BlackHole 2ch音频设备,供 Chrome/Meet 路由音频使用。
LGPL-2.0-only AND GPL-2.0-only;BlackHole 的许可证是 GPL-3.0。若你构建的安装程序或设备将 BlackHole 与 OpenClaw 一起打包,请查阅 BlackHole 的上游许可条款,或从 Existential Audio 获取单独许可。
传输方式
Chrome
Chrome 传输会通过 OpenClaw 浏览器控制打开 Meet URL,并以已登录的 OpenClaw 浏览器配置文件身份加入会议。在 macOS 上,该插件会在启动前检查是否存在BlackHole 2ch。如果已配置,它还会在打开 Chrome 前运行音频桥健康检查命令和启动命令。当 Chrome/音频运行在 Gateway 主机上时使用 chrome;当 Chrome/音频运行在配对节点上时(例如 Parallels macOS VM)使用 chrome-node。对于本地 Chrome,使用 browser.defaultProfile 选择配置文件;chrome.browserProfile 会传递给 chrome-node 主机。
BlackHole 2ch,加入会失败并返回设置错误,而不会静默地在没有音频路径的情况下加入。
Twilio
Twilio 传输是一个由 Voice Call 插件托管的严格拨号计划。它不会解析 Meet 页面中的电话号码。 当无法使用 Chrome 参会,或者你希望通过电话拨入作为备用方案时,请使用此方式。Google Meet 必须为该会议公开电话拨入号码和 PIN;OpenClaw 不会从 Meet 页面中自动发现这些信息。 在 Gateway 主机上启用 Voice Call 插件,而不是在 Chrome 节点上启用:openclaw.json:
voice-call 后请重启或重新加载 Gateway;插件配置变更不会在已运行的 Gateway 进程中立即生效,直到它重新加载为止。
然后验证:
googlemeet setup 会包含成功的 twilio-voice-call-plugin、twilio-voice-call-credentials 和 twilio-voice-call-webhook 检查。
--dtmf-sequence:
OAuth 和预检
创建 Meet 链接时,OAuth 不是必需的,因为googlemeet create 可以回退到浏览器自动化。若你希望使用官方 API 创建、空间解析或 Meet Media API 预检检查,则配置 OAuth。
Google Meet API 访问使用用户 OAuth:创建 Google Cloud OAuth 客户端,申请所需作用域,授权一个 Google 账号,然后将生成的刷新令牌存储在 Google Meet 插件配置中,或者提供 OPENCLAW_GOOGLE_MEET_* 环境变量。
OAuth 并不会替代 Chrome 加入路径。当你使用浏览器参会时,Chrome 和 Chrome-node 传输仍会通过已登录的 Chrome 配置文件、BlackHole/SoX 以及连接的节点加入。OAuth 仅用于官方 Google Meet API 路径:创建会议空间、解析空间以及运行 Meet Media API 预检检查。
创建 Google 凭据
在 Google Cloud Console 中:- 创建或选择一个 Google Cloud 项目。
- 为该项目启用 Google Meet REST API。
-
配置 OAuth 同意屏幕。
- 对 Google Workspace 组织而言,Internal 最简单。
- External 适用于个人/测试环境;在应用处于 Testing 期间,将每个会授权该应用的 Google 账号添加为测试用户。
-
添加 OpenClaw 请求的作用域:
https://www.googleapis.com/auth/meetings.space.createdhttps://www.googleapis.com/auth/meetings.space.readonlyhttps://www.googleapis.com/auth/meetings.space.settingshttps://www.googleapis.com/auth/meetings.conference.media.readonly
-
创建一个 OAuth 客户端 ID。
- 应用类型:Web application。
-
授权重定向 URI:
- 复制客户端 ID 和客户端密钥。
meetings.space.created 是 Google Meet spaces.create 所需的权限。
meetings.space.readonly 允许 OpenClaw 将 Meet URL/代码解析为空间。
meetings.space.settings 允许 OpenClaw 在通过 API 创建房间时传递
accessType 等 SpaceConfig 设置。
meetings.conference.media.readonly 用于 Meet Media API 预检和媒体
相关工作;Google 在实际使用 Media API 时可能要求加入 Developer Preview。
如果你只需要基于浏览器的 Chrome 加入,可完全跳过 OAuth。
获取刷新令牌
配置oauth.clientId,并可选地配置 oauth.clientSecret,或者将它们作为环境变量传入,然后运行:
oauth 配置块。它使用 PKCE、http://localhost:8085/oauth2callback 的本地回调,以及 --manual 的手动复制/粘贴流程。
示例:
oauth 对象存储到 Google Meet 插件配置下:
openclaw googlemeet auth login --json,以使刷新令牌具备 meetings.space.created 作用域。
使用 doctor 验证 OAuth
当你需要快速、非敏感的健康检查时,运行 OAuth doctor:ok、configured、tokenSource、expiresAt 和检查消息等状态字段;不会打印访问令牌、刷新令牌或客户端密钥。
常见结果:
| 检查 | 含义 |
|---|---|
oauth-config | 存在 oauth.clientId 加 oauth.refreshToken,或存在缓存的访问令牌。 |
oauth-token | 缓存的访问令牌仍然有效,或刷新令牌已生成新的访问令牌。 |
meet-spaces-get | 可选的 --meeting 检查已解析一个现有 Meet 空间。 |
meet-spaces-create | 可选的 --create-space 检查已创建一个新的 Meet 空间。 |
spaces.create 作用域可用,请运行会产生副作用的创建检查:
--create-space 会创建一个一次性的 Meet URL。当你需要确认 Google Cloud 项目已启用 Meet API,并且已授权的账号具备 meetings.space.created 作用域时,可使用此项。
要证明对现有会议空间的读取权限:
doctor --oauth --meeting 和 resolve-space 可证明已授权的 Google 账号对现有空间拥有读取权限。这些检查返回 403,通常意味着 Google Meet REST API 被禁用、已同意的刷新令牌缺少所需作用域,或者该 Google 账号无法访问该 Meet 空间。刷新令牌错误则表示需要重新运行 openclaw googlemeet auth login --json 并保存新的 oauth 块。
浏览器回退模式不需要 OAuth 凭据。在该模式下,Google 认证来自所选节点上已登录的 Chrome 配置文件,而不是来自 OpenClaw 配置。
接受以下环境变量作为回退:
OPENCLAW_GOOGLE_MEET_CLIENT_ID或GOOGLE_MEET_CLIENT_IDOPENCLAW_GOOGLE_MEET_CLIENT_SECRET或GOOGLE_MEET_CLIENT_SECRETOPENCLAW_GOOGLE_MEET_REFRESH_TOKEN或GOOGLE_MEET_REFRESH_TOKENOPENCLAW_GOOGLE_MEET_ACCESS_TOKEN或GOOGLE_MEET_ACCESS_TOKENOPENCLAW_GOOGLE_MEET_ACCESS_TOKEN_EXPIRES_AT或GOOGLE_MEET_ACCESS_TOKEN_EXPIRES_ATOPENCLAW_GOOGLE_MEET_DEFAULT_MEETING或GOOGLE_MEET_DEFAULT_MEETINGOPENCLAW_GOOGLE_MEET_PREVIEW_ACK或GOOGLE_MEET_PREVIEW_ACK
spaces.get 解析 Meet URL、代码或 spaces/{id}:
--meeting 时,artifacts 和 attendance 默认使用最新的会议记录。当你希望获取该会议保留的每一条记录时,传入 --all-conference-records。
在读取 Meet 工件之前,日历查询可以先从 Google Calendar 解析会议 URL:
--today 会在今天的 primary 日历中搜索带有 Google Meet 链接的日历事件。使用 --event <query> 搜索匹配的事件文本,使用 --calendar <id> 指定非主日历。日历查询需要一次包含 Calendar events readonly 作用域的最新 OAuth 登录。
calendar-events 会预览匹配的 Meet 事件,并标记 latest、artifacts、attendance 或 export 将会选择的事件。
如果你已经知道会议记录 ID,可以直接指定:
spaces.endActiveConference,并要求 OAuth 具备 meetings.space.created 作用域,且该空间可由已授权账号管理。
OpenClaw 接受 Meet URL、会议代码或 spaces/{id} 输入,并在结束活动会议前将其解析为 API 空间资源。
这与 googlemeet leave 是分开的:leave 会停止 OpenClaw 的本地/会话参与,而 end-active-conference 则请求 Google Meet 结束该空间的活动会议。
编写一份可读报告:
artifacts 会返回会议记录元数据,以及参与者、录制、转录、结构化转录条目和智能笔记资源元数据(如果 Google 对该会议提供了这些内容)。对于大型会议,使用 --no-transcript-entries 可跳过条目查询。attendance 会将参与者展开为 participant-session 行,包含首次/最后出现时间、总会话时长、迟到/早退标记,以及按已登录用户或显示名称合并的重复参与者资源。传入 --no-merge-duplicates 可保留原始参与者资源,传入 --late-after-minutes 可调整迟到检测,传入 --early-before-minutes 可调整早退检测。
export 会写入一个文件夹,内含 summary.md、attendance.csv、transcript.md、artifacts.json、attendance.json 和 manifest.json。
manifest.json 会记录所选输入、导出选项、会议记录、输出文件、计数、令牌来源、所用的 Calendar 事件(如果有),以及任何部分获取警告。传入 --zip 还会在文件夹旁边生成一个便携式压缩包。传入 --include-doc-bodies 会通过 Google Drive files.export 导出关联的转录和智能笔记 Google Docs 文本;这需要一次包含 Drive Meet readonly 作用域的最新 OAuth 登录。不使用 --include-doc-bodies 时,导出仅包含 Meet 元数据和结构化转录条目。如果 Google 返回部分工件失败,例如智能笔记列表、转录条目或 Drive 文档正文错误,摘要和清单会保留警告,而不会导致整个导出失败。
使用 --dry-run 可获取相同的工件/出席数据并打印清单 JSON,而不创建文件夹或 ZIP。这在你需要在写出大型导出之前检查,或者代理只需要计数、所选记录和警告时非常有用。
代理也可以通过 google_meet 工具创建相同的捆绑包:
"dryRun": true 可仅返回导出清单并跳过文件写入。
Agents can also create an API-backed room with an explicit access policy:
test_listen before claiming the
meeting is useful:
OPENCLAW_LIVE_TEST=1启用受保护的 live 测试。OPENCLAW_GOOGLE_MEET_LIVE_MEETING指向一个保留的 Meet URL、代码或spaces/{id}。OPENCLAW_GOOGLE_MEET_CLIENT_ID或GOOGLE_MEET_CLIENT_ID提供 OAuth 客户端 ID。OPENCLAW_GOOGLE_MEET_REFRESH_TOKEN或GOOGLE_MEET_REFRESH_TOKEN提供 刷新令牌。- 可选:
OPENCLAW_GOOGLE_MEET_CLIENT_SECRET、OPENCLAW_GOOGLE_MEET_ACCESS_TOKEN以及OPENCLAW_GOOGLE_MEET_ACCESS_TOKEN_EXPIRES_AT使用与OPENCLAW_前缀相同的回退名称。
https://www.googleapis.com/auth/meetings.space.readonly 和
https://www.googleapis.com/auth/meetings.conference.media.readonly。日历
查询需要 https://www.googleapis.com/auth/calendar.events.readonly。Drive
文档正文导出需要
https://www.googleapis.com/auth/drive.meet.readonly。
创建一个新的 Meet 空间:
meeting uri、来源和加入会话。使用 OAuth 凭据时,它会使用官方 Google Meet API。没有 OAuth 凭据时,它会回退到已固定的 Chrome 节点中已登录的浏览器配置文件。代理可以使用 google_meet 工具并设置 action: "create" 来一步完成创建和加入。若只需创建 URL,不加入,请传入 "join": false。
浏览器回退的 JSON 输出示例:
google_meet 工具会返回结构化详情,而不是简单字符串:
manualActionRequired: true 时,应报告 manualActionMessage 以及浏览器节点/标签页上下文,并在操作员完成浏览器步骤之前停止打开新的 Meet 标签页。
API 创建的 JSON 输出示例:
manualActionRequired: true 或浏览器回退错误,并要求操作员先完成 Google 登录后再重试。
只有在确认你的 Cloud 项目、OAuth 主体以及会议参与者已加入 Google Workspace Developer Preview Program 的 Meet media APIs 后,才将 preview.enrollmentAcknowledged: true 设为 true。
配置
常见的 Chrome 实时路径只需要启用插件、BlackHole、SoX,以及一个后端实时语音提供方密钥。OpenAI 是默认值;将realtime.provider: "google" 设置为使用 Google Gemini Live:
plugins.entries.google-meet.config 下设置插件配置:
defaultTransport: "chrome"defaultMode: "realtime"chromeNode.node:chrome-node的可选节点 id/名称/IPchrome.audioBackend: "blackhole-2ch"chrome.guestName: "OpenClaw Agent": 在未登录的 Meet 来宾屏幕上使用的名称chrome.autoJoin: true: 尽力通过 OpenClaw 的浏览器自动化在chrome-node上填充来宾名称并点击 Join Nowchrome.reuseExistingTab: true: 激活现有的 Meet 标签页,而不是打开重复标签页chrome.waitForInCallMs: 20000: 在触发实时引导语之前,等待 Meet 标签页报告已在通话中chrome.audioFormat: "pcm16-24khz": 命令对音频格式。仅对仍然输出电话音频的旧版/自定义命令对使用"g711-ulaw-8khz"。chrome.audioInputCommand: 从 CoreAudioBlackHole 2ch读取并以chrome.audioFormat写出音频的 SoX 命令chrome.audioOutputCommand: 以chrome.audioFormat读取音频并写入 CoreAudioBlackHole 2ch的 SoX 命令chrome.bargeInInputCommand: 可选的本地麦克风命令,在助手播放激活时写出有符号 16 位小端单声道 PCM,用于检测人类插话。此项当前适用于 Gateway 托管的chrome命令对桥接。chrome.bargeInRmsThreshold: 650: 在chrome.bargeInInputCommand上被视为人类打断的 RMS 阈值chrome.bargeInPeakThreshold: 2500: 在chrome.bargeInInputCommand上被视为人类打断的峰值阈值chrome.bargeInCooldownMs: 900: 连续人类打断清除之间的最小延迟realtime.provider: "openai"realtime.toolPolicy: "safe-read-only"realtime.instructions:简短的口头回复,并在需要更深入答案时使用openclaw_agent_consultrealtime.introMessage:实时桥接连接时的简短口头就绪检查;将其设为""可静默加入realtime.agentId:用于openclaw_agent_consult的可选 OpenClaw agent id;默认值为main
voiceCall.enabled 默认为 true;在使用 Twilio 传输时,它会将实际的 PSTN 呼叫、DTMF 以及引导问候语委托给 Voice Call 插件。Voice Call 会在打开实时媒体流之前播放 DTMF 序列,然后使用已保存的引导文本作为初始实时问候语。如果未启用 voice-call,Google Meet 仍然可以验证并记录拨号计划,但无法发起 Twilio 呼叫。
工具
Agent 可以使用google_meet 工具:
transport: "chrome"。当 Chrome 运行在配对节点上,例如 Parallels 虚拟机时,使用 transport: "chrome-node"。在这两种情况下,实时模型和 openclaw_agent_consult 都运行在 Gateway 主机上,因此模型凭据保留在那里。
使用 action: "status" 来列出活动会话或检查某个会话 ID。使用带有 sessionId 和 message 的 action: "speak" 让实时 agent 立即发言。使用 action: "test_speech" 来创建或复用会话、触发一个已知短语,并在 Chrome 主机能够报告时返回 inCall 健康状态。test_speech 总是强制使用 mode: "realtime",如果要求在 mode: "transcribe" 中运行则会失败,因为仅观察模式的会话本意上不能发言。其 speechOutputVerified 结果基于本次测试通话期间实时音频输出字节是否增加,因此复用一个具有较旧音频的会话不算作一次新的成功发言检查。使用 action: "leave" 将会话标记为已结束。
status 在可用时包含 Chrome 健康状态:
inCall: Chrome 看起来已进入 Meet 通话micMuted: 尽力判断的 Meet 麦克风状态manualActionRequired/manualActionReason/manualActionMessage: 浏览器配置文件需要手动登录、Meet 主持人接纳、权限或浏览器控制修复后,语音才能工作speechReady/speechBlockedReason/speechBlockedMessage: 当前是否允许受管 Chrome 语音。speechReady: false表示 OpenClaw 没有将引导/测试短语发送到音频桥。providerConnected/realtimeReady: 实时语音桥接状态lastInputAt/lastOutputAt: 最近从桥接接收或发送的音频时间lastSuppressedInputAt/suppressedInputBytes: 助手播放激活时被忽略的回环输入
实时 agent 咨询
Chrome 实时模式针对实时语音循环进行了优化。实时语音提供方会收听会议音频,并通过配置的音频桥发言。当实时模型需要更深入的推理、当前信息或普通 OpenClaw 工具时,它可以调用openclaw_agent_consult。
咨询工具会在后台运行常规 OpenClaw agent,带上最近的会议转录上下文,并将一个简洁的口头答案返回给实时语音会话。随后语音模型可以将该答案再次说回会议中。它使用与 Voice Call 相同的共享实时咨询工具。
默认情况下,咨询会针对 main agent 运行。当某个 Meet 通道应咨询专用的 OpenClaw agent 工作区、模型默认值、工具策略、记忆和会话历史时,设置 realtime.agentId。
realtime.toolPolicy 控制咨询运行:
safe-read-only:暴露咨询工具,并将常规 agent 限制为read、web_search、web_fetch、x_search、memory_search和memory_get。owner:暴露咨询工具,并允许常规 agent 使用正常的 agent 工具策略。none:不向实时语音模型暴露咨询工具。
实地测试清单
在把会议交给无人值守 agent 之前,使用以下顺序:googlemeet setup全部为绿色。- 当 Chrome-node 是默认传输或节点被固定时,
googlemeet setup包含chrome-node-connected。 nodes status显示所选节点已连接。- 所选节点同时声明
googlemeet.chrome和browser.proxy。 - Meet 标签页加入通话,并且
test-speech返回的 Chrome 健康状态包含inCall: true。
googlemeet setup包含绿色的twilio-voice-call-plugin、twilio-voice-call-credentials和twilio-voice-call-webhook检查。- Gateway 重新加载后,CLI 中可用
voicecall。 - 返回的会话包含
transport: "twilio"和一个twilio.voiceCallId。 openclaw logs --follow显示在实时 TwiML 之前已提供 DTMF TwiML,然后是一个带有已排队初始问候语的实时桥接。googlemeet leave <sessionId>会挂断委托的语音呼叫。
故障排查
Agent 无法看到 Google Meet 工具
确认插件已在 Gateway 配置中启用,然后重新加载 Gateway:plugins.entries.google-meet,请重启或重新加载 Gateway。
运行中的 agent 只能看到由当前 Gateway 进程注册的插件工具。
在非 macOS 的 Gateway 主机上,面向 agent 的 google_meet 工具仍然可见,
但本地 Chrome 实时操作会在到达音频桥之前被阻止。
本地 Chrome 实时音频当前依赖 macOS 的 BlackHole 2ch,因此
Linux agent 应使用 mode: "transcribe"、Twilio 拨入,或 macOS
chrome-node 主机,而不是默认的本地 Chrome 实时路径。
No connected Google Meet-capable node
在节点主机上运行:googlemeet.chrome 以及 browser.proxy。
Gateway 配置必须允许这些节点命令:
googlemeet setup 失败并出现 chrome-node-connected,或者 Gateway 日志报告 gateway token mismatch,请使用当前 Gateway token 重新安装或重启节点。对于 LAN Gateway,这通常意味着:
浏览器打开了,但 agent 无法加入
对仅观察加入运行googlemeet test-listen,或对实时加入运行 googlemeet test-speech,然后检查返回的 Chrome 健康状态。如果任一探测报告 manualActionRequired: true,请向操作员展示 manualActionMessage,并在浏览器操作完成前停止重试。
常见的人工操作:
- 登录 Chrome 配置文件。
- 从 Meet 主持人账户中接纳来宾。
- 当 Chrome 原生权限提示出现时,授予 Chrome 麦克风/摄像头权限。
- 关闭或修复卡住的 Meet 权限对话框。
创建会议失败
当配置了 OAuth 凭据时,googlemeet create 会首先使用 Google Meet API 的 spaces.create 端点。没有 OAuth 凭据时,它会回退到固定的 Chrome 节点浏览器。确认:
- 对于 API 创建:已配置
oauth.clientId和oauth.refreshToken,或者存在匹配的OPENCLAW_GOOGLE_MEET_*环境变量。 - 对于 API 创建:刷新令牌是在添加创建支持之后签发的。较旧的令牌可能缺少
meetings.space.created作用域;请重新运行openclaw googlemeet auth login --json并更新插件配置。 - 对于浏览器回退:
defaultTransport: "chrome-node"和chromeNode.node指向一个已连接的节点,该节点具有browser.proxy和googlemeet.chrome。 - 对于浏览器回退:该节点上的 OpenClaw Chrome 配置文件已登录 Google,并且可以打开
https://meet.google.com/new。 - 对于浏览器回退:重试会在打开新标签页之前复用现有的
https://meet.google.com/new或 Google 账号提示标签页。如果 agent 超时,请重试工具调用,而不是手动打开另一个 Meet 标签页。 - 对于浏览器回退:如果工具返回
manualActionRequired: true,请使用返回的browser.nodeId、browser.targetId、browserUrl和manualActionMessage来指导操作员。在该操作完成之前不要循环重试。 - 对于浏览器回退:如果 Meet 显示“Do you want people to hear you in the meeting?”,请保持标签页打开。OpenClaw 应该通过浏览器自动化点击 Use microphone,或者在仅创建回退路径中点击 Continue without microphone,并继续等待生成的 Meet URL。如果做不到,错误信息应提到
meet-audio-choice-required,而不是google-login-required。
Agent 加入了但不说话
检查实时路径:mode: "realtime"。mode: "transcribe" 故意不会启动双工实时语音桥接。对于仅观察调试,在参与者发言后运行 openclaw googlemeet status --json <session-id>,并检查 captioning、transcriptLines 和 lastCaptionText。如果 inCall 为真但 transcriptLines 仍为 0,可能是 Meet 字幕被禁用、在安装观察器后没人发言、Meet UI 变更,或者该会议语言/账号不可用实时字幕。
googlemeet test-speech 始终检查实时路径,并报告本次调用是否观察到了桥接输出字节。如果 speechOutputVerified 为 false 且 speechOutputTimedOut 为 true,实时提供方可能已经接受了该语句,但 OpenClaw 没有看到新的输出字节到达 Chrome 音频桥。
另外还要验证:
- Gateway 主机上可用实时提供方密钥,例如
OPENAI_API_KEY或GEMINI_API_KEY。 - Chrome 主机上可见
BlackHole 2ch。 - Chrome 主机上存在
sox。 - Meet 麦克风和扬声器通过 OpenClaw 使用的虚拟音频路径进行路由。
googlemeet doctor [session-id] 会打印会话、节点、通话中状态、手动操作原因、实时提供方连接、realtimeReady、音频输入/输出活动、最近音频时间戳、字节计数以及浏览器 URL。需要原始 JSON 时使用 googlemeet status [session-id] --json。需要验证 Google Meet OAuth 刷新但不暴露 token 时使用 googlemeet doctor --oauth;如果还需要 Google Meet API 证明,则加上 --meeting 或 --create-space。
如果某个 agent 超时了,而你能看到一个 Meet 标签页已经打开,请检查那个标签页,不要再打开另一个:
recover_current_tab。它会为所选传输方式聚焦并检查一个已存在的 Meet 标签页。对于 chrome,它通过 Gateway 使用本地浏览器控制;对于 chrome-node,它使用已配置的 Chrome 节点。它不会打开新标签页或创建新会话;它会报告当前阻塞因素,例如登录、接纳、权限或音频选择状态。CLI 命令会与已配置的 Gateway 通信,因此 Gateway 必须正在运行;chrome-node 还要求 Chrome 节点已连接。
Twilio 设置检查失败
当未允许或未启用voice-call 时,twilio-voice-call-plugin 会失败。将其加入 plugins.allow,启用 plugins.entries.voice-call,然后重新加载 Gateway。
当 Twilio 后端缺少 account SID、auth token 或 caller number 时,twilio-voice-call-credentials 会失败。在 Gateway 主机上设置这些变量:
voice-call 没有公开的 webhook 暴露,或者 publicUrl 指向回环或私有网络空间时,twilio-voice-call-webhook 会失败。将 plugins.entries.voice-call.config.publicUrl 设置为公共提供方 URL,或配置 voice-call tunnel/Tailscale 暴露。
回环和私有 URL 不适用于运营商回调。不要将 localhost、127.0.0.1、0.0.0.0、10.x、172.16.x-172.31.x、192.168.x、169.254.x、fc00::/7 或 fd00::/8 用作 publicUrl。
对于稳定的公共 URL:
voicecall smoke 默认只做就绪检查。要对特定号码进行 dry-run:
--yes:
Twilio 通话已开始但从未进入会议
确认 Meet 事件暴露了电话拨入详情。传入精确的拨入号码和 PIN,或者自定义 DTMF 序列:--dtmf-sequence 中使用前导 w 或逗号。
如果电话呼叫已创建,但 Meet 名册中始终没有出现拨入参与者:
- 运行
openclaw googlemeet doctor <session-id>以确认委托的 Twilio 呼叫 ID、DTMF 是否已排队,以及是否请求了引导问候语。 - 运行
openclaw voicecall status --call-id <id>并确认通话仍处于活动状态。 - 运行
openclaw voicecall tail并检查 Twilio webhook 是否到达 Gateway。 - 运行
openclaw logs --follow,查看 Twilio Meet 序列:Google Meet 委托加入,Voice Call 启动电话线路,Google Meet 等待voiceCall.dtmfDelayMs,使用voicecall.dtmf发送 DTMF,等待voiceCall.postDtmfSpeechDelayMs,然后用voicecall.speak请求引导语音。 - 重新运行
openclaw googlemeet setup --transport twilio;绿色的设置检查是必需的,但并不能证明会议 PIN 序列正确。 - 确认拨入号码属于与 PIN 相同的 Meet 邀请和地区。
- 如果 Meet 接听较慢,或者通话转录仍在显示发送 DTMF 之后要求输入 PIN 的提示,请增大
voiceCall.dtmfDelayMs。 - 如果参与者已加入但你听不到问候语,请检查
openclaw logs --follow中 DTMF 后的voicecall.speak请求,以及媒体流 TTS 播放或 Twilio<Say>回退。如果通话转录中仍包含“enter the meeting PIN”,说明电话线路尚未加入 Meet 房间,因此会议参与者还听不到语音。
plugins.entries.voice-call.config.publicUrl 或配置的隧道。参见 Voice call troubleshooting。
注意事项
Google Meet 的官方媒体 API 以接收为导向,因此在 Meet 通话中发言仍然需要一个参与者路径。这个插件保持了这一边界的可见性:Chrome 负责浏览器参与和本地音频路由;Twilio 负责电话拨入参与。 Chrome 实时模式需要BlackHole 2ch 以及以下任一项:
chrome.audioInputCommand加上chrome.audioOutputCommand:OpenClaw 负责实时模型桥接,并在chrome.audioFormat中在这些命令与所选的实时语音提供商之间传输音频。Chrome 的默认路径是 24 kHz PCM16;8 kHz G.711 mu-law 仍可用于旧版命令对。chrome.audioBridgeCommand:一个外部桥接命令负责整个本地音频路径,并且必须在启动或验证其守护进程后退出。
chrome.bargeInInputCommand 可以监听一个单独的本地麦克风,并在用户开始说话时清除助手播放内容。这样即使在助手播放期间,共享的 BlackHole 回环输入会暂时被抑制,人类语音仍能优先于助手输出。和 chrome.audioInputCommand 与 chrome.audioOutputCommand 一样,它是由操作者配置的本地命令。请使用明确可信的命令路径或参数列表,不要指向不受信任位置中的脚本。
googlemeet speak 会触发 Chrome 会话的活动实时音频桥接。googlemeet leave 会停止该桥接。对于通过语音通话插件委派的 Twilio 会话,leave 还会挂断底层语音通话。如果你还想关闭由 API 管理的空间中的活动 Google Meet 会议,请使用 googlemeet end-active-conference。