原因
- 自动回复运行可能成本很高(LLM 调用),并且当多条传入消息几乎同时到达时可能发生冲突。
- 串行化可以避免对共享资源的竞争(会话文件、日志、CLI stdin),并降低触发上游速率限制的可能性。
工作原理
- 一个支持 lane 感知的 FIFO 队列会以可配置的并发上限清空每个 lane(未配置的 lane 默认为 1;main 默认为 4,subagent 默认为 8)。
runEmbeddedAgent按 会话键(lanesession:<key>)入队,以确保每个会话同一时间只有一个活跃运行。- 然后,每个会话运行都会进入一个 全局 lane(默认
main),从而将整体并行度限制为agents.defaults.maxConcurrent。 - 启用详细日志时,排队运行如果在启动前等待超过约 2 秒,会输出一条简短提示。
- 在排队时,打字指示仍会立即触发(如果渠道支持),因此在等待轮到我们时用户体验不会改变。
默认值
未设置时,所有传入渠道表面使用:mode: "steer"debounceMs: 500cap: 20drop: "summarize"
队列模式
/queue 控制当会话已经有一个活跃运行时,正常的入站消息会如何处理:
steer: 将消息注入到活跃运行时中。OpenClaw 会在当前助手轮次执行完其工具调用之后、下一次 LLM 调用之前交付所有待处理的引导消息;Codex app-server 会接收一个批量的turn/steer。如果运行未在主动流式输出,或者引导不可用,OpenClaw 会等到活跃运行结束后再开始处理提示。followup: 不进行引导。在当前运行结束后,将每条消息排入稍后的代理轮次。collect: 不进行引导。将排队消息合并为静默窗口之后的 单个 后续轮次。如果消息目标指向不同的渠道/线程,则会分别清空,以保留路由。interrupt: 中止该会话的活跃运行,然后运行最新消息。
/steer <message>
命令,请参见 Steer。
通过 messages.queue 全局配置或按渠道配置:
队列选项
选项适用于已排队的传递。debounceMs 在 steer 模式下也会设置 Codex 引导的静默窗口:
debounceMs: 在清空排队的后续消息或 collect 批次之前的静默窗口;在 Codex 的steer模式下,则是在发送批量turn/steer之前的静默窗口。裸数字表示毫秒;/queue选项接受ms、s、m、h和d单位。cap: 每个会话的最大排队消息数。小于1的值会被忽略。drop: "summarize":默认值。按需丢弃最旧的队列条目,保留简短摘要,并将其作为合成的后续提示注入。drop: "old":按需丢弃最旧的队列条目,不保留摘要。drop: "new":当队列已满时拒绝最新消息。
debounceMs: 500、cap: 20、drop: summarize。
引导与流式输出
当渠道流式输出为partial 或 block 时,引导可能会表现为在活跃运行到达运行时边界之前出现若干条较短的可见回复:
partial: 预览可能会提前完成,然后在引导被接受后启动新的预览。block: 草稿大小的块也可能产生相同的顺序外观。- 在没有流式输出时,当运行时无法接受同轮引导,引导会回退为活跃运行结束后的后续轮次。
steer 不会中止正在执行中的工具。若最新消息应当中止当前运行,请使用 /queue interrupt。
优先级
对于模式选择,OpenClaw 的解析顺序是:- 内联或已存储的按会话
/queue覆盖。 messages.queue.byChannel.<channel>。messages.queue.mode。- 默认
steer。
/queue 选项优先于配置。然后应用按渠道的 debounce(messages.queue.debounceMsByChannel)、插件 debounce 默认值、全局 messages.queue 选项以及内置默认值。cap 和 drop 是全局/会话选项,而不是按渠道配置键。
按会话覆盖
- 发送
/queue <steer|followup|collect|interrupt>作为独立命令,以存储当前会话的队列模式。 - 选项可以组合:
/queue collect debounce:0.5s cap:25 drop:summarize /queue default或/queue reset会清除会话覆盖。
作用范围与保证
- 适用于所有使用网关回复管道的传入渠道上的自动回复代理运行(WhatsApp web、Telegram、Slack、Discord、Signal、iMessage、webchat 等)。
- 默认 lane(
main)是进程级的,适用于传入 + main 心跳;设置agents.defaults.maxConcurrent可允许多个会话并行。 - 还可能存在额外的 lane(例如
cron、cron-nested、nested、subagent),这样后台作业可以并行运行而不会阻塞传入回复。隔离的 cron 代理轮次会占用一个cron槽位,而其内部代理执行则使用cron-nested;两者都使用cron.maxConcurrentRuns。共享的非 cronnested流保持其各自的 lane 行为。这些分离的运行被跟踪为 后台任务。 - 按会话划分的 lane 保证同一时间只有一个代理运行会触及给定会话。
- 不依赖外部组件或后台工作线程;纯 TypeScript + promises。
故障排查
- 如果命令看起来卡住了,请启用详细日志并查找 “queued for …ms” 行,以确认队列正在清空。
- 如果需要队列深度,请启用详细日志并观察队列计时行。
- 接受一个 turn 之后就停止输出进度的 Codex app-server 运行,会被 Codex 适配器中断,这样活跃会话 lane 就能释放,而不是一直等到外层运行超时。
- 启用诊断后,若会话在
diagnostics.stuckSessionWarnMs之后仍处于processing,且没有观察到回复、工具、状态、块或 ACP 进度,则会按当前活动类型分类。活跃工作会记录为session.long_running;没有近期进度的活跃工作会记录为session.stalled;session.stuck仅保留给可恢复的陈旧会话账本状态,包括处于空闲排队且存在陈旧无主模型/工具活动的会话,并且只有该路径才能释放受影响的会话 lane 以便排队工作继续流动。当会话保持不变时,重复的session.stuck诊断会退避。