agentic loop 是 agent 的完整“真实”运行:接收输入 → 组装上下文 → 模型推理 → 工具执行 → 流式回复 → 持久化。它是将消息转化为动作和最终回复的权威路径,同时保持 session 状态一致。 在 OpenClaw 中,loop 是每个 session 一次单线程串行运行:当模型思考、调用工具并流式输出时,它会发出生命周期和流事件。本文说明这个真实 loop 是如何端到端连接起来的。Documentation Index
Fetch the complete documentation index at: https://openclaw.zhcndoc.com/llms.txt
Use this file to discover all available pages before exploring further.
入口点
- Gateway RPC:
agent和agent.wait。 - CLI:
agent命令。
工作原理(高层)
agentRPC 验证参数,解析 session(sessionKey/sessionId),持久化 session 元数据,并立即返回{ runId, acceptedAt }。agentCommand运行 agent:- 解析模型 + thinking/verbose/trace 默认值
- 加载 skills 快照
- 调用
runEmbeddedPiAgent(pi-agent-core 运行时) - 如果嵌入式 loop 没有发出 lifecycle end/error,则发出该事件
runEmbeddedPiAgent:- 通过每 session + 全局队列串行化运行
- 解析模型 + 认证配置文件并构建 pi session
- 订阅 pi 事件并流式输出 assistant/tool 增量
- 强制超时 -> 超出则中止运行
- 对于 Codex app-server turns,如果已接受的 turn 在没有产生 app-server 进度且没有终止事件之前停止,则中止它
- 返回 payload 和 usage 元数据
subscribeEmbeddedPiSession将 pi-agent-core 事件桥接到 OpenClawagent流:- tool 事件 =>
stream: "tool" - assistant 增量 =>
stream: "assistant" - lifecycle 事件 =>
stream: "lifecycle"(phase: "start" | "end" | "error")
- tool 事件 =>
agent.wait使用waitForAgentRun:- 等待
runId的 lifecycle end/error - 返回
{ status: ok|error|timeout, startedAt, endedAt, error? }
- 等待
排队 + 并发
- 运行会按 session key(session lane)串行化,并且可选地通过全局 lane 串行化。
- 这可以防止工具/session 竞态,并保持 session 历史一致。
- 消息通道可以选择队列模式(collect/steer/followup),这些模式会接入此 lane 系统。 参见 Command Queue。
- Transcript 写入同样受 session 文件上的 session 写锁保护。该锁具有进程感知且基于文件,因此可以捕获绕过进程内队列或来自其他进程的写入者。Session transcript 写入者在报告 session 忙碌之前,会等待最多
session.writeLock.acquireTimeoutMs;默认值为60000ms。 - Session 写锁默认是不可重入的。如果某个 helper 有意在保持单一逻辑写者的前提下嵌套获取同一把锁,则必须显式启用
allowReentrant: true。
Session + workspace 准备
- workspace 会被解析并创建;沙箱运行可能会重定向到沙箱 workspace 根目录。
- skills 会被加载(或复用快照)并注入到 env 和 prompt。
- bootstrap/context 文件会被解析并注入到 system prompt 报告中。
- 会获取 session write lock;在流式传输开始前,
SessionManager会被打开并准备好。任何后续的 transcript 重写、压缩或截断路径,在打开或修改 transcript 文件之前都必须获取同一把锁。
Prompt 组装 + system prompt
- system prompt 由 OpenClaw 的基础 prompt、skills prompt、bootstrap context 和每次运行的覆盖项构成。
- 会强制执行与模型相关的限制和压缩预留 token。
- 参见 System prompt 了解模型会看到什么。
Hook 点(你可以在这里拦截)
OpenClaw 有两套 hook 系统:- 内部 hooks(Gateway hooks):用于命令和生命周期事件的事件驱动脚本。
- 插件 hooks:agent/tool 生命周期和 gateway pipeline 内的扩展点。
内部 hooks(Gateway hooks)
agent:bootstrap:在构建 bootstrap 文件、system prompt 最终定稿之前运行。 可用于添加/移除 bootstrap 上下文文件。- 命令 hooks:
/new、/reset、/stop以及其他命令事件(见 Hooks 文档)。
插件 hooks(agent + gateway 生命周期)
这些 hook 在 agent loop 或 gateway pipeline 内部运行:before_model_resolve:在 session 前运行(没有messages),用于在模型解析前确定性地覆盖 provider/model。before_prompt_build:在 session 加载后运行(带有messages),用于在 prompt 提交前注入prependContext、systemPrompt、prependSystemContext或appendSystemContext。prependContext适合每轮动态文本,而 system-context 字段适合放置应位于 system prompt 空间中的稳定指导。before_agent_start:兼容旧版的 hook,可能在任一阶段运行;优先使用上面的显式 hooks。before_agent_reply:在内联动作之后、LLM 调用之前运行,允许插件接管本轮并返回一个合成回复,或完全让本轮静默。agent_end:在完成后检查最终消息列表和运行元数据。before_compaction/after_compaction:观察或标注 compaction 周期。before_tool_call/after_tool_call:拦截工具参数/结果。before_install:检查内置扫描结果,并可选择阻止 skill 或 plugin 安装。tool_result_persist:在工具结果写入 OpenClaw 所拥有的 session transcript 之前,进行同步转换。message_received/message_sending/message_sent:入站 + 出站消息 hooks。session_start/session_end:session 生命周期边界。gateway_start/gateway_stop:gateway 生命周期事件。
before_tool_call:{ block: true }是终止性的,并停止低优先级处理器。before_tool_call:{ block: false }是无操作,不会清除之前的 block。before_install:{ block: true }是终止性的,并停止低优先级处理器。before_install:{ block: false }是无操作,不会清除之前的 block。message_sending:{ cancel: true }是终止性的,并停止低优先级处理器。message_sending:{ cancel: false }是无操作,不会清除之前的 cancel。
流式传输 + 部分回复
- assistant 增量会从 pi-agent-core 流式传出,并作为
assistant事件发出。 - block 流式传输可以在
text_end或message_end时发出部分回复。 - reasoning 流式传输可以作为单独的 stream 发出,也可以作为 block 回复发出。
- 参见 Streaming 了解分块和 block reply 行为。
工具执行 + 消息工具
- 工具 start/update/end 事件会在
toolstream 上发出。 - 工具结果在记录/发出前会针对大小和图像载荷进行清理。
- 会跟踪 messaging tool 的发送,以抑制重复的 assistant 确认。
回复整形 + 抑制
- 最终 payload 会由以下内容组装:
- assistant 文本(以及可选的 reasoning)
- 内联工具摘要(在 verbose 且允许时)
- 当模型出错时的 assistant 错误文本
- 精确的静默 token
NO_REPLY/no_reply会从出站 payload 中过滤掉。 - messaging tool 的重复内容会从最终 payload 列表中移除。
- 如果没有可渲染的 payload,且工具发生错误,则会发出一个兜底的工具错误回复 (除非某个 messaging tool 已经向用户发送了可见回复)。
压缩 + 重试
- 自动压缩会发出
compactionstream 事件,并且可能触发重试。 - 重试时,会重置内存缓冲区和工具摘要,以避免重复输出。
- 参见 Compaction 了解 compaction 流水线。
事件流(当前)
lifecycle:由subscribeEmbeddedPiSession发出(并且由agentCommand作为兜底)assistant:来自 pi-agent-core 的流式增量tool:来自 pi-agent-core 的流式工具事件
Chat 通道处理
- assistant 增量会被缓冲为 chat
delta消息。 - chat
final会在 lifecycle end/error 时发出。
超时
agent.wait默认:30s(仅等待)。timeoutMs参数可覆盖。- Agent runtime:
agents.defaults.timeoutSeconds默认 172800s(48 小时);由runEmbeddedPiAgent的中止计时器强制执行。 - Cron runtime:隔离的 agent-turn
timeoutSeconds由 cron 负责。调度器在执行开始时启动该计时器,在配置的截止时间中止底层运行,然后在记录超时之前执行有界清理,以避免陈旧的子 session 将 lane 卡住。 - Session liveness diagnostics:在启用 diagnostics 时,
diagnostics.stuckSessionWarnMs会将长时间处于processing且未观察到回复、工具、状态、block 或 ACP 进度的 session 归类。正在运行的嵌入式执行、模型调用和工具调用会报告为session.long_running;没有近期进度的活跃工作会报告为session.stalled;session.stuck仅保留给没有活跃工作的陈旧 session 账本。陈旧 session 账本会立即释放受影响的 session lane;而 stalled 的嵌入式运行只有在更长的无进度窗口之后才会被 abort-drained(至少 10 分钟且为警告阈值的 5 倍),以便队列中的工作能够恢复,而不会仅仅因为运行较慢就被切断。对于保持不变的 session,重复的session.stuck诊断会进行退避。 - 模型空闲超时:当没有响应 chunk 在空闲窗口结束前到达时,OpenClaw 会中止模型请求。
models.providers.<id>.timeoutSeconds会为较慢的本地/自托管 provider 延长这一空闲看门狗;否则 OpenClaw 在配置时使用agents.defaults.timeoutSeconds,默认上限为 120s。对于没有显式模型或 agent 超时的 cron 触发运行,会禁用空闲看门狗,并依赖 cron 外层超时。 - Provider HTTP 请求超时:
models.providers.<id>.timeoutSeconds适用于该 provider 的模型 HTTP fetch,包括连接、响应头、响应体、SDK 请求超时、总的受保护 fetch 中止处理以及模型流空闲看门狗。在提高整个 agent runtime 超时之前,请将其用于像 Ollama 这样的慢速本地/自托管 provider。
何时会更早结束
- Agent 超时(abort)
- AbortSignal(cancel)
- Gateway 断开连接或 RPC 超时
agent.wait超时(仅等待,不停止 agent)
相关内容
- Tools — 可用的 agent 工具
- Hooks — 由 agent 生命周期事件触发的事件驱动脚本
- Compaction — 如何对长对话进行摘要
- Exec Approvals — shell 命令的审批门禁
- Thinking — thinking/reasoning 级别配置