Agent loop

agentic loop 是 agent 的完整“真实”运行：接收输入 → 组装上下文 → 模型推理 → 工具执行 → 流式回复 → 持久化。它是将消息转化为动作和最终回复的权威路径，同时保持 session 状态一致。在 OpenClaw 中，loop 是每个 session 一次单线程串行运行：当模型思考、调用工具并流式输出时，它会发出生命周期和流事件。本文说明这个真实 loop 是如何端到端连接起来的。

入口点

Gateway RPC：agent 和 agent.wait。
CLI：agent 命令。

工作原理（高层）

agent RPC 验证参数，解析 session（sessionKey/sessionId），持久化 session 元数据，并立即返回 { runId, acceptedAt }。
agentCommand 运行 agent：
- 解析模型 + thinking/verbose/trace 默认值
- 加载 skills 快照
- 调用 runEmbeddedPiAgent（pi-agent-core 运行时）
- 如果嵌入式 loop 没有发出 lifecycle end/error，则发出该事件
runEmbeddedPiAgent：
- 通过每 session + 全局队列串行化运行
- 解析模型 + 认证配置文件并构建 pi session
- 订阅 pi 事件并流式输出 assistant/tool 增量
- 强制超时 -> 超出则中止运行
- 对于 Codex app-server turns，如果已接受的 turn 在没有产生 app-server 进度且没有终止事件之前停止，则中止它
- 返回 payload 和 usage 元数据
subscribeEmbeddedPiSession 将 pi-agent-core 事件桥接到 OpenClaw agent 流：
- tool 事件 => stream: "tool"
- assistant 增量 => stream: "assistant"
- lifecycle 事件 => stream: "lifecycle"（phase: "start" | "end" | "error"）
agent.wait 使用 waitForAgentRun：
- 等待 runId 的 lifecycle end/error
- 返回 { status: ok|error|timeout, startedAt, endedAt, error? }

排队 + 并发

运行会按 session key（session lane）串行化，并且可选地通过全局 lane 串行化。
这可以防止工具/session 竞态，并保持 session 历史一致。
消息通道可以选择队列模式（collect/steer/followup），这些模式会接入此 lane 系统。参见 Command Queue。
Transcript 写入同样受 session 文件上的 session 写锁保护。该锁具有进程感知且基于文件，因此可以捕获绕过进程内队列或来自其他进程的写入者。Session transcript 写入者在报告 session 忙碌之前，会等待最多 session.writeLock.acquireTimeoutMs；默认值为 60000 ms。
Session 写锁默认是不可重入的。如果某个 helper 有意在保持单一逻辑写者的前提下嵌套获取同一把锁，则必须显式启用 allowReentrant: true。

Session + workspace 准备

workspace 会被解析并创建；沙箱运行可能会重定向到沙箱 workspace 根目录。
skills 会被加载（或复用快照）并注入到 env 和 prompt。
bootstrap/context 文件会被解析并注入到 system prompt 报告中。
会获取 session write lock；在流式传输开始前，SessionManager 会被打开并准备好。任何后续的 transcript 重写、压缩或截断路径，在打开或修改 transcript 文件之前都必须获取同一把锁。

Prompt 组装 + system prompt

system prompt 由 OpenClaw 的基础 prompt、skills prompt、bootstrap context 和每次运行的覆盖项构成。
会强制执行与模型相关的限制和压缩预留 token。
参见 System prompt 了解模型会看到什么。

Hook 点（你可以在这里拦截）

OpenClaw 有两套 hook 系统：

内部 hooks（Gateway hooks）：用于命令和生命周期事件的事件驱动脚本。
插件 hooks：agent/tool 生命周期和 gateway pipeline 内的扩展点。

内部 hooks（Gateway hooks）

agent:bootstrap：在构建 bootstrap 文件、system prompt 最终定稿之前运行。可用于添加/移除 bootstrap 上下文文件。
命令 hooks：/new、/reset、/stop 以及其他命令事件（见 Hooks 文档）。

参见 Hooks 了解配置与示例。

插件 hooks（agent + gateway 生命周期）

这些 hook 在 agent loop 或 gateway pipeline 内部运行：

before_model_resolve：在 session 前运行（没有 messages），用于在模型解析前确定性地覆盖 provider/model。
before_prompt_build：在 session 加载后运行（带有 messages），用于在 prompt 提交前注入 prependContext、systemPrompt、prependSystemContext 或 appendSystemContext。prependContext 适合每轮动态文本，而 system-context 字段适合放置应位于 system prompt 空间中的稳定指导。
before_agent_start：兼容旧版的 hook，可能在任一阶段运行；优先使用上面的显式 hooks。
before_agent_reply：在内联动作之后、LLM 调用之前运行，允许插件接管本轮并返回一个合成回复，或完全让本轮静默。
agent_end：在完成后检查最终消息列表和运行元数据。
before_compaction / after_compaction：观察或标注 compaction 周期。
before_tool_call / after_tool_call：拦截工具参数/结果。
before_install：检查内置扫描结果，并可选择阻止 skill 或 plugin 安装。
tool_result_persist：在工具结果写入 OpenClaw 所拥有的 session transcript 之前，进行同步转换。
message_received / message_sending / message_sent：入站 + 出站消息 hooks。
session_start / session_end：session 生命周期边界。
gateway_start / gateway_stop：gateway 生命周期事件。

出站/工具守卫的 hook 决策规则：

before_tool_call：{ block: true } 是终止性的，并停止低优先级处理器。
before_tool_call：{ block: false } 是无操作，不会清除之前的 block。
before_install：{ block: true } 是终止性的，并停止低优先级处理器。
before_install：{ block: false } 是无操作，不会清除之前的 block。
message_sending：{ cancel: true } 是终止性的，并停止低优先级处理器。
message_sending：{ cancel: false } 是无操作，不会清除之前的 cancel。

参见 Plugin hooks 了解 hook API 和注册细节。 Harness 可能会以不同方式适配这些 hooks。Codex app-server harness 将 OpenClaw plugin hooks 作为文档化镜像表面的兼容性契约，而 Codex native hooks 则保持为一套独立的更底层 Codex 机制。

流式传输 + 部分回复

assistant 增量会从 pi-agent-core 流式传出，并作为 assistant 事件发出。
block 流式传输可以在 text_end 或 message_end 时发出部分回复。
reasoning 流式传输可以作为单独的 stream 发出，也可以作为 block 回复发出。
参见 Streaming 了解分块和 block reply 行为。

工具执行 + 消息工具

工具 start/update/end 事件会在 tool stream 上发出。
工具结果在记录/发出前会针对大小和图像载荷进行清理。
会跟踪 messaging tool 的发送，以抑制重复的 assistant 确认。

回复整形 + 抑制

最终 payload 会由以下内容组装：
- assistant 文本（以及可选的 reasoning）
- 内联工具摘要（在 verbose 且允许时）
- 当模型出错时的 assistant 错误文本
精确的静默 token NO_REPLY / no_reply 会从出站 payload 中过滤掉。
messaging tool 的重复内容会从最终 payload 列表中移除。
如果没有可渲染的 payload，且工具发生错误，则会发出一个兜底的工具错误回复（除非某个 messaging tool 已经向用户发送了可见回复）。

压缩 + 重试

自动压缩会发出 compaction stream 事件，并且可能触发重试。
重试时，会重置内存缓冲区和工具摘要，以避免重复输出。
参见 Compaction 了解 compaction 流水线。

事件流（当前）

lifecycle：由 subscribeEmbeddedPiSession 发出（并且由 agentCommand 作为兜底）
assistant：来自 pi-agent-core 的流式增量
tool：来自 pi-agent-core 的流式工具事件

Chat 通道处理

assistant 增量会被缓冲为 chat delta 消息。
chat final 会在 lifecycle end/error 时发出。

超时

agent.wait 默认：30s（仅等待）。timeoutMs 参数可覆盖。
Agent runtime：agents.defaults.timeoutSeconds 默认 172800s（48 小时）；由 runEmbeddedPiAgent 的中止计时器强制执行。
Cron runtime：隔离的 agent-turn timeoutSeconds 由 cron 负责。调度器在执行开始时启动该计时器，在配置的截止时间中止底层运行，然后在记录超时之前执行有界清理，以避免陈旧的子 session 将 lane 卡住。
Session liveness diagnostics：在启用 diagnostics 时，diagnostics.stuckSessionWarnMs 会将长时间处于 processing 且未观察到回复、工具、状态、block 或 ACP 进度的 session 归类。正在运行的嵌入式执行、模型调用和工具调用会报告为 session.long_running；没有近期进度的活跃工作会报告为 session.stalled；session.stuck 仅保留给没有活跃工作的陈旧 session 账本。陈旧 session 账本会立即释放受影响的 session lane；而 stalled 的嵌入式运行只有在更长的无进度窗口之后才会被 abort-drained（至少 10 分钟且为警告阈值的 5 倍），以便队列中的工作能够恢复，而不会仅仅因为运行较慢就被切断。对于保持不变的 session，重复的 session.stuck 诊断会进行退避。
模型空闲超时：当没有响应 chunk 在空闲窗口结束前到达时，OpenClaw 会中止模型请求。models.providers.<id>.timeoutSeconds 会为较慢的本地/自托管 provider 延长这一空闲看门狗；否则 OpenClaw 在配置时使用 agents.defaults.timeoutSeconds，默认上限为 120s。对于没有显式模型或 agent 超时的 cron 触发运行，会禁用空闲看门狗，并依赖 cron 外层超时。
Provider HTTP 请求超时：models.providers.<id>.timeoutSeconds 适用于该 provider 的模型 HTTP fetch，包括连接、响应头、响应体、SDK 请求超时、总的受保护 fetch 中止处理以及模型流空闲看门狗。在提高整个 agent runtime 超时之前，请将其用于像 Ollama 这样的慢速本地/自托管 provider。

何时会更早结束

Agent 超时（abort）
AbortSignal（cancel）
Gateway 断开连接或 RPC 超时
agent.wait 超时（仅等待，不停止 agent）

基础

会话与记忆

多智能体

消息与投递

入口点

工作原理（高层）

排队 + 并发

Session + workspace 准备

Prompt 组装 + system prompt

Hook 点（你可以在这里拦截）

内部 hooks（Gateway hooks）

插件 hooks（agent + gateway 生命周期）

流式传输 + 部分回复

工具执行 + 消息工具

回复整形 + 抑制

压缩 + 重试

事件流（当前）

Chat 通道处理

超时

何时会更早结束

相关内容

基础

会话与记忆

多智能体

消息与投递

Documentation Index

​入口点

​工作原理（高层）

​排队 + 并发

​Session + workspace 准备

​Prompt 组装 + system prompt

​Hook 点（你可以在这里拦截）

​内部 hooks（Gateway hooks）

​插件 hooks（agent + gateway 生命周期）

​流式传输 + 部分回复

​工具执行 + 消息工具

​回复整形 + 抑制

​压缩 + 重试

​事件流（当前）

​Chat 通道处理

​超时

​何时会更早结束

​相关内容

入口点

工作原理（高层）

排队 + 并发

Session + workspace 准备

Prompt 组装 + system prompt

Hook 点（你可以在这里拦截）

内部 hooks（Gateway hooks）

插件 hooks（agent + gateway 生命周期）

流式传输 + 部分回复

工具执行 + 消息工具

回复整形 + 抑制

压缩 + 重试

事件流（当前）

Chat 通道处理

超时

何时会更早结束

相关内容